新聞中心

EEPW首頁 > 業(yè)界動(dòng)態(tài) > 以AI芯片架構(gòu)創(chuàng)新,迎接算力增長新拐點(diǎn)

以AI芯片架構(gòu)創(chuàng)新,迎接算力增長新拐點(diǎn)

—— 億鑄科技CEO熊大鵬
作者: 時(shí)間:2024-10-24 來源:EEPW 收藏

在灣芯展SEMiBAY2024《HBM與存儲(chǔ)器技術(shù)與應(yīng)用論壇》上,億鑄科技創(chuàng)始人、董事長兼CEO熊大鵬發(fā)表了題為《超越極限:大算力芯片面臨的技術(shù)挑戰(zhàn)和解決策略》的演講。

本文引用地址:http://butianyuan.cn/article/202410/463959.htm

熊大鵬博士提出,在AI大模型技術(shù)的推動(dòng)下,算力迎來需求拐點(diǎn),硬件架構(gòu)將成為滿足算力需求的關(guān)鍵路徑之一,未來算力增長將以存儲(chǔ)單元為中心。

1729737991849239.png

大模型時(shí)代的機(jī)遇與挑戰(zhàn)

在AI大模型時(shí)代,隨著數(shù)據(jù)、算力、參數(shù)量的不斷提升,模型能力顯著增強(qiáng)。熊大鵬博士指出,大模型已經(jīng)從量變逐漸演變?yōu)橘|(zhì)變,當(dāng)模型體量足夠大時(shí),會(huì)出現(xiàn)類似人類“開悟”的涌現(xiàn)能力,大模型的推理能力將顯著提升。這一變化預(yù)示著AI應(yīng)用的最后一公里即將打通,業(yè)務(wù)落地將推動(dòng)對(duì)AI計(jì)算能力的需求迎來拐點(diǎn)。

Omdia最新報(bào)告《云計(jì)算和數(shù)據(jù)中心人工智能處理器預(yù)測》顯示,用于云計(jì)算和數(shù)據(jù)中心人工智能的GPU和其他加速芯片的市場規(guī)模已從2022年的不到100億美元增長到2024年的780億美元,并預(yù)計(jì)到2029年將達(dá)到1510億美元。然而,2026年市場可能會(huì)出現(xiàn)一個(gè)明顯的拐點(diǎn),增長動(dòng)力將從技術(shù)采用轉(zhuǎn)向人工智能應(yīng)用需求的變化。

此外,IDC預(yù)測,未來的人工智能服務(wù)器將注重提高計(jì)算能力和處理效率(能效比),以適應(yīng)更復(fù)雜、更大規(guī)模的人工智能應(yīng)用。預(yù)計(jì)到2027年,用于推理的AI算力占比將達(dá)到72.6%,未來有望達(dá)到95%為推理,5%為訓(xùn)練。

應(yīng)用落地需要硬件架構(gòu)突破

然而,現(xiàn)有的芯片硬件性能提升速度已難以滿足算法模型急劇增長的算力需求。摩爾定律,這個(gè)曾經(jīng)指導(dǎo)半導(dǎo)體行業(yè)發(fā)展的黃金法則,如今正面臨前所未有的挑戰(zhàn)。國信證券經(jīng)濟(jì)研究所報(bào)告指出,大模型參數(shù)規(guī)模每18個(gè)月增長35倍,而摩爾定律下的芯片僅增長2倍。因此,探索和發(fā)展新的硬件架構(gòu)成為算力突破的關(guān)鍵路徑之一。

熊大鵬博士強(qiáng)調(diào),在現(xiàn)有的硬件架構(gòu)下,目前AI芯片面臨著“三堵墻”問題:存儲(chǔ)墻、能耗墻和編譯墻。存儲(chǔ)墻是指存儲(chǔ)器的數(shù)據(jù)訪問速度跟不上計(jì)算單元的數(shù)據(jù)處理速度,導(dǎo)致性能瓶頸的問題。

同時(shí),由于存儲(chǔ)墻的存在則帶來了能耗墻和編譯墻的問題。能耗墻是指隨著芯片性能的提升,能耗和散熱問題成為限制進(jìn)一步性能提升的主要因素。編譯墻則是隨著AI模型的復(fù)雜性增加,編譯器需要處理的數(shù)據(jù)量和計(jì)算任務(wù)也急劇增加,這使得靜態(tài)編譯優(yōu)化變得非常困難,手動(dòng)優(yōu)化又消耗了大量時(shí)間和成本。

1729738027974805.png

存算一體開啟算力第二增長曲線

面對(duì)這一挑戰(zhàn),億鑄科技選擇創(chuàng)新,用“存算一體超異構(gòu)”架構(gòu)這一全新的芯片設(shè)計(jì)思路,極大地減少了數(shù)據(jù)搬運(yùn)的延遲,提升了整體的計(jì)算效率和能效比。

熊大鵬博士指出,想要打破AI芯片“三堵墻”,就需要從算力的第一性原理(阿姆達(dá)爾定律)來著手,將數(shù)據(jù)搬運(yùn)量大幅下降,使得F值接近于0,才能保證有效算力密度線性增長。目前業(yè)內(nèi)主要存在兩種解決方式:一種是存內(nèi)計(jì)算,另一種是近存計(jì)算。

存內(nèi)計(jì)算是通過將存儲(chǔ)和計(jì)算功能融合,減少數(shù)據(jù)搬運(yùn)延遲,提升性能和能效。在理想狀態(tài)下,F(xiàn)=0,能夠?qū)崿F(xiàn)存儲(chǔ)與計(jì)算無縫融合。近存計(jì)算則是將存儲(chǔ)單元和計(jì)算單元通過先進(jìn)封裝集成在一起,增加訪存帶寬、減少數(shù)據(jù)搬移時(shí)延,以提升整體計(jì)算效率。

熊大鵬博士強(qiáng)調(diào),通過存算一體架構(gòu)等技術(shù),可以突破傳統(tǒng)計(jì)算模式的瓶頸,實(shí)現(xiàn)更高的有效算力,打破有效算力的天花板。未來,以算力單元為中心的時(shí)代即將結(jié)束,算力第二增長曲線將以存儲(chǔ)單元為中心。

結(jié)語

熊大鵬博士表示,億鑄科技自成立以來,始終致力于通過存算一體,提供貢獻(xiàn)更具性價(jià)比、更高能效比、更大算力發(fā)展空間的AI大算力芯片發(fā)展新路徑。2023年3月,面對(duì)ChatGPT等大模型帶來的AI算力挑戰(zhàn),億鑄科技首次提出“存算一體超異構(gòu)”,為大模型時(shí)代AI大算力芯片發(fā)展提供全新思路。

未來,隨著AI技術(shù)的不斷進(jìn)步,算力的需求也在不斷增長。億鑄科技將通過創(chuàng)新的存算一體架構(gòu),為AI芯片的發(fā)展提供新的方向。在大模型時(shí)代,億鑄科技的技術(shù)和產(chǎn)品將為AI技術(shù)的發(fā)展提供強(qiáng)大的支持,推動(dòng)整個(gè)行業(yè)向前發(fā)展。隨著億鑄科技技術(shù)的不斷成熟和應(yīng)用的不斷擴(kuò)展,我們有理由期待,AI芯片技術(shù)將迎來一個(gè)新的發(fā)展階段,為科技進(jìn)步做出更大的貢獻(xiàn)!



關(guān)鍵詞:

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉