新聞中心

EEPW首頁(yè) > 智能計(jì)算 > 設(shè)計(jì)應(yīng)用 > 以AI芯片架構(gòu)創(chuàng)新,迎接算力增長(zhǎng)新拐點(diǎn)

以AI芯片架構(gòu)創(chuàng)新,迎接算力增長(zhǎng)新拐點(diǎn)

—— 億鑄科技CEO熊大鵬
作者: 時(shí)間:2024-10-24 來(lái)源:EEPW 收藏

在灣芯展SEMiBAY2024《HBM與存儲(chǔ)器技術(shù)與應(yīng)用論壇》上,科技創(chuàng)始人、董事長(zhǎng)兼CEO熊大鵬發(fā)表了題為《超越極限:大算力芯片面臨的技術(shù)挑戰(zhàn)和解決策略》的演講。

本文引用地址:http://butianyuan.cn/article/202410/463959.htm

熊大鵬博士提出,在AI技術(shù)的推動(dòng)下,算力迎來(lái)需求拐點(diǎn),硬件架構(gòu)將成為滿足算力需求的關(guān)鍵路徑之一,未來(lái)算力增長(zhǎng)將以存儲(chǔ)單元為中心。

1729737991849239.png

時(shí)代的機(jī)遇與挑戰(zhàn)

在AI時(shí)代,隨著數(shù)據(jù)、算力、參數(shù)量的不斷提升,模型能力顯著增強(qiáng)。熊大鵬博士指出,大模型已經(jīng)從量變逐漸演變?yōu)橘|(zhì)變,當(dāng)模型體量足夠大時(shí),會(huì)出現(xiàn)類似人類“開悟”的涌現(xiàn)能力,大模型的推理能力將顯著提升。這一變化預(yù)示著AI應(yīng)用的最后一公里即將打通,業(yè)務(wù)落地將推動(dòng)對(duì)AI計(jì)算能力的需求迎來(lái)拐點(diǎn)。

Omdia最新報(bào)告《云計(jì)算和數(shù)據(jù)中心人工智能處理器預(yù)測(cè)》顯示,用于云計(jì)算和數(shù)據(jù)中心人工智能的GPU和其他加速芯片的市場(chǎng)規(guī)模已從2022年的不到100億美元增長(zhǎng)到2024年的780億美元,并預(yù)計(jì)到2029年將達(dá)到1510億美元。然而,2026年市場(chǎng)可能會(huì)出現(xiàn)一個(gè)明顯的拐點(diǎn),增長(zhǎng)動(dòng)力將從技術(shù)采用轉(zhuǎn)向人工智能應(yīng)用需求的變化。

此外,IDC預(yù)測(cè),未來(lái)的人工智能服務(wù)器將注重提高計(jì)算能力和處理效率(能效比),以適應(yīng)更復(fù)雜、更大規(guī)模的人工智能應(yīng)用。預(yù)計(jì)到2027年,用于推理的AI算力占比將達(dá)到72.6%,未來(lái)有望達(dá)到95%為推理,5%為訓(xùn)練。

應(yīng)用落地需要硬件架構(gòu)突破

然而,現(xiàn)有的芯片硬件性能提升速度已難以滿足算法模型急劇增長(zhǎng)的算力需求。摩爾定律,這個(gè)曾經(jīng)指導(dǎo)半導(dǎo)體行業(yè)發(fā)展的黃金法則,如今正面臨前所未有的挑戰(zhàn)。國(guó)信證券經(jīng)濟(jì)研究所報(bào)告指出,大模型參數(shù)規(guī)模每18個(gè)月增長(zhǎng)35倍,而摩爾定律下的芯片僅增長(zhǎng)2倍。因此,探索和發(fā)展新的硬件架構(gòu)成為算力突破的關(guān)鍵路徑之一。

熊大鵬博士強(qiáng)調(diào),在現(xiàn)有的硬件架構(gòu)下,目前AI芯片面臨著“三堵墻”問(wèn)題:存儲(chǔ)墻、能耗墻和編譯墻。存儲(chǔ)墻是指存儲(chǔ)器的數(shù)據(jù)訪問(wèn)速度跟不上計(jì)算單元的數(shù)據(jù)處理速度,導(dǎo)致性能瓶頸的問(wèn)題。

同時(shí),由于存儲(chǔ)墻的存在則帶來(lái)了能耗墻和編譯墻的問(wèn)題。能耗墻是指隨著芯片性能的提升,能耗和散熱問(wèn)題成為限制進(jìn)一步性能提升的主要因素。編譯墻則是隨著AI模型的復(fù)雜性增加,編譯器需要處理的數(shù)據(jù)量和計(jì)算任務(wù)也急劇增加,這使得靜態(tài)編譯優(yōu)化變得非常困難,手動(dòng)優(yōu)化又消耗了大量時(shí)間和成本。

1729738027974805.png

存算一體開啟算力第二增長(zhǎng)曲線

面對(duì)這一挑戰(zhàn),科技選擇創(chuàng)新,用“存算一體超異構(gòu)”架構(gòu)這一全新的芯片設(shè)計(jì)思路,極大地減少了數(shù)據(jù)搬運(yùn)的延遲,提升了整體的計(jì)算效率和能效比。

熊大鵬博士指出,想要打破AI芯片“三堵墻”,就需要從算力的第一性原理(阿姆達(dá)爾定律)來(lái)著手,將數(shù)據(jù)搬運(yùn)量大幅下降,使得F值接近于0,才能保證有效算力密度線性增長(zhǎng)。目前業(yè)內(nèi)主要存在兩種解決方式:一種是存內(nèi)計(jì)算,另一種是近存計(jì)算。

存內(nèi)計(jì)算是通過(guò)將存儲(chǔ)和計(jì)算功能融合,減少數(shù)據(jù)搬運(yùn)延遲,提升性能和能效。在理想狀態(tài)下,F(xiàn)=0,能夠?qū)崿F(xiàn)存儲(chǔ)與計(jì)算無(wú)縫融合。近存計(jì)算則是將存儲(chǔ)單元和計(jì)算單元通過(guò)先進(jìn)封裝集成在一起,增加訪存帶寬、減少數(shù)據(jù)搬移時(shí)延,以提升整體計(jì)算效率。

熊大鵬博士強(qiáng)調(diào),通過(guò)存算一體架構(gòu)等技術(shù),可以突破傳統(tǒng)計(jì)算模式的瓶頸,實(shí)現(xiàn)更高的有效算力,打破有效算力的天花板。未來(lái),以算力單元為中心的時(shí)代即將結(jié)束,算力第二增長(zhǎng)曲線將以存儲(chǔ)單元為中心。

結(jié)語(yǔ)

熊大鵬博士表示,科技自成立以來(lái),始終致力于通過(guò)存算一體,提供貢獻(xiàn)更具性價(jià)比、更高能效比、更大算力發(fā)展空間的AI大算力芯片發(fā)展新路徑。2023年3月,面對(duì)ChatGPT等大模型帶來(lái)的AI算力挑戰(zhàn),億鑄科技首次提出“存算一體超異構(gòu)”,為大模型時(shí)代AI大算力芯片發(fā)展提供全新思路。

未來(lái),隨著AI技術(shù)的不斷進(jìn)步,算力的需求也在不斷增長(zhǎng)。億鑄科技將通過(guò)創(chuàng)新的存算一體架構(gòu),為AI芯片的發(fā)展提供新的方向。在大模型時(shí)代,億鑄科技的技術(shù)和產(chǎn)品將為AI技術(shù)的發(fā)展提供強(qiáng)大的支持,推動(dòng)整個(gè)行業(yè)向前發(fā)展。隨著億鑄科技技術(shù)的不斷成熟和應(yīng)用的不斷擴(kuò)展,我們有理由期待,AI芯片技術(shù)將迎來(lái)一個(gè)新的發(fā)展階段,為科技進(jìn)步做出更大的貢獻(xiàn)!



評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉