新聞中心

EEPW首頁 > 智能計算 > 市場分析 > 刷屏的清華AI光芯片,突破了什么?

刷屏的清華AI光芯片,突破了什么?

作者: 時間:2024-04-28 來源:半導體產業(yè)縱橫 收藏

最近,清華大學傳出了好消息。首創(chuàng) AI 光芯片架構,研制全新 AI「光芯片」——太極(Taichi),可以實現(xiàn) 160 TOPS/W 通用智能計算,能效是 H100 的 1000 倍。

本文引用地址:http://www.butianyuan.cn/article/202404/458166.htm

訓練下一代萬億級參數(shù)大模型的高效芯片誕生了。目前,相關研究論文以「Large-scale photonic chiplet Taichi empowers 160-TOPS/W artificial general intelligence」為題,已發(fā)表在權威科學期刊 Science 上。

論文地址:https://www.science.org/doi/10.1126/science.adl1203

成果是什么?

當前,越來越多跡象表明,LLM 不會是通往 AGI 的最終路徑。

計算機早已經成為世界能耗巨頭,隨著越來越多耗電量大的人工智能投入使用,計算機的能源需求也飛速上漲。

以英偉達 H100 為例,其峰值功耗為 700 瓦,按照 61% 的年利用率計算,相當于一個美國家庭的平均功耗(假設每個家庭 2.51 人)。有專家預測,在大量部署 H100 后,總功耗將于一座美國大城市不相上下,甚至超過一些歐洲小國。

若是能夠發(fā)明一種,節(jié)省大量能耗的芯片,LLM 的性能或在未來實現(xiàn)更大的提升。

而太極,可能會讓通用人工智能(AGI)成為現(xiàn)實。

根據(jù)清華大學官網介紹,清華團隊設計了基于集成衍射干涉異構設計和通用分布式計算架構的大規(guī)模光芯片——太極,該架構具有上千萬個神經元的能力,實現(xiàn) 160 萬億次/秒·瓦(TOPS/W)的通用智能計算。

此外,在太極光芯片在實驗中實現(xiàn)了芯片上 1000 個類別級別的分類(在 1623 類別的 Omniglot 數(shù)據(jù)集上準確率為 91.89%)和高保真的人工智能生成的內容,效率提高了兩個數(shù)量級。

研究人員表示,「太極」為大規(guī)模的光子計算和高級任務鋪平了道路,進一步發(fā)掘了光子學在現(xiàn)代 AGI 中的靈活性和潛力。

Science 對這個研究有高度評論:「來自清華的團隊探索了分布式衍射干涉混合光計算架構,有效地將光神經網絡(ONN)的規(guī)模提高到百萬神經元級別。通過實驗實現(xiàn)了一個芯片上 1396 萬個神經元的 ONN,用于復雜的、千類級的分類和人工智能生成的內容任務。這項工作是向現(xiàn)實世界的光計算邁出的有希望的一步,支持人工智能中的各種應用?!?/span>

什么東西,有什么用?

電子芯片的瓶頸

當電子通過晶體管和其他傳統(tǒng)集成電路元件時,會遇到阻力并產生熱量。隨著設計者不斷將各種元件添加到芯片上,芯片產生的熱量自然會升高。電子這一特性甚至成為了微型芯片性能提升的障礙,同時也是計算機能耗如此之高的主要原因。

以電子為載體的技術發(fā)展已趨近物理極限,芯片尺寸降到極致時出現(xiàn)的「功耗墻」難題,訪存瓶頸下大量信息存儲不過來、計算不過來,以及電子芯片性能提升的同時性價比降低。

在電路上,用光子替代電子的設想由來已久。

20 世紀六七十年代,研究者就已經開始開發(fā)光子芯片了。那時候,部分專家預計光子芯片會像傳統(tǒng)集成芯片一樣迅速微型化。

電路能耗降低,還是歸功于光的性質。光子芯片不存在電阻問題。因為由鐳射產生的光子能快速通過波導、調制器、反射器等原件陣列。因此,光子芯片產生熱量更少,能耗也更低。

光為載體的計算芯片

光計算,顧名思義是將計算載體從電變?yōu)楣?,利用光在芯片中的傳播進行計算。

人工智能時代是由算力支撐起來的,從能耗的角度來看,硅光技術能夠有效提升 GPU 的整體性能、大幅降低其功耗,有效解決目前的算力瓶頸。也就是說,下一代算力很可能會是光子計算甚至量子計算。

問題在于,當前的集成光子計算,特別是光學神經網絡(ONN),通常包含數(shù)百到數(shù)千個參數(shù),其中數(shù)十個是可調參數(shù),僅支持基本任務,如簡單的模式識別和元音識別。能夠進行一些簡單任務和淺層模型,無法支撐亟需高算力與高能效的復雜大模型智能計算。

光計算對于集成度的要求會更高,但其技術難點其實并不只在集成,在計算單元循環(huán)使用和非線性處理方面挑戰(zhàn)更大。

據(jù)了解,一個巨大的 AI 模型中,每一層網絡都需要進行矩陣運算,一個大矩陣還可能需要拆成幾個小矩陣進行計算。也就是說,在大模型中,矩陣乘加運算是一個反復、循環(huán)的計算過程,每次循環(huán),矩陣上的元素權重都會被更新。

與電子相比,光的矩陣乘加運算非???,但一涉及到權重的更新,光的速度就會變慢。

要實現(xiàn)大規(guī)模、高能效的光子計算,簡單地擴大現(xiàn)有的光子神經網絡芯片是不現(xiàn)實的,因為隨著神經網絡層數(shù)的增加,不可避免的模擬噪聲會呈指數(shù)級擴大。放大現(xiàn)有架構的規(guī)模并不能成比例地提高性能。

新架構:分布式衍射-干涉混合光子計算架構

清華團隊進行了架構方面的研究,「從 0 到 1」重新設計適合光計算的新架構。

根據(jù)論文介紹,清華團隊為采用分布式計算的太極,構建了一個深度較淺但寬度較廣的網絡結構。

與為深度計算堆疊一系列層的傳統(tǒng)方法不同,Taichi 將計算資源分布到多個獨立的集群中,為子任務分別組織集群,并最終合成這些子任務,從而完成復雜的高級任務。

具體地說,光學衍射層的完全連通特性,可以提供比傳統(tǒng) DNN 中的卷積層更大的變形能力。

這意味著光學網絡有可能用比電子系統(tǒng)更少的層數(shù)實現(xiàn)相同的變換。

圖中(B)中展示了「太極」芯片,包括用于大規(guī)模輸入和輸出數(shù)據(jù)的雙衍射單元,以及用于可重構特征嵌入和硬件多路復用的 MZI 陣列的可調矩陣乘法。

論文第一作者、電子系博士生徐智昊介紹:「在「太極」架構中,自頂向下的編碼拆分-解碼重構機制,將復雜智能任務化繁為簡,拆分為多通道高并行的子任務,構建的分布式『大感受野』淺層光網絡對子任務分而治之,突破物理模擬器件多層深度級聯(lián)的固有計算誤差?!?/span>

AI 光芯片:干涉-衍射融合計算芯片

在這項工作中,團隊設計了一種具有靈活分布式計算架構的大規(guī)模衍射-干涉混合型光子 AI 芯片——「太極」。

據(jù)論文報道:「太極」光芯片具備 879 T MACS/mm2的面積效率與 160 TOPS/W 的能量效率,實現(xiàn)了高達兩個數(shù)量級的能效提升。首次賦能光計算實現(xiàn)自然場景千類對象識別、跨模態(tài)內容生成等人工智能復雜任務。

國內光芯片企業(yè)情況如何?

在面向「后摩爾時代」的潛在顛覆性技術里,光子芯片已進入人們的視野。其所具有的高速度、低能耗、工藝技術相對成熟等優(yōu)勢,能夠有效突破傳統(tǒng)集成電路物理極限上的瓶頸,滿足新一輪科技革命中人工智能、物聯(lián)網、云計算等產業(yè)對信息獲取、傳輸、計算、存儲、顯示的技術需求。

目前,全球光子芯片產業(yè)剛剛起步,作為獨立于電子集成技術的新集成技術,其技術壁壘還沒有形成。我國光子產業(yè)發(fā)展水平與世界處于并跑階段,在光子基礎理論研究和技術發(fā)展方面具有一定的優(yōu)勢。

目前中國本土的高功率激光芯片、部分高速率激光芯片(10G、25G 等)等已處于國產化加速突破階段,而光探測芯片、25G 以上高速率激光芯片剛剛起步。

值得注意的是,光芯片方面華為也有所布局。

今年 3 月,華為公布了一項「光芯片及其制備方法、通信設備」發(fā)明專利。申請公布號為:CN117616316A,該專利申請日期為 2021 年 9 月 18 日。摘要顯示,本申請的實施例提供一種光芯片及其制備方法、通信設備,涉及光通信技術領域,解決現(xiàn)有的光芯片中光波導在制備過程中尖端易斷裂的問題。

光芯片企業(yè)利潤下降

國內光芯片廠商有源杰科技、長光華芯和炬光科技等。在 2023 年度業(yè)績快報中,這三家企業(yè)均提到宏觀環(huán)境、行業(yè)發(fā)展的影響,導致產品需求減少和價格降低。

源杰科技是國內領先的光芯片 IDM 廠商,產品涵蓋從 2.5G 到 50G 磷化銦激光器芯片。從源杰科技 2023 年的業(yè)績來看,營業(yè)收入共計約 1.44 億元,與去年同期相比下降 48.96%,全年歸屬凈利潤盈利 0.195 億元,同比減少 80.58%。

長光華芯發(fā)布的業(yè)績報告來看,也同樣處于虧損狀態(tài)。營業(yè)收入約 2.92 億元,同比減少 24.2%;歸屬于上市公司股東的凈利潤虧損 8610.17 萬元。2023 年 1 至 6 月份,長光華芯的營業(yè)收入構成為:高功率單管系列占比 90.16%,高功率巴條系列占比 8.24%,其他業(yè)務占比 0.9%,VCSEL 芯片系列占比 0.7%。

炬光科技業(yè)務覆蓋上游「產生光子」「調控光子」及中游汽車、泛半導體、醫(yī)療健康領域,與多家業(yè)內知名公司達成合作。炬光科技發(fā)布 2023 年度業(yè)績快報,營業(yè)收入約 5.61 億元,同比增加 1.69%;歸屬于上市公司股東的凈利潤 8968 萬元,同比減少 29.44%

源杰科技表示「電信市場及數(shù)據(jù)中心銷售不及預期」;長光華芯稱「受宏觀經濟環(huán)境等因素的影響,市場信心不足,激光器市場需求持續(xù)疲軟,同時行業(yè)競爭加劇」,炬光科技稱「公司部分上游元器件產品價格降低,綜合毛利率下降」。



關鍵詞: AI光芯片

評論


技術專區(qū)

關閉