英特爾緊隨英偉達步伐,擬推中國特供版AI芯片,高端AI芯片受限為中國企業(yè)帶來新機遇?
據(jù)報道,在美國限制措施的壓力下,英特爾計劃效仿英偉達,為中國市場打造“特別版”的AI加速芯片—Gaudi 3。這兩款相關產(chǎn)品據(jù)傳將于6月底和9月底發(fā)布。
本文引用地址:http://butianyuan.cn/article/202404/457722.htm英特爾最近發(fā)布了新一代AI加速芯片Gaudi 3。英特爾表示正在準備為中國市場推出特制版的Gaudi 3。這包括兩種硬件版本:HL-328 OAM兼容的夾層卡和HL-388 PCIe加速器卡。HL-328定于6月24日發(fā)布,而HL-388則定于9月24日發(fā)布。
在規(guī)格方面,中國特制版與原版共享相同的特性,包括96MB片上SRAM內(nèi)存、128GB HBM2e高帶寬內(nèi)存(帶寬為每秒3.7TB)、PCIe 5.0X16接口和解碼標準。
不過,由于美國對AI芯片的出口限制,高性能AI的綜合計算性能(TPP)必須低于4800才能出口到中國。這意味著中國特制版的16位性能不能超過150 TFLOPS。
相比之下,原版Gaudi 3在FP16/BF16下可實現(xiàn)1835 TFLOPS。這與英偉達的H100相比,在大模型訓練方面大約慢40%,在推理任務方面效率低50%。
因此,為中國市場打造的特制版將需要大幅減少內(nèi)核數(shù)量(原版擁有8個矩陣乘法引擎(MME)和64個張量處理器核心(TPC)引擎)和工作頻率。最終,這可能導致其AI性能降低約92%,以符合美國的出口管制要求。英特爾為中國市場推出的特制版AI性能將與英偉達為中國市場定制的H20 AI加速器卡相當。
英特爾Gaudi 3的中國特制版在FP16/BF16下性能達到148 TFLOPS,略低于150 TFLOPS的限制。然而,在高帶寬內(nèi)存(HBM)容量和帶寬方面,中國特制版Gaudi 3將低于英偉達的H20,這可能使其在競爭中處于劣勢。當然,價格也將是決定其是否具有競爭優(yōu)勢的關鍵因素。
據(jù)報道,該芯片的價格被認為與其競爭對手華為的產(chǎn)品相當。英偉達H20的訂購價格在每片12000至15000美元之間。
短期內(nèi)中國企業(yè)仍將繼續(xù)購買現(xiàn)有的AI芯片。除了現(xiàn)有的A800或H800庫存,英偉達設計的專門針對中國市場的GPU AI加速器芯片—包括H20、L20和L2仍然是首要選擇。長期來看,預計中國CSP將加速發(fā)展,其中阿里巴巴的T-Head和百度在這一領域尤其活躍,依賴臺積電和三星等代工廠進行生產(chǎn)。同時,華為、百瑞恩等中國主要AI企業(yè)將繼續(xù)開發(fā)通用AI芯片,為本地企業(yè)提供AI解決方案。除了開發(fā)AI芯片外,這些公司還在中國建立國內(nèi)AI服務器生態(tài)系統(tǒng)。TrendForce認為成功的關鍵因素之一將是中國政府通過本地化項目(如涉及中國電信運營商的項目)對國產(chǎn)AI芯片的采用給予支持。
最后,在高端AI芯片開發(fā)受限背景下,TrendForce認為中國可在中低端邊緣AI服務器市場找到機遇。這些服務器對AI計算能力的需求較低,適用于商業(yè)聊天機器人、視頻流、互聯(lián)網(wǎng)平臺和汽車輔助系統(tǒng)等應用。它們可能不完全受美國限制的影響,因此成為中國企業(yè)在AI市場的一個潛在增長方向。
評論