新聞中心

EEPW首頁 > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > 英特爾披露5nm“中國(guó)特供版”AI 芯片,性能或暴降92%,最快6月推出

英特爾披露5nm“中國(guó)特供版”AI 芯片,性能或暴降92%,最快6月推出

作者:鈦媒體 時(shí)間:2024-04-15 來源: 收藏

關(guān)于Gaudi 3的“中國(guó)特供版” 芯片有了新進(jìn)展。

本文引用地址:http://www.butianyuan.cn/article/202404/457599.htm

4月15日消息,芯片巨頭(Intel)日前在官網(wǎng)發(fā)布一份24頁的“Gaudi 3 加速器白皮書”中披露,將推出Gaudi 3在中國(guó)發(fā)售的兩款“特供版” 芯片產(chǎn)品。


無標(biāo)題.jpg

英特爾Gaudi 3 AI芯片(圖片來源:Intel官網(wǎng))


具體包括兩種硬件形態(tài)加速卡:一款型號(hào)為HL-328的OAM兼容夾層卡(Mezzanine Card),預(yù)計(jì)將于今年6月24日推出;另一款是型號(hào)為HL-388的PCle加速卡,預(yù)計(jì)將于今年9月24日推出。而基于內(nèi)核數(shù)量、工作頻率、TDP等參數(shù)估算,相比Gaudi 3國(guó)際版,“中國(guó)特供版”HL-328芯片性能或降低約92%左右。

無標(biāo)題.jpg


早前4月9日舉行的美國(guó)Intel Vision 2024會(huì)議上,英特爾發(fā)布新一代Gaudi 3 AI 加速芯片,采用臺(tái)積電工藝,帶來4倍(400%)的BF16 AI計(jì)算能力提升。同時(shí),相比英偉達(dá)H100 GPU,英特爾Gaudi 3 AI芯片的模型訓(xùn)練速度提升40%,推理速度提升50%,平均性能提高 50%,能效平均提高40%,但成本卻僅為H100的一小部分。

對(duì)于Gaudi 3中國(guó)特供版消息,鈦媒體App已向英特爾美國(guó)總部發(fā)送郵件詢問更多詳細(xì)信息,但截至發(fā)稿前,英特爾方面并未回復(fù)。

據(jù)悉,過去一段時(shí)間,美國(guó)政府不斷升級(jí)對(duì)華半導(dǎo)體、AI 芯片等領(lǐng)域的出口管制。

2022年8月9日,美國(guó)總統(tǒng)拜登簽署總額高達(dá)2800億美元的《芯片和科學(xué)法案》(以下簡(jiǎn)稱“芯片法案”),通過527億美元的巨額產(chǎn)業(yè)補(bǔ)貼和遏制競(jìng)爭(zhēng)的條款,推動(dòng)芯片制造“回流”美國(guó)本土。該法案禁止獲得補(bǔ)貼的美國(guó)及其盟友伙伴的企業(yè)10年內(nèi)在中國(guó)和其他關(guān)切的國(guó)家新建或擴(kuò)大先進(jìn)制程芯片廠。

2022年10月7日、2023年10月17日,美國(guó)商務(wù)部工業(yè)和安全局(BIS)連續(xù)兩次發(fā)布對(duì)中國(guó)的先進(jìn)半導(dǎo)體和計(jì)算設(shè)備的出口管制,旨在阻止中國(guó)進(jìn)口 AI 半導(dǎo)體產(chǎn)品。同時(shí),英偉達(dá)、AMD、英特爾的多款GPU和 AI 芯片產(chǎn)品已不能再出口到中國(guó),就連高端游戲顯卡RTX 4090都受到了限制。

2023年12月,美國(guó)商務(wù)部BIS宣布啟動(dòng)對(duì)成熟制程節(jié)點(diǎn)的半導(dǎo)體供應(yīng)鏈展開調(diào)查,劍指中國(guó)芯片半導(dǎo)體產(chǎn)業(yè)。

2024年3月29日,BIS更新出口限制措施,其中包括美國(guó)對(duì)中國(guó)出口的 AI 半導(dǎo)體產(chǎn)品將采取“逐案審查”(case-by-case review)政策規(guī)則,包括技術(shù)級(jí)別、客戶身份、合規(guī)計(jì)劃等信息全面查驗(yàn),以及部分 AI PC 芯片或納入到出口管制措施當(dāng)中,更大范圍限制英偉達(dá)、AMD等先進(jìn) AI 芯片和半導(dǎo)體設(shè)備向中國(guó)銷售,4月4日全面生效。

4月11日,美國(guó)商務(wù)部在“聯(lián)合公報(bào)”(Federal Register)上更新了最新的實(shí)體清單(Entity List),將6家中國(guó)企業(yè)列入“實(shí)體清單”,其中包括英偉達(dá)在中國(guó)的最大 AI 芯片經(jīng)銷商思騰合力(天津)科技有限公司(SITONHOLY (Tianjin) Co., Ltd.)。

事實(shí)上,在美國(guó)BIS第一輪出口管制下,早在2023年7月,英特爾就曾發(fā)布基于7nm制程的“中國(guó)特供版”AI芯片Gaudi2。相比國(guó)際版Gaudi2,面向中國(guó)市場(chǎng)推出的加速卡在性能上差別不大,而集成以太網(wǎng)RDMA端口數(shù)量從24個(gè)端口減到21個(gè),以符合美國(guó)芯片出口管制規(guī)定。(詳見鈦媒體App前文:《英特爾發(fā)布中國(guó)特供版7nm AI芯片Gaudi2,減少RDMA接口以符合出口管制規(guī)定》)

然而,鈦媒體App了解到,英特爾Gaudi 2中國(guó)特供版僅銷售幾十張OAM產(chǎn)品。自去年BIS 1017新規(guī)更新后,由于英特爾Gaudi 2“中國(guó)特供版”產(chǎn)品性能高于出口管制措施,最終導(dǎo)致其產(chǎn)品再也沒能繼續(xù)銷往中國(guó)市場(chǎng)。

基于此,去年12月前后,英特爾曾嘗試研發(fā)Gaudi 2 HL-225B變體,內(nèi)部稱Gaudi 2C AI芯片,希望重新獲得銷往中國(guó)大陸的許可,但最后卻等到今年3月BIS公布更新出口限制措施。

4月10日發(fā)布Gaudi 3之后,英特爾重新研發(fā)特供版產(chǎn)品,希望讓 Gaudi 3 AI芯片未來全力爭(zhēng)奪中國(guó)市場(chǎng),旨在為 AI 和云客戶提供英偉達(dá)產(chǎn)品的“替代選擇”。

具體硬件規(guī)格方面,中國(guó)特供版的Gaudi 3 與原版相比,具有相同的96MB SRAM片上內(nèi)存, 128GB HBM2e高帶寬內(nèi)存,帶寬為 3.7TB/s,擁有PCIe 5.0 x16 接口和解碼標(biāo)準(zhǔn)。但是,由于美國(guó)對(duì)于AI芯片的出口管制規(guī)則限制,使得這類高性能AI的綜合運(yùn)算性能(TPP)需要低于4800才能出口到中國(guó), 這意味中國(guó)特供版的Gaudi 3 的16bit性能不能超過150 TFLOPS。

相比Gaudi 3 國(guó)際版達(dá)到的1835 TFLOPS(FP16/BF16),中國(guó)特供版Gaudi 3 需要大幅削減內(nèi)核數(shù)量和工作頻率,最終可能需要其AI性能降低約92%,才能符合美國(guó)的出口管制要求。

同時(shí),由于中國(guó)特供版Gaudi 3產(chǎn)品的AI性能降低,這也將使得其TDP(熱設(shè)計(jì)功耗)大幅降低,預(yù)計(jì)OAM卡和PCIe卡的TDP均為450瓦,而原版PCIe卡(HL-338)的TDP高達(dá)600瓦,原版OAM卡(HL-325L、HL-335)的TDP更是高達(dá)900瓦。

整體來說,英特爾專為中國(guó)市場(chǎng)推出的“特供版”Gaudi 3兩款產(chǎn)品的 AI 性能,或?qū)⑴c英偉達(dá)“中國(guó)特供版”AI 加速卡H20水平相當(dāng),后者比H100的整體性能降低80%左右,達(dá)148 TFLOPS的FP16/BF16性能,略低于出口管制的150 TFLOPS的限制。

目前,英偉達(dá)H20 AI芯片已經(jīng)向中國(guó)大陸客戶送樣,但國(guó)內(nèi)百度、阿里等 AI 龍頭對(duì)其反響平平。有行業(yè)人士對(duì)鈦媒體App表示,主要原因是H20性能太低、價(jià)格太高,企業(yè)購(gòu)買意愿降低了。

美國(guó)商務(wù)部長(zhǎng)雷蒙多(Gina Raimondo)早前在一場(chǎng)公開論壇中表示,美國(guó)絕不能讓中國(guó)得到這些最尖端的芯片,絕不能讓中國(guó)芯片技術(shù)趕超美國(guó)。美國(guó)政府不允許英偉達(dá)向中國(guó)出售“最復(fù)雜、處理能力最高”的 AI 芯片,以防中國(guó)有能力訓(xùn)練前沿 AI 模型。

此外,有消息稱,美國(guó)政府還正在制定一份禁止接收關(guān)鍵工具的中國(guó)先進(jìn)芯片制造工廠名單,以便美國(guó)企業(yè)更容易阻止技術(shù)流入中國(guó),這份名單可能會(huì)在未來幾個(gè)月內(nèi)公布。同時(shí),美國(guó)正向包括荷蘭、日本、德國(guó)和韓國(guó)在內(nèi)的盟友施壓加碼,要求它們進(jìn)一步收緊對(duì)中國(guó)獲得半導(dǎo)體技術(shù)的限制措施。

針對(duì)于美方行動(dòng),外交部發(fā)言人毛寧在4月11日表示,“我們堅(jiān)決反對(duì)美方濫用實(shí)體清單等出口管制工具遏制打壓中國(guó)企業(yè),敦促美方停止將經(jīng)貿(mào)科技問題政治化、工具化、武器化。中方將采取必要措施堅(jiān)決維護(hù)中國(guó)企業(yè)的合法權(quán)益?!?/p>



關(guān)鍵詞: 英特爾 5nm AI

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉