新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 業(yè)界動態(tài) > 臺積電4納米打造英偉達(dá)Blackwell架構(gòu)GPU,建構(gòu)迄今最強(qiáng)GB200

臺積電4納米打造英偉達(dá)Blackwell架構(gòu)GPU,建構(gòu)迄今最強(qiáng)GB200

作者: 時(shí)間:2024-03-20 來源:科技新報(bào) 收藏

大廠19日清晨在美國加州圣荷西召開的GTC2024,發(fā)表號稱迄今最強(qiáng)AI芯片GB200,今年稍晚出貨。GB200采新Blackwell架構(gòu),創(chuàng)辦人暨執(zhí)行長黃仁勛表示,兩年前Hopper架構(gòu)已非常出色,但現(xiàn)在需要更強(qiáng)大的GPU。

本文引用地址:http://www.butianyuan.cn/article/202403/456565.htm

每兩年更新頻率,升級一次GPU架構(gòu),大幅提升AI芯片性能。英偉達(dá)2022年發(fā)表Hopper架構(gòu)H100AI芯片后,引領(lǐng)全球AI市場風(fēng)潮。如今再推采Blackwell架構(gòu)的AI芯片性能更強(qiáng)大,更擅長處理AI任務(wù),Blackwell架構(gòu)是以數(shù)學(xué)家David Harold Blackwell之名命名。

黃仁勛表示,Blackwell架構(gòu)GPU的AI運(yùn)算性能在FP8及NEW FP6都可達(dá)20petaflops,是前一代Hopper架構(gòu)運(yùn)算性能8petaflops的2.5倍。NEWFP4更可達(dá)40petaflops,是前代Hopper架構(gòu)GPU運(yùn)算性能8petaflops5倍。取決于各種Blackwell架構(gòu)GPU設(shè)備的記憶體容量和頻寬配置,工作運(yùn)算執(zhí)行力的實(shí)際性能可能會更高。黃仁勛強(qiáng)調(diào),有額外處理能力,使人工智慧企業(yè)訓(xùn)練更大更復(fù)雜的模型。

Blackwell架構(gòu)GPU的體積龐大,采4納米(4NP)打造,整合兩個(gè)獨(dú)立制造的裸晶(Die),共2,080億個(gè)電晶體,透過NVLink5.0介面像拉鏈綁住芯片。英偉達(dá)用10TB/sec NVLink5.0連接兩塊裸晶,官方稱介面為NV-HBI。Blackwell complex的NVLink5.0介面為1.8TB頻寬,是前代Hopper架構(gòu)GPU NVLink4.0介面速度的兩倍。

英偉達(dá)最新GB200 AI芯片,含兩個(gè)Blackwell GPU和一個(gè)Arm架構(gòu)Grace CPU,推理模型性能比H100提升30倍,成本和能耗降至25分之一。

英偉達(dá)還對有大型需求的企業(yè)提供服務(wù)器成品,提供完整服務(wù)器出貨,如GB200 NVL72服務(wù)器,提供36個(gè)CPU和72個(gè)Blackwell架構(gòu)GPU,完善一體水冷散熱方案,可實(shí)現(xiàn)總計(jì)720petaflops的AI訓(xùn)練性能或1,440petaflops推理性能。電纜長度累計(jì)近2英里,共5,000條獨(dú)立電纜。

亞馬遜AWS計(jì)劃采購2萬片GB200芯片組建的服務(wù)器集群,部署27兆個(gè)參數(shù)模型。除了亞馬遜AWS,DELL、Alphabet、Meta、微軟、OpenAI、Oracle和TESLA成為Blackwell系列的采用者之一。




關(guān)鍵詞: 臺積電 GPU 英偉達(dá)

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉