Supermicro攜手英偉達(dá)為AI加速,搭載Grace CPU超級(jí)芯片的服務(wù)器上市在即
橫空出世的ChatGPT,在全球掀起生成式人工智能熱潮,“大模型+大算力”讓AI實(shí)現(xiàn)范式突破,也讓算力成為搶手資源。而在算力的背后,是數(shù)據(jù)中心和“電老虎”的競(jìng)賽。
5月29日,在COMPUTEX2023(中國(guó)臺(tái)北國(guó)際計(jì)算機(jī)展)上,IT解決方案提供商Supermicro提出了兩個(gè)關(guān)鍵詞:加速和降耗。Supermicro采用Server Building Block Solutions服務(wù)器構(gòu)建方法,整合Intel、AMD和NVIDIA的最新CPU及GPU技術(shù),設(shè)計(jì)和制造服務(wù)器和存儲(chǔ)系統(tǒng),以應(yīng)對(duì)AI、云計(jì)算、5G以及從數(shù)據(jù)中心到邊緣計(jì)算的大量需求。
“我們的機(jī)架級(jí)液冷方案可以將數(shù)據(jù)中心的電力支出降低40%,并能加快上市時(shí)間,每月向全球發(fā)運(yùn)4000機(jī)架,預(yù)計(jì)到年底將提高到5000以上?!?Supermicro總裁兼首席執(zhí)行官梁見(jiàn)后(Charles Liang)表示。
Supermicro已有產(chǎn)品組合可為人工智能工作負(fù)載和其他垂直領(lǐng)域提供支持?;诘谒拇鶬ntel Xeon可擴(kuò)展處理器和第四代AMD EPYC 處理器的單插槽和雙插槽機(jī)架安裝系統(tǒng),提供1U、2U、4U、5U和8U規(guī)格,并支持1到10 GPU。此外還包括在8U機(jī)箱中支持20個(gè)NVIDIA H100 GPU的密度優(yōu)化型SuperBlade系統(tǒng),以及專門(mén)針對(duì)物聯(lián)網(wǎng)和邊緣環(huán)境設(shè)計(jì)的SuperEdge系統(tǒng)。最新發(fā)布的E3.S Petascale存儲(chǔ)系統(tǒng)在利用超大規(guī)模的人工智能數(shù)據(jù)集進(jìn)行訓(xùn)練時(shí),其性能、容量、吞吐量、耐用性以及能效表現(xiàn)都較好。
在英偉達(dá)發(fā)布超大規(guī)模生成式AI加速平臺(tái)這一算力“殺器”的同一時(shí)間,Supermicro宣布,基于NVIDIA Grace CPU超級(jí)芯片的新產(chǎn)品系列將很快上市。這些新服務(wù)器均包含144個(gè)核心,雙CPU及900 GB/s 一致性接口,可運(yùn)行高響應(yīng)度的人工智能應(yīng)用程序和需要極低延遲響應(yīng)的應(yīng)用程序。此外,CPU以500W TDP的速度運(yùn)行,該系統(tǒng)將為云原生工作負(fù)載和下一代人工智能應(yīng)用降低能耗。
NVIDIA超大規(guī)模和高性能計(jì)算副總裁Ian Buck表示:“面對(duì)嚴(yán)苛的客戶需求,NVIDIA與Supermicro快速為新的服務(wù)器設(shè)計(jì)帶來(lái)創(chuàng)新。隨著Supermicro采用Grace CPU 超級(jí)芯片的服務(wù)器上市在即,以及H100 GPU在全球范圍的使用普及,我們正在共同努力,將人工智能帶到廣泛的市場(chǎng)和應(yīng)用中?!?/p>
生成式AI給算力帶來(lái)了巨大的挑戰(zhàn),Supermicro的應(yīng)對(duì)方案是GPU服務(wù)器集成雙CPU和多達(dá)8個(gè)NVIDIA HGX H100 GPU,并用液體冷卻降低運(yùn)營(yíng)成本。此外,Supermicro正在支持新的NVIDIA MGX參考架構(gòu),該架構(gòu)將為一系列人工智能、高性能計(jì)算和Omniverse應(yīng)用提供超過(guò)100種服務(wù)器配置。這種模塊化的參考架構(gòu)包括CPU、GPU和DPU,適用于多代處理器。
Supermicro還將在廣泛的解決方案中納入最新的NVIDIA Spectrum-X網(wǎng)絡(luò)平臺(tái)。該平臺(tái)是第一個(gè)專門(mén)為提高基于以太網(wǎng)的AI云的性能和效率而設(shè)計(jì)的平臺(tái)。Spectrum-X建立在由NVIDIA Spectrum-4以太網(wǎng)交換機(jī)與NVIDIA BlueField-3數(shù)據(jù)處理單元(DPU)緊密耦合的網(wǎng)絡(luò)創(chuàng)新之上。這項(xiàng)突破性技術(shù)實(shí)現(xiàn)了1.7倍的整體人工智能性能和能源效率提升,同時(shí)在多租戶環(huán)境中實(shí)現(xiàn)了一致、可預(yù)測(cè)的性能。
目前,數(shù)據(jù)中心消耗的電力占到了全球電力需求的1%至1.5%,因此綠色計(jì)算對(duì)于數(shù)據(jù)中心至關(guān)重要。Supermicro機(jī)架級(jí)液冷解決方案可以大幅降低對(duì)傳統(tǒng)冷卻方法的需求。通過(guò)冗余和熱插拔電源和泵,機(jī)架上的所有高性能AI和HPC優(yōu)化服務(wù)器都能夠得到有效冷卻,不用擔(dān)心電源或泵發(fā)生任何故障。該解決方案還為CPU和GPU量身定制了水冷板,相較于傳統(tǒng)設(shè)計(jì)能夠更有效地去除熱量。如果數(shù)據(jù)中心利用Supermicro技術(shù)將其PUE降低至近1.0,能節(jié)省高達(dá)100億美元的能源成本,相當(dāng)于減少建造30座化石燃料發(fā)電廠。
機(jī)架級(jí)集成是數(shù)據(jù)中心運(yùn)營(yíng)商所需的另一項(xiàng)核心競(jìng)爭(zhēng)力。要想給生產(chǎn)效率加速,就必須將隨時(shí)可用的全部機(jī)架及時(shí)交付給數(shù)據(jù)中心。Supermicro的 L11和L12服務(wù)器集群已通過(guò)全面測(cè)試并且進(jìn)行適當(dāng)配置,可以在必要時(shí)實(shí)現(xiàn)大規(guī)模液體冷卻。
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。