博客專欄

EEPW首頁 > 博客 > 英偉達(dá)發(fā)布最強(qiáng)AI超算:4608個(gè)H100 GPU

英偉達(dá)發(fā)布最強(qiáng)AI超算:4608個(gè)H100 GPU

發(fā)布人:傳感器技術(shù) 時(shí)間:2024-02-19 來源:工程師 發(fā)布文章

Eos是全球性能排名第九的超級計(jì)算機(jī)。
英偉達(dá)周四發(fā)布了一段視頻,首次向公眾展示了其最新的面向企業(yè)的超級計(jì)算機(jī)Eos的架構(gòu),Eos是專為數(shù)據(jù)中心規(guī)模的高級人工智能開發(fā)而設(shè)計(jì)的,也是該公司速度最快的人工智能超級計(jì)算機(jī)。
Eos 機(jī)器目前由 Nvidia 自己使用,在最新的 Top 500 榜單中,它被評為世界上性能最高的超級計(jì)算機(jī)的第 9 位,該榜單以 FP64 為衡量標(biāo)準(zhǔn);在純 AI 任務(wù)中,它很可能是速度最快的超級計(jì)算機(jī)之一。同時(shí),它的藍(lán)圖也可用于為其他公司建造面向企業(yè)的超級計(jì)算機(jī)。

圖片


"Nvidia在視頻中表示:"每天,EOS都在迎接Nvidia數(shù)千名從事人工智能研究的內(nèi)部開發(fā)人員的挑戰(zhàn),幫助他們解決以前無法解決的問題。
Nvidia的Eos配備了576個(gè)DGX H100系統(tǒng),每個(gè)系統(tǒng)包含8個(gè)Nvidia H100 GPU,用于人工智能(AI)和高性能計(jì)算(HPC)工作負(fù)載。該系統(tǒng)總共裝有1,152個(gè)英特爾至強(qiáng)Platinum 8480C(每個(gè)CPU有56個(gè)內(nèi)核)處理器和4,608個(gè)H100 GPU,使Eos在HPC和AI方面分別達(dá)到了Rmax 121.4 FP64 PetaFLOPS和18.4 FP8 ExaFLOPS性能。
Eos(依托于DGX SuperPOD架構(gòu))的設(shè)計(jì)專為人工智能工作負(fù)載和可擴(kuò)展性而打造,因此它采用了Nvidia的Mellanox Quantum-2 InfiniBand with In-Network Computing技術(shù),該技術(shù)的數(shù)據(jù)傳輸速度高達(dá)400 Gb/s,這對于有效訓(xùn)練大型人工智能模型和擴(kuò)大規(guī)模至關(guān)重要。
除了強(qiáng)大的硬件,Nvidia 的 Eos 還配備了強(qiáng)大的軟件,該公司表示,這些軟件也是專為人工智能開發(fā)和部署而設(shè)計(jì)的。因此,Nvidia 的 Eos 可以應(yīng)對從類似 ChatGPT 的生成式人工智能到人工智能工廠等各種應(yīng)用。
"Eos擁有一個(gè)集成的軟件棧,其中包括AI開發(fā)和部署軟件,包括協(xié)調(diào)和集群管理、加速計(jì)算存儲(chǔ)和網(wǎng)絡(luò)庫,以及針對AI工作負(fù)載優(yōu)化的操作系統(tǒng),"Nvidia在視頻中說。"Eos是Nvidia DGX超級計(jì)算機(jī)(如Saturn 5和Selene)知識(shí)的結(jié)晶,是Nvidia人工智能專業(yè)技術(shù)的最新實(shí)例。通過創(chuàng)建像Eos這樣的人工智能工廠,企業(yè)可以承擔(dān)他們最苛刻的項(xiàng)目,并在今天和未來實(shí)現(xiàn)他們的人工智能愿望。"
我們不知道 Eos 的成本是多少,而且 Nvidia DGX H100 系統(tǒng)的定價(jià)是保密的,取決于很多因素,比如數(shù)量,這也無濟(jì)于事。與此同時(shí),考慮到每臺(tái) Nvidia H100 的成本可能在 3 萬至 4 萬美元之間,這取決于數(shù)量,因此我們可以大致估測出其有多昂貴。來源:芯榜



*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請聯(lián)系工作人員刪除。



關(guān)鍵詞: 英偉達(dá)

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉