英特爾全球首臺200億億次超算完成安裝:內(nèi)存就有3萬多TB
英特爾正式宣布,美國能源部阿拉貢國家實(shí)驗(yàn)室已完成新一代超級計(jì)算“Aurora”的安裝,上線后將提供每秒超過200億億次計(jì)算的FP64浮點(diǎn)性能。
由此,英特爾將成功超越AMD,成為全球第一超級計(jì)算機(jī)!
目前(公開)世界排名第一的超級計(jì)算機(jī)“Frontier”,隸屬于美國能源部橡樹嶺國家實(shí)驗(yàn)室,最高性能為1.19 百億億次浮點(diǎn)計(jì)算,峰值性能為1.68 百億億次,采用AMD EPYC 7A53 64核處理器和 Instinct MI250X GPU 加速器。
Aurora 早在 2015 年就宣布了,原計(jì)劃于 2018 年推出。它采用 Intel Xeon Phi 協(xié)處理器,性能約為每秒 18 億次運(yùn)算。
但由于Xeon Phi產(chǎn)品線的終結(jié)(不允許銷往中國)以及GPU計(jì)算的加速,Intel改變了計(jì)劃,采用CPU+GPU一體化計(jì)算平臺,成為三大百億億次美國的超級計(jì)算機(jī)之一。計(jì)劃定為2021年上線。
之后,由于Intel 7nm工藝和Xe HPC GPU加速器進(jìn)展不佳,Aorura也一次次跳票,最終AMD率先進(jìn)入百億億次時代。
Aorua系統(tǒng)的最終版本由兩個大型機(jī)柜組成,面積相當(dāng)于兩個籃球場,包含10624個由HP Cray設(shè)計(jì)的刀片服務(wù)器,分為166個機(jī)架(每個機(jī)架內(nèi)有64個服務(wù)器),每個節(jié)點(diǎn)由兩個 Sapphire Rapids Xeon Max 處理器和六個 Ponte Vecchio Max GPU 加速器。
整個系統(tǒng)使用了63744個CPU處理器,超過110萬個核心,以及21248個GPU加速器。
系統(tǒng)內(nèi)存容量為19.9PB,至強(qiáng)處理器中封裝有1.36PB HBM2E高帶寬內(nèi)存,GPU加速器中有8.16PB。三者合計(jì)為29.42PB,相當(dāng)于3萬多TB。
存儲陣列單獨(dú)放置,分為1024個全閃存陣列,總?cè)萘?20TB,總帶寬31TB/s。
Aoura系統(tǒng)經(jīng)過一系列測試和驗(yàn)證后,將于今年年底正式上線??捎糜诤司圩兡M、天氣預(yù)報、空氣動力學(xué)、醫(yī)學(xué)等領(lǐng)域的研究。
英特爾自豪地宣稱這是英特爾 Max GPU 的首次商業(yè)用途。這是最大的 Xeon Max CPU 系統(tǒng)。這是全球最大的GPU計(jì)算集群。GPU性能是競品的2倍,CPU性能比競品高40%。
?
在中國端午節(jié)假期的同時,英特爾公司宣布了一項(xiàng)重大變革,這是該公司成立 55 年來最重要的轉(zhuǎn)型。
簡單來說,英特爾將自己的半導(dǎo)體設(shè)計(jì)與制造、封裝測試業(yè)務(wù)進(jìn)行了拆分,從原來的IDM垂直制造轉(zhuǎn)變?yōu)樵O(shè)計(jì)、制造/封裝測試獨(dú)立運(yùn)營。
就這一點(diǎn)而言,英特爾的改變就像當(dāng)年AMD拆分晶圓制造業(yè)務(wù)后成立格芯GlobalFoundries一樣。不同的是,AMD獨(dú)立出售了這部分業(yè)務(wù),股份逐漸清空AMD目前僅與格芯GlobalFoundries有合作關(guān)系。
英特爾則不同。它已經(jīng)拆分了晶圓制造業(yè)務(wù),但并未出售。它仍然是它的得力助手。因此,它是IDM 2.0模型??沙薪油獠坑唵?,與臺積電、三星在市場上競爭。
英特爾的模式與現(xiàn)在三星的有點(diǎn)相似。半導(dǎo)體制造業(yè)務(wù)還承接內(nèi)部和外部訂單。正因如此,英特爾CFO指出,英特爾IFS代工業(yè)務(wù)2024年可實(shí)現(xiàn)200億美元營收,明年將直接超越三星成為晶圓代工業(yè)務(wù)市場亞軍。
因?yàn)榉植鸷笞畲蟮目蛻羰怯⑻貭栕约旱脑O(shè)計(jì)部門,雖然難免有左右手之嫌,但三星之前也這么做過。
除了代工模式的轉(zhuǎn)型,英特爾的轉(zhuǎn)型還強(qiáng)調(diào)先進(jìn)技術(shù)的反擊。他們的官方PPT也比較了這幾年技術(shù)的變化。
簡單來說,英特爾在32nm到14nm節(jié)點(diǎn)上是領(lǐng)先臺積電的,但是到了10m之后,臺積電就翻身了,而在后續(xù)的Intel 4和Intel 3工藝中,Intel也誠實(shí)的表示自己落后臺積電的5nm、3nm、甚至20A工藝都是同樣落后,但18A工藝將領(lǐng)先臺積電的2nm工藝。
這款18A工藝相當(dāng)于1.8nm工藝,是20A的改進(jìn)版。也是Intel歷時4年的5代CPU工藝中最關(guān)鍵的一環(huán)。下一步就是依靠它進(jìn)行先進(jìn)工藝代工。
令市場失望的一件事是,英特爾此次并未如傳聞那樣公布代工客戶名單。許多廠商對1.8nm工藝感興趣,包括Arm、高通、NVIDIA等,甚至收到了Intel的測試樣品,但確認(rèn)采用該工藝的客戶尚未確定,市場仍在等待看看Intel的表現(xiàn)。
內(nèi)容來源:硬件世界
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點(diǎn),如有侵權(quán)請聯(lián)系工作人員刪除。