AMD公布Instinct MI250X與NVIDIA A100對(duì)比測(cè)試數(shù)據(jù),有絕對(duì)性能優(yōu)勢(shì)
幾天前,AMD宣布推出基于CDNA 2架構(gòu)的Instinct MI200系列計(jì)算卡,這是第一款采用MCM多芯片封裝的GPU,是首款百億億級(jí)的GPU加速器。更出人意料的是,AMD現(xiàn)在還公布了與競(jìng)爭(zhēng)對(duì)手英偉達(dá)A100計(jì)算卡之間的對(duì)比測(cè)試數(shù)據(jù)。雖然硬件公司在一些活動(dòng)上展示性能優(yōu)勢(shì)的PPT并不少見,但官網(wǎng)上公開詳實(shí)的實(shí)際對(duì)比測(cè)試數(shù)據(jù)卻不多,這說明了AMD對(duì)自己的這款產(chǎn)品在性能方面非常有信心。
AMD Instinct MI200系列計(jì)算卡搭載了代號(hào)Aldebaran的GPU,擁有580億個(gè)晶體管,采用臺(tái)積電6nm工藝制造,搭配了128GB的HBM2e顯存(總帶寬3.2 TB/s),TDP為560W。該系列有Instinct MI250和Instinct MI250X兩款產(chǎn)品,分別有208個(gè)CU(13312個(gè)流處理器)和220個(gè)CU(14080個(gè)流處理器)。
其GPU中的小芯片輔以XGMI內(nèi)部互聯(lián)設(shè)計(jì),均具有VCN 2.6控制器,還使用了2.5D Elevated Fanout Bridge(EFB)封裝技術(shù)。此外,GPU里的兩個(gè)小芯片通過AMD Infinity Fabric技術(shù)連接,提供高達(dá)100 GB/s的雙向帶寬。這屬于第三代nfinity Fabric技術(shù),可管理多達(dá)8條Infinity Fabric鏈路,將Instinct MI200系列計(jì)算卡和第三代EPYC處理器相連,實(shí)現(xiàn)CPU和GPU內(nèi)存一致性,最大限度提高系統(tǒng)吞吐量。對(duì)比上一代基于CDNA架構(gòu)的Instinct MI100,基于CDNA 2架構(gòu)的Instinct MI200系列計(jì)算卡在性能上提升幅度非常大。
顯然,AMD Instinct MI200系列計(jì)算卡是主要針對(duì)HPC和AI工作負(fù)載設(shè)計(jì)的。AMD官方公布的對(duì)比測(cè)試?yán)?,涉及了處理代?shù)、物理學(xué)、宇宙學(xué)、分子動(dòng)力學(xué)和粒子相互作用等項(xiàng)目,許多是被廣泛使用并具有行業(yè)認(rèn)可的測(cè)試,例如LAMMPS和OpenMM。
不過值得留意的是,AMD缺乏關(guān)于AI基準(zhǔn)測(cè)試的項(xiàng)目。在紙面上,AMD Instinct MI200系列計(jì)算卡在傳統(tǒng)的HPC和矩陣工作負(fù)載中會(huì)有更高的性能,而英偉達(dá)應(yīng)該在AI方面仍然會(huì)有些優(yōu)勢(shì)。
從這些基準(zhǔn)測(cè)試結(jié)果來看,AMD Instinct MI250X對(duì)比NVIDIA A100占據(jù)了絕對(duì)的性能優(yōu)勢(shì),是對(duì)方的1.4倍到3.05倍之間,可以說Instinct MI250X是目前世界上性能最強(qiáng)的HPC計(jì)算卡。考慮到AMD Instinct MI250X比NVIDIA A100晚了一年半左右才推出,加上采用了新的架構(gòu)和使用了更多的ALU,有這樣的測(cè)試結(jié)果也是很自然的事情。
再過幾個(gè)月,英特爾將推出Ponte Vecchio,這款英特爾技術(shù)集大成者應(yīng)該會(huì)有相當(dāng)強(qiáng)悍的性能,不知道屆時(shí)實(shí)際情況會(huì)如何。
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。