從未如此強(qiáng)大 AMD EPYC處理器將高性能計(jì)算推向百億億次時(shí)代
在6月的ISC 2020大會(huì)上,TOP500官方宣布了新一屆全球最強(qiáng)超算的排名。這次的TOP500榜單有很多亮點(diǎn),去年發(fā)布的第二代AMDEPYC(霄龍)處理器在前50名中占據(jù)四席,并助力Selene超算斬獲第七名,這也是TOP500中首次使用64核128線程的處理器。
本文引用地址:http://butianyuan.cn/article/202007/415948.htm64核EPYC處理器在TOP500超算中初露鋒芒,代表著x86處理器在HPC高性能計(jì)算中的新生,這也是AMD超算逆襲的開始。因?yàn)檫^不了多久,基于EPYC處理器的新一代超算將征戰(zhàn)百億億次性能,毫無(wú)疑問會(huì)成為TOP500超算新冠軍。
泰坦超算退役 從16核到64核 AMD全新高性能計(jì)算架構(gòu)接棒
EPYC處理器進(jìn)入超算位列也頗具歷史意義,因?yàn)橐荒昵癆MD歷史上最強(qiáng)的超算Titan退役了。位于美國(guó)橡樹嶺國(guó)家實(shí)驗(yàn)室ORNL的Titan泰坦超算拿下過2012年的TOP500第一,它使用的是AMD皓龍6274處理器,這是x86處理器中首款16核服務(wù)器CPU,助力超算性能登上2.7億億次。
AMD用16核處理器將HPC高性能計(jì)算推上了億億次時(shí)代,如今超算要挑戰(zhàn)的是百億億次性能,百倍的性能提升同時(shí)還要有更高的能效,這對(duì)高性能計(jì)算提出了嚴(yán)峻的挑戰(zhàn)。不過AMD最終還是交出了滿意的答卷,這就要靠近年來(lái)橫空出世的全新EPYC處理器了。
2017年,AMD正式推出第一代EPYC(霄龍)處理器,一下子就做到了32核64線程。不過,32核開只是開胃菜。AMD在2019年又推出了第二代EPYC處理器,做到了64核128線程,并帶來(lái)了PCIe 4.0等全新一代技術(shù)。
64核128線程不僅創(chuàng)造了x86多核處理器的新紀(jì)錄,更是一舉將原本擠牙膏式發(fā)展的高性能計(jì)算市場(chǎng)往前推了一大步,AMD表示,數(shù)據(jù)中心的性能在2年時(shí)間里直接提升了一倍,
在當(dāng)前的時(shí)代里,人們對(duì)AI人工智能、深度學(xué)習(xí)、生命科學(xué)、藥物合成、石油勘探、天文計(jì)算等領(lǐng)域的算力要求已經(jīng)大幅提升,第二代AMD EPYC超過一倍的性能提升使得它在HPC領(lǐng)域大顯身手,開始全面接棒新一代超算平臺(tái)。
高性能算力哪里來(lái)?AMD創(chuàng)新7nm Zen2/Zen3+IF總線+小芯片設(shè)計(jì)
在半導(dǎo)體行業(yè),大家都知道最近十年來(lái)摩爾定律一直在放緩。算力提升不是一件簡(jiǎn)單的事,那AMD又是如何做到2年間算力翻倍的呢?這還得從第二代EPYC處理器的諸多創(chuàng)新算起。
首先是全新的架構(gòu),第一代EPYC使用了14nm工藝及Zen架構(gòu),做到了32核64線程,這已經(jīng)是x86中的創(chuàng)舉,但當(dāng)前在用的第二代EPYC則是升級(jí)到了7nm Zen2架構(gòu),使得IPC性能提升了15%。
與第一代Zen架構(gòu)相比,Zen2架構(gòu)優(yōu)化了L1指令緩存、操作緩存容量翻倍、浮點(diǎn)單元數(shù)據(jù)位寬翻倍,同時(shí)L3緩存翻倍到16MB,64核EPYC處理器輕松擁有128MB L3緩存,遠(yuǎn)高于對(duì)手標(biāo)準(zhǔn)。
在這樣的改進(jìn)下,Zen2架構(gòu)的性能相比前代有了明顯提升,同時(shí)憑借7nm工藝帶來(lái)的高能效優(yōu)勢(shì)降低了功耗,同樣在225W TDP下也能做到64核128線程,提高了HPC高性能計(jì)算的能效。AMD六年前定下的25x20能效目標(biāo)提前就完成了,7nm Zen2功不可沒。
此外,AMD的CPU路線圖是一以貫之的。2019年是7nm Zen2,今年還會(huì)有Zen3架構(gòu),雖然官方還沒公布具體數(shù)據(jù),但性能可期。
在今年5月份的財(cái)務(wù)分析師大會(huì)上,AMD又正式宣布了Zen4架構(gòu),面向未來(lái)的5nm工藝,預(yù)計(jì)會(huì)在2022年問世,首發(fā)用于第四代EPYC處理器Genoa(熱那亞),這將會(huì)是新一代超算的又一個(gè)重要選擇。
光是先進(jìn)的工藝和架構(gòu)也不行,支撐第二代EPYC處理器提升到64核128線程的還有全新的Chiplet小芯片設(shè)計(jì),這也是AMD在x86處理器上的一個(gè)創(chuàng)舉——將CPU核心與IO核心分離,前者使用7nm工藝制造,后者使用14nm工藝制造,集成了不同數(shù)量的DDR主控、PCIe主控、IF總線等IO單元。
這樣一來(lái),EPYC處理器就可以擺脫之前的束縛,超多核心極具靈活性,從8核到64核處理器就像是搭積木一樣,1個(gè)IO模塊可以連接多個(gè)CPU模塊,64核只要1個(gè)IO模塊、8個(gè)CPU模塊即可。
Zen2架構(gòu)與小芯片設(shè)計(jì)完成之后,AMD的高性能EPYC還欠一股東風(fēng),那就是Infinity Fabric總線技術(shù)。它是CPU核心之間、CPU與IO核心之間的關(guān)鍵,從第一代的10.7GT/s速率提升到了18GT/s,4路插槽并行的話可獲得202GB/s的超高帶寬,是64核EPYC處理器發(fā)揮性能的關(guān)鍵之一。就好像高速公路一樣,有了它,超級(jí)能裝的EPYC處理器才能跑得更快,運(yùn)載的“數(shù)據(jù)”越多。
EPYC處理器沖刺新一代超算 搶占2百億億次性能制高點(diǎn)
上面所說的EPYC三大性能改進(jìn)還只是AMD高性能架構(gòu)中的一部分,其他的還有PCIe 4.0,第二代EPYC是首個(gè)面向PCIe 4.0技術(shù)而生的高性能處理器,總計(jì)128條PCIe 4.0通道,不論數(shù)量還是帶寬,這賦予了高性能計(jì)算極高的擴(kuò)展性,搭配新一代計(jì)算卡、FPGA及網(wǎng)絡(luò)芯片都是如虎添翼。
基于這些全面性的提升,AMD的EPYC處理器很快就獲得了各大超算中心的青睞,這兩年來(lái)使用EPYC芯片的超算不下于20多臺(tái),今年進(jìn)入TOP500的就有10臺(tái),而且這個(gè)名單還在不斷地?cái)U(kuò)大中。
在這些超算中,最強(qiáng)大的兩臺(tái)是Frontier及El Capitan,前者是AMD聯(lián)合Cray公司為美國(guó)能源部橡樹嶺實(shí)驗(yàn)室打造的超算系統(tǒng),浮點(diǎn)性能可達(dá)150億億次,而El Capitan則是AMD聯(lián)合HPE為勞倫斯利弗莫爾國(guó)家實(shí)驗(yàn)室(LLNL)打造的,浮點(diǎn)性能可達(dá)200億億次。
這兩臺(tái)超算的性能都超過了百億億次,El Capitan甚至翻倍到了200億億次,是人類有史以來(lái)最強(qiáng)大的超算,它們使用的都是新一代EPYC處理器,前者預(yù)計(jì)在2021年問世,El Capitan預(yù)計(jì)在2023年問世,屆時(shí)無(wú)疑會(huì)改寫TOP500超算排名。
總之,在HPC高性能計(jì)算領(lǐng)域,隨著AI時(shí)代的到來(lái),人們對(duì)算力的需求是無(wú)窮無(wú)盡的。現(xiàn)在的矛盾是如何高效率地提升算力,而AMD EPYC處理器憑借先進(jìn)的工藝、架構(gòu)、小芯片設(shè)計(jì)及PCIe 4.0的領(lǐng)先,已經(jīng)領(lǐng)先業(yè)界一步,將超級(jí)計(jì)算機(jī)的算力推向了百億億次時(shí)代。未來(lái)在算力提升的道路上,AMD EPYC將如何改寫市場(chǎng)格局,無(wú)疑是非常值得期待的。
評(píng)論