高性能計(jì)算:走向多核異構(gòu) 面臨能耗挑戰(zhàn)
日前,2008年全國(guó)高性能計(jì)算學(xué)術(shù)年會(huì)在無(wú)錫舉行。從本次年會(huì)上我們能了解到高性能計(jì)算技術(shù)的哪些流行和發(fā)展趨勢(shì)?在高性能計(jì)算中又面臨哪些障礙和挑戰(zhàn)呢?本報(bào)記者對(duì)此進(jìn)行了深度報(bào)道。
本文引用地址:http://butianyuan.cn/article/201609/304626.htm多核異構(gòu)大勢(shì)所趨編程模式是關(guān)鍵
多核和多核異構(gòu)系統(tǒng)越來(lái)越受到超大規(guī)模計(jì)算機(jī)的青睞,如前不久發(fā)布的全球高性能計(jì)算TOP500排名第一的IBM的Roadrunner就是把自己的Cell和AMD的皓龍?zhí)幚砥骰旌显诹艘黄?在芯片層面,包括英特爾、AMD和nVIDIA等都在研制異構(gòu)多核或眾核芯片。例如AMD提出的CPU+GPU的Fusion,nVIDIA的Tesla等。
眾所周知,在當(dāng)前的高性能計(jì)算系統(tǒng)和應(yīng)用中,絕大多數(shù)是x86架構(gòu)的處理器和應(yīng)用,隨著高性能計(jì)算系統(tǒng)性能的不斷提升,多核和重核異構(gòu)系統(tǒng)在滿足高性能計(jì)算的某些特殊應(yīng)用的時(shí)候表現(xiàn)出比較出色的性能。例如對(duì)于追求浮點(diǎn)運(yùn)算性能的應(yīng)用來(lái)說(shuō),GPU(圖形處理芯片)的速度要遠(yuǎn)遠(yuǎn)高于傳統(tǒng)的 CPU(中央處理器),這也是為何AMD和nVIDIA公司認(rèn)為,在未來(lái)的高性能計(jì)算中GPU或者CPU+GPU會(huì)最終取代CPU。但從目前應(yīng)用軟件的編程模式來(lái)看,多數(shù)編程工具和應(yīng)用仍然是基于x86架構(gòu),所以要想充分發(fā)揮出GPU或CPU+GPU的性能,改變傳統(tǒng)的編程模式至關(guān)重要。對(duì)此,AMD公司中國(guó)區(qū)高級(jí)技術(shù)經(jīng)理劉文卓在其《未來(lái)是CPU和GPU的融聚》的主題演講中也承認(rèn),目前編程模式是多核異構(gòu)系統(tǒng)面臨的最大挑戰(zhàn)。那么多核異構(gòu)是否是高性能計(jì)算的發(fā)展方向呢?
英特爾公司高性能計(jì)算軟件經(jīng)理SanjayGoil博士對(duì)記者講,英特爾一定會(huì)做異構(gòu)的多核芯片,但與對(duì)手“異構(gòu)的內(nèi)核,異構(gòu)的編程環(huán)境”不同,英特爾會(huì)堅(jiān)持走“異構(gòu)的內(nèi)核,相同的編程環(huán)境”這樣一條道路,也就是說(shuō),不管是哪種內(nèi)核,所使用的編程模式都應(yīng)該是一樣的。雖然現(xiàn)在業(yè)界已經(jīng)出現(xiàn)了一些異構(gòu)系統(tǒng),但這些異構(gòu)系統(tǒng)除了在Linpack測(cè)試時(shí)有較出色的表現(xiàn),在實(shí)際應(yīng)用中并不好測(cè)試,因此需要強(qiáng)大的軟件工具的支持,降低異構(gòu)環(huán)境下的軟件編程難度。
英特爾中國(guó)公司亞太客戶響應(yīng)團(tuán)隊(duì)技術(shù)經(jīng)理何萬(wàn)青博士稱,目前英特爾的高性能計(jì)算開發(fā)工具可用于分析和優(yōu)化已有MPI編程模式的性能。同時(shí)英特爾也發(fā)布了自己的MPI2.0,接口不變,編程模式不變,但更加適合多核環(huán)境,在進(jìn)程與內(nèi)核之間可以實(shí)現(xiàn)更好的綁定。另外英特爾針對(duì)OpenMPI在與業(yè)界伙伴進(jìn)行合作。
從對(duì)與會(huì)廠商的采訪和目前高性能計(jì)算的現(xiàn)狀看,基于相同編程模式的多核異構(gòu)應(yīng)該是未來(lái)高性能計(jì)算系統(tǒng)最切實(shí)可行的道路。而采用CPU+GPU的異構(gòu)系統(tǒng),改變業(yè)內(nèi)流行的編程模式的難度很大。至于未來(lái)會(huì)怎樣,充滿了不確定性。
能耗是挑戰(zhàn)技術(shù)尋求突破
在高性能計(jì)算領(lǐng)域,用戶對(duì)于計(jì)算性能的需求是無(wú)止境的,這使得計(jì)算機(jī)系統(tǒng)的規(guī)模越做越大,系統(tǒng)功耗也成為超級(jí)計(jì)算機(jī)發(fā)展面臨的重大挑戰(zhàn)。
以中石油的計(jì)算處理中心為例,從2002年到2007年CPU從340顆增長(zhǎng)到13308顆,增長(zhǎng)了近40倍。其運(yùn)算能力當(dāng)初是189億次/秒,現(xiàn)在高達(dá) 139萬(wàn)億次/秒,短短5年間處理能力獲得了質(zhì)的飛躍。正是因?yàn)橛辛藦?qiáng)大的計(jì)算能力,處理中心在冀東南堡油田的發(fā)現(xiàn)過(guò)程中發(fā)揮了至關(guān)重要的的作用,為油井位置的選擇提供了重要的依據(jù)。據(jù)統(tǒng)計(jì),2005年處理中心有1500個(gè)CPU時(shí),電費(fèi)是334萬(wàn)元;2006年CPU增加到2300顆,電費(fèi)達(dá)到492萬(wàn)元;2008年電費(fèi)至少需要1500萬(wàn)-1700萬(wàn)元。
除了處理器之外,內(nèi)存及其功耗的增加也值得關(guān)注。隨著制造工藝的改進(jìn),內(nèi)存容量越來(lái)越大,速度越來(lái)越快,價(jià)格越來(lái)越低,與CPU一起推動(dòng)了計(jì)算能力的快速增長(zhǎng)。但與此同時(shí),我們也要為之付出更多的電費(fèi)?,F(xiàn)在主流的DDR2和FBD內(nèi)存均已達(dá)到10W這個(gè)量級(jí),以至于我們不得不為內(nèi)存的散熱感到頭痛;其次是芯片組和外圍設(shè)備,由于CPU和內(nèi)存頻率不斷提高,這就要求和它們配合的芯片組、總線和外圍設(shè)備在更高的頻率下工作,以充分發(fā)揮性能,而更高的頻率意味著更多的電能消耗。對(duì)此,國(guó)家并行計(jì)算機(jī)工程技術(shù)研究中心、中國(guó)工程院院士金怡濂告訴記者,系統(tǒng)功耗是超級(jí)計(jì)算機(jī)發(fā)展面臨的重要挑戰(zhàn),當(dāng)今全球百萬(wàn)億次級(jí)超級(jí)計(jì)算機(jī)系統(tǒng)功耗在1000千瓦左右。一臺(tái)千萬(wàn)億次超級(jí)計(jì)算機(jī)系統(tǒng)的功耗能達(dá)到數(shù)兆瓦,每年的電費(fèi)開銷高達(dá)數(shù)千萬(wàn)元。因此,未來(lái)的超級(jí)計(jì)算機(jī)必須在節(jié)能方面有新的技術(shù)突破。
此外,Gartner預(yù)言,在接下來(lái)的幾年里,世界上一半左右的數(shù)據(jù)中心將受電力和空間的約束,能耗會(huì)占到一個(gè)IT部門預(yù)算的1/3。IDC也表示,IT 組織能耗的花費(fèi)將達(dá)到硬件花費(fèi)的1/4。以往高性能必然高功耗的時(shí)代已經(jīng)過(guò)去,評(píng)價(jià)高性能計(jì)算系統(tǒng)的優(yōu)劣要看性能,更要關(guān)注能效。
鑒于此,目前許多廠商已經(jīng)將降低高性能計(jì)算系統(tǒng)的能耗和綠色計(jì)算作為努力的方向。例如處在高性能計(jì)算產(chǎn)業(yè)鏈上游的處理器廠商英特爾就在制程工藝上采用了最新的45納米技術(shù),這不僅從晶體管層面解決了漏電問(wèn)題,而且還可以讓芯片做得更小,性能更高,這使得45納米產(chǎn)品可以用較少的時(shí)間完成相同的任務(wù),從而減少能源的消耗。
另外,英特爾也在芯片中不斷增強(qiáng)能源管理功能,如對(duì)能耗按需管理,把不忙的處理器核的功耗降低,以便提升繁忙的處理器核的主頻。而在基礎(chǔ)架構(gòu)方面,英特爾認(rèn)為一定要和整個(gè)產(chǎn)業(yè)的伙伴進(jìn)行共同合作才能讓整個(gè)生態(tài)系統(tǒng)共同走向綠色計(jì)算。
個(gè)人HPC呼之欲出應(yīng)用價(jià)格決定市場(chǎng)
特別值得一提的是,在此次年會(huì)上,個(gè)人高性能計(jì)算機(jī)也受到了廣泛關(guān)注。中國(guó)科學(xué)技術(shù)大學(xué)陳國(guó) 良 院 士 在 大 會(huì) 上 做 了《PHPC:一種普及型高性能計(jì)算機(jī)》的報(bào)告。他指出,高性能計(jì)算的一個(gè)發(fā)展方向是可擴(kuò)展系統(tǒng),當(dāng)前主要是研究千萬(wàn)億次計(jì)算的關(guān)鍵技術(shù);而另一個(gè)發(fā)展方向就是普及型系統(tǒng),他們?yōu)榇颂岢隽朔Q為PHPC(PersonalHighPerformanceComputer)的個(gè)人高性能計(jì)算機(jī)技術(shù)。
其實(shí),近年來(lái)個(gè)人高性能計(jì)算機(jī)一直是計(jì)算機(jī)領(lǐng)域的熱點(diǎn),隨著計(jì)算機(jī)在生產(chǎn)和工作中被廣泛應(yīng)用,人們對(duì)計(jì)算能力的要求也越來(lái)越高。但現(xiàn)有機(jī)架式和刀片服務(wù)器主要瞄準(zhǔn)的是大型客戶,從性價(jià)比角度分析,中小規(guī)模應(yīng)用并非其強(qiáng)項(xiàng),而且其適用性和易用性也不能滿足大量中小企業(yè)用戶的需求。
由于制造工藝的改善和多核技術(shù)的使用,CPU的處理能力現(xiàn)在已經(jīng)達(dá)到一個(gè)相當(dāng)高的水平。隨著四核的普及,一個(gè)雙路系統(tǒng)即擁有八個(gè)內(nèi)核的單臺(tái)服務(wù)器的處理能力得到極大提高。互聯(lián)技術(shù)也在迅速發(fā)展,萬(wàn)兆以太網(wǎng)、Infiniband、PCI-ESwitch的大量應(yīng)用使CPU能充分發(fā)揮強(qiáng)大的計(jì)算能力,很多以前需要幾十臺(tái)服務(wù)器的應(yīng)用如今在幾臺(tái)機(jī)器上運(yùn)行可以了。技術(shù)的發(fā)展和市場(chǎng)的需求呼喚新的產(chǎn)品,也就是所謂的個(gè)人高性能計(jì)算機(jī),這個(gè)概念很早就被提出來(lái)了,但直到最近市場(chǎng)上才出現(xiàn)真正的產(chǎn)品,例如,Tyan的臺(tái)風(fēng)系列,Vxtech的PersonalClus-ter。
評(píng)論