高性能計(jì)算：走向多核異構(gòu) 面臨能耗挑戰(zhàn)

作者：時(shí)間：2016-09-12 來(lái)源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

日前，2008年全國(guó)高性能計(jì)算學(xué)術(shù)年會(huì)在無(wú)錫舉行。從本次年會(huì)上我們能了解到高性能計(jì)算技術(shù)的哪些流行和發(fā)展趨勢(shì)?在高性能計(jì)算中又面臨哪些障礙和挑戰(zhàn)呢?本報(bào)記者對(duì)此進(jìn)行了深度報(bào)道。

本文引用地址：http://butianyuan.cn/article/201609/304626.htm

多核異構(gòu)大勢(shì)所趨編程模式是關(guān)鍵

多核和多核異構(gòu)系統(tǒng)越來(lái)越受到超大規(guī)模計(jì)算機(jī)的青睞，如前不久發(fā)布的全球高性能計(jì)算TOP500排名第一的IBM的Roadrunner就是把自己的Cell和AMD的皓龍?zhí)幚砥骰旌显诹艘黄?在芯片層面，包括英特爾、AMD和nVIDIA等都在研制異構(gòu)多核或眾核芯片。例如AMD提出的CPU+GPU的Fusion，nVIDIA的Tesla等。

眾所周知，在當(dāng)前的高性能計(jì)算系統(tǒng)和應(yīng)用中，絕大多數(shù)是x86架構(gòu)的處理器和應(yīng)用，隨著高性能計(jì)算系統(tǒng)性能的不斷提升，多核和重核異構(gòu)系統(tǒng)在滿足高性能計(jì)算的某些特殊應(yīng)用的時(shí)候表現(xiàn)出比較出色的性能。例如對(duì)于追求浮點(diǎn)運(yùn)算性能的應(yīng)用來(lái)說(shuō)，GPU(圖形處理芯片)的速度要遠(yuǎn)遠(yuǎn)高于傳統(tǒng)的 CPU(中央處理器)，這也是為何AMD和nVIDIA公司認(rèn)為，在未來(lái)的高性能計(jì)算中GPU或者CPU+GPU會(huì)最終取代CPU。但從目前應(yīng)用軟件的編程模式來(lái)看，多數(shù)編程工具和應(yīng)用仍然是基于x86架構(gòu)，所以要想充分發(fā)揮出GPU或CPU+GPU的性能，改變傳統(tǒng)的編程模式至關(guān)重要。對(duì)此，AMD公司中國(guó)區(qū)高級(jí)技術(shù)經(jīng)理劉文卓在其《未來(lái)是CPU和GPU的融聚》的主題演講中也承認(rèn)，目前編程模式是多核異構(gòu)系統(tǒng)面臨的最大挑戰(zhàn)。那么多核異構(gòu)是否是高性能計(jì)算的發(fā)展方向呢?

英特爾公司高性能計(jì)算軟件經(jīng)理SanjayGoil博士對(duì)記者講，英特爾一定會(huì)做異構(gòu)的多核芯片，但與對(duì)手“異構(gòu)的內(nèi)核，異構(gòu)的編程環(huán)境”不同，英特爾會(huì)堅(jiān)持走“異構(gòu)的內(nèi)核，相同的編程環(huán)境”這樣一條道路，也就是說(shuō)，不管是哪種內(nèi)核，所使用的編程模式都應(yīng)該是一樣的。雖然現(xiàn)在業(yè)界已經(jīng)出現(xiàn)了一些異構(gòu)系統(tǒng)，但這些異構(gòu)系統(tǒng)除了在Linpack測(cè)試時(shí)有較出色的表現(xiàn)，在實(shí)際應(yīng)用中并不好測(cè)試，因此需要強(qiáng)大的軟件工具的支持，降低異構(gòu)環(huán)境下的軟件編程難度。

英特爾中國(guó)公司亞太客戶響應(yīng)團(tuán)隊(duì)技術(shù)經(jīng)理何萬(wàn)青博士稱，目前英特爾的高性能計(jì)算開發(fā)工具可用于分析和優(yōu)化已有MPI編程模式的性能。同時(shí)英特爾也發(fā)布了自己的MPI2.0，接口不變，編程模式不變，但更加適合多核環(huán)境，在進(jìn)程與內(nèi)核之間可以實(shí)現(xiàn)更好的綁定。另外英特爾針對(duì)OpenMPI在與業(yè)界伙伴進(jìn)行合作。

從對(duì)與會(huì)廠商的采訪和目前高性能計(jì)算的現(xiàn)狀看，基于相同編程模式的多核異構(gòu)應(yīng)該是未來(lái)高性能計(jì)算系統(tǒng)最切實(shí)可行的道路。而采用CPU+GPU的異構(gòu)系統(tǒng)，改變業(yè)內(nèi)流行的編程模式的難度很大。至于未來(lái)會(huì)怎樣，充滿了不確定性。

能耗是挑戰(zhàn)技術(shù)尋求突破

在高性能計(jì)算領(lǐng)域，用戶對(duì)于計(jì)算性能的需求是無(wú)止境的，這使得計(jì)算機(jī)系統(tǒng)的規(guī)模越做越大，系統(tǒng)功耗也成為超級(jí)計(jì)算機(jī)發(fā)展面臨的重大挑戰(zhàn)。

以中石油的計(jì)算處理中心為例，從2002年到2007年CPU從340顆增長(zhǎng)到13308顆，增長(zhǎng)了近40倍。其運(yùn)算能力當(dāng)初是189億次/秒，現(xiàn)在高達(dá) 139萬(wàn)億次/秒，短短5年間處理能力獲得了質(zhì)的飛躍。正是因?yàn)橛辛藦?qiáng)大的計(jì)算能力，處理中心在冀東南堡油田的發(fā)現(xiàn)過(guò)程中發(fā)揮了至關(guān)重要的的作用，為油井位置的選擇提供了重要的依據(jù)。據(jù)統(tǒng)計(jì)，2005年處理中心有1500個(gè)CPU時(shí)，電費(fèi)是334萬(wàn)元;2006年CPU增加到2300顆，電費(fèi)達(dá)到492萬(wàn)元;2008年電費(fèi)至少需要1500萬(wàn)-1700萬(wàn)元。

除了處理器之外，內(nèi)存及其功耗的增加也值得關(guān)注。隨著制造工藝的改進(jìn)，內(nèi)存容量越來(lái)越大，速度越來(lái)越快，價(jià)格越來(lái)越低，與CPU一起推動(dòng)了計(jì)算能力的快速增長(zhǎng)。但與此同時(shí)，我們也要為之付出更多的電費(fèi)?，F(xiàn)在主流的DDR2和FBD內(nèi)存均已達(dá)到10W這個(gè)量級(jí)，以至于我們不得不為內(nèi)存的散熱感到頭痛;其次是芯片組和外圍設(shè)備，由于CPU和內(nèi)存頻率不斷提高，這就要求和它們配合的芯片組、總線和外圍設(shè)備在更高的頻率下工作，以充分發(fā)揮性能，而更高的頻率意味著更多的電能消耗。對(duì)此，國(guó)家并行計(jì)算機(jī)工程技術(shù)研究中心、中國(guó)工程院院士金怡濂告訴記者，系統(tǒng)功耗是超級(jí)計(jì)算機(jī)發(fā)展面臨的重要挑戰(zhàn)，當(dāng)今全球百萬(wàn)億次級(jí)超級(jí)計(jì)算機(jī)系統(tǒng)功耗在1000千瓦左右。一臺(tái)千萬(wàn)億次超級(jí)計(jì)算機(jī)系統(tǒng)的功耗能達(dá)到數(shù)兆瓦，每年的電費(fèi)開銷高達(dá)數(shù)千萬(wàn)元。因此，未來(lái)的超級(jí)計(jì)算機(jī)必須在節(jié)能方面有新的技術(shù)突破。

此外，Gartner預(yù)言，在接下來(lái)的幾年里，世界上一半左右的數(shù)據(jù)中心將受電力和空間的約束，能耗會(huì)占到一個(gè)IT部門預(yù)算的1/3。IDC也表示，IT 組織能耗的花費(fèi)將達(dá)到硬件花費(fèi)的1/4。以往高性能必然高功耗的時(shí)代已經(jīng)過(guò)去，評(píng)價(jià)高性能計(jì)算系統(tǒng)的優(yōu)劣要看性能，更要關(guān)注能效。

鑒于此，目前許多廠商已經(jīng)將降低高性能計(jì)算系統(tǒng)的能耗和綠色計(jì)算作為努力的方向。例如處在高性能計(jì)算產(chǎn)業(yè)鏈上游的處理器廠商英特爾就在制程工藝上采用了最新的45納米技術(shù)，這不僅從晶體管層面解決了漏電問(wèn)題，而且還可以讓芯片做得更小，性能更高，這使得45納米產(chǎn)品可以用較少的時(shí)間完成相同的任務(wù)，從而減少能源的消耗。

另外，英特爾也在芯片中不斷增強(qiáng)能源管理功能，如對(duì)能耗按需管理，把不忙的處理器核的功耗降低，以便提升繁忙的處理器核的主頻。而在基礎(chǔ)架構(gòu)方面，英特爾認(rèn)為一定要和整個(gè)產(chǎn)業(yè)的伙伴進(jìn)行共同合作才能讓整個(gè)生態(tài)系統(tǒng)共同走向綠色計(jì)算。

個(gè)人HPC呼之欲出應(yīng)用價(jià)格決定市場(chǎng)

特別值得一提的是，在此次年會(huì)上，個(gè)人高性能計(jì)算機(jī)也受到了廣泛關(guān)注。中國(guó)科學(xué)技術(shù)大學(xué)陳國(guó) 良院士在大會(huì) 上做了《PHPC：一種普及型高性能計(jì)算機(jī)》的報(bào)告。他指出，高性能計(jì)算的一個(gè)發(fā)展方向是可擴(kuò)展系統(tǒng)，當(dāng)前主要是研究千萬(wàn)億次計(jì)算的關(guān)鍵技術(shù);而另一個(gè)發(fā)展方向就是普及型系統(tǒng)，他們?yōu)榇颂岢隽朔Q為PHPC(PersonalHighPerformanceComputer)的個(gè)人高性能計(jì)算機(jī)技術(shù)。

其實(shí)，近年來(lái)個(gè)人高性能計(jì)算機(jī)一直是計(jì)算機(jī)領(lǐng)域的熱點(diǎn)，隨著計(jì)算機(jī)在生產(chǎn)和工作中被廣泛應(yīng)用，人們對(duì)計(jì)算能力的要求也越來(lái)越高。但現(xiàn)有機(jī)架式和刀片服務(wù)器主要瞄準(zhǔn)的是大型客戶，從性價(jià)比角度分析，中小規(guī)模應(yīng)用并非其強(qiáng)項(xiàng)，而且其適用性和易用性也不能滿足大量中小企業(yè)用戶的需求。

由于制造工藝的改善和多核技術(shù)的使用，CPU的處理能力現(xiàn)在已經(jīng)達(dá)到一個(gè)相當(dāng)高的水平。隨著四核的普及，一個(gè)雙路系統(tǒng)即擁有八個(gè)內(nèi)核的單臺(tái)服務(wù)器的處理能力得到極大提高。互聯(lián)技術(shù)也在迅速發(fā)展，萬(wàn)兆以太網(wǎng)、Infiniband、PCI-ESwitch的大量應(yīng)用使CPU能充分發(fā)揮強(qiáng)大的計(jì)算能力，很多以前需要幾十臺(tái)服務(wù)器的應(yīng)用如今在幾臺(tái)機(jī)器上運(yùn)行可以了。技術(shù)的發(fā)展和市場(chǎng)的需求呼喚新的產(chǎn)品，也就是所謂的個(gè)人高性能計(jì)算機(jī)，這個(gè)概念很早就被提出來(lái)了，但直到最近市場(chǎng)上才出現(xiàn)真正的產(chǎn)品，例如，Tyan的臺(tái)風(fēng)系列，Vxtech的PersonalClus-ter。

新聞中心

高性能計(jì)算：走向多核異構(gòu) 面臨能耗挑戰(zhàn)

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)