新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 業(yè)界動態(tài) > 揭秘太湖之光:純國產(chǎn)如何稱雄TOP500?

揭秘太湖之光:純國產(chǎn)如何稱雄TOP500?

作者: 時間:2016-07-18 來源:電子工程網(wǎng) 收藏
編者按:一路走來,質(zhì)疑之聲也從未間斷,但無論怎樣,每一項技術(shù)創(chuàng)新都會有學(xué)習的過程,不怕起步晚、走彎路、困難多,有了完全自主的技術(shù)支持,太湖之“光”將讓中國超算更加閃耀。

  第3篇:申威26010揚名 擺脫國外技術(shù)依賴

本文引用地址:http://www.butianyuan.cn/article/201607/294145.htm

  國產(chǎn)申威26010的秘密武器

  除了奪冠,其實更令人興奮的是其采用了國產(chǎn)處理器申威26010,可以說有著一定的歷史意義。2015年4月,美國商務(wù)部發(fā)布公告,決定禁止英特爾向四家國家超級計算機中心出售Xeon Phi處理器。而在此之前,曾經(jīng)的TOP500冠軍天河二號采用的就是Xeon系列處理器。這意味著,天河二號將無法繼續(xù)使用英特爾提供的用于升級系統(tǒng)的新款芯片。

  然而,申威26010的出現(xiàn)擊碎了外界對于國產(chǎn)化的質(zhì)疑。與此同時,這款處理器也帶來了一個“新名詞”:眾核。界早已對以GPU、眾核為代表的異構(gòu)計算持開明態(tài)度,GPU應(yīng)用的場景越來越多,在算法上也有了更多的支持。從長遠來看,異構(gòu)集群對的重要性會加大,在確保靈活性和軟件兼容性的前提下,追求更高的性能和更低的功耗。

  一直以來,HPC的發(fā)展離不開軍用和科研,也不例外。事實上,申威在業(yè)內(nèi)早有耳聞,但為什么外界鮮有人知呢?主要原因或許就是軍方背景。申威系列芯片的研發(fā)單位是江南計算機所(即總參某部56所),而申威26010就是在國家高性能集成電路(上海)設(shè)計中心生產(chǎn),被部署于無錫國家超級計算中心。總參某部56所創(chuàng)建于1951年6月,位于無錫。

  申威最初的技術(shù)來源是DEC公司開發(fā)的Alpha 21164,后者在1995面世,采用0.5um制造工藝,主頻為200MHz。不過,隨著技術(shù)研發(fā)的深耕,江南所拓展出了自主的申威-64指令集,擺脫了Alpha的影子。

  申威26010采用了“CPU+加速器”的方案(管理核心+運算核心),為64位RISC(主頻1.45GHz),擁有260個處理核心和4個內(nèi)存控制器。處理器內(nèi)包括四個核心組,每組有65個內(nèi)核,由8×8 Mesh架構(gòu)計算集群(CPE)、一個管理單元(MPE)、一個內(nèi)存控制器(MC)組成。其中,MPE和MC也可以被當作獨立的處理核心,前者負責系統(tǒng)管理和通訊,后者則用于浮點運算,單個內(nèi)存(128bit的DDR3)帶寬為34GB/s,因此整個處理器提供了136.5GB/s的帶寬。


揭秘太湖之光:純國產(chǎn)如何稱雄TOP500?


  申威26010核心組結(jié)構(gòu)(圖片來自Jack Dongarra)

  申威26010支持264位的矢量指令集,內(nèi)置各32KB的L1指令緩存和數(shù)據(jù)緩存,以及256KB L2緩存,沒有L3緩存。對于CPE來說,單條處理管線使得每個主頻周期可進行8次浮點運算,浮點性能為11.6GFLOPS,而MPE則約為CPE的兩倍。


揭秘太湖之光:純國產(chǎn)如何稱雄TOP500?


  申威26010節(jié)點基礎(chǔ)設(shè)計(圖片來自Jack Dongarra)

  此外,申威26010可能并非采用NUMA(非統(tǒng)一內(nèi)存訪問架構(gòu))架構(gòu),這使得處理器組內(nèi)之間的內(nèi)容共享成為可能,在硬件方面沒有緩存的一致性需求,由軟件負責同步。相比之下,英特爾Kight Landing則是將緩存一致性(Cache Coherence)都交給硬件。從性能來看,申威26010的雙精浮點峰值為3.06TFlops,與Kight Landing處在同一水平線。

  不過,作為完全自主的國產(chǎn)處理器,申威26010也面臨著一些問題。首先就是制造工藝,有人猜測28nm,盡管并不是官方說法,但相較英特爾的14nm還是有些落后。其次,的HPCG(High Performance Conjugate Gradients)成績也一般,峰值效率為0.3%,低于天河二號的1.1%。


揭秘太湖之光:純國產(chǎn)如何稱雄TOP500?


  太湖之光的HPCG成績不理想(圖片來自Jack Dongarra)

  對于HPCG測試,可能是內(nèi)存和互聯(lián)寬帶拖了后腿。前面提到過,申威26010采用的是DDR3,而英特爾Kight Landing已經(jīng)用上六通道DDR4,Xeon Phi的內(nèi)存帶寬達到了512GB。雖然太湖之光在Linpack上大幅領(lǐng)先,但在HPC的適用性方面就會有些下降??偟膩碚f,申威26010在計算能力上的優(yōu)勢有目共睹,不過由于更偏向軍用,因此部分功能經(jīng)過了特殊調(diào)校,應(yīng)用范圍有一定的局限。

第4篇:太湖之光應(yīng)用貢獻大 照亮中國

  超算之路不平坦 太湖之光只是開始

  從天河系列的70%國產(chǎn)化,到神威藍光的85%以上,再到如今完全自主、耗時三年研制的神威太湖之光,中國超算在美國芯片禁運的“倒逼”下,已經(jīng)跨出了歷史性的一步。值得一提的是,基于太湖之光系統(tǒng)的三項全機應(yīng)用還入圍了有超算界諾貝爾之稱的“戈登貝爾獎”。該獎項自1987年設(shè)立以來,中國團隊從未入圍過。

  在國家863計劃的支持下,作為“國之重器”的超級計算機在工業(yè)制造、航天、軍事、醫(yī)學(xué)、科研等領(lǐng)域?qū)l(fā)揮更大的作用,并且會助推深度學(xué)習、人工智能的發(fā)展。未來,太湖之光將在四個方向發(fā)揮作用:全球高分辨率模擬,為氣候變化研究提供量化研究的基礎(chǔ);先進制造,助力“中國制造”轉(zhuǎn)向“中國創(chuàng)造”;生命科學(xué),為研發(fā)新藥和探索生命奧秘提供支撐;大數(shù)據(jù)分析。

  舉例來說,國家超級計算無錫中心與清華大學(xué)、北京師范大學(xué)合作,在太湖之光上進行了CAM全球大氣模式的重構(gòu)與優(yōu)化,以及全球超高分辨率大氣模式實驗框架。其中,大氣模式實驗框架已初步實現(xiàn)了3公里精度,僅次于日本NICAM 870米的分辨率。清華大學(xué)計算機科學(xué)與技術(shù)系副教授薛巍表示:“有了這套計算機系統(tǒng),我們可以在30天內(nèi)完成未來100年的地球氣候模擬,全面提升我國應(yīng)對極端氣候事件和自然災(zāi)害時的減災(zāi)防災(zāi)能力?!?/p>


揭秘太湖之光:純國產(chǎn)如何稱雄TOP500?


  大氣模式實驗框架(圖片來自國家超級計算無錫中心)

  借助太湖之光,國家計算流體力學(xué)實驗室對“天宮一號”返回路徑進行了數(shù)值模擬計算,將為其返回提供精確預(yù)測;上海藥物所開展的藥物篩選和疾病機理研究,兩周內(nèi)就完成了原本需要10個月的計算,加速了白血病、癌癥、禽流感等疾病的藥物設(shè)計進度;此外,太湖之光還將在“高分辨率海浪數(shù)值模擬”和“鈦合金微結(jié)構(gòu)演化相場模擬”方面做出巨大貢獻。截至目前,國家超級計算無錫中心已經(jīng)與北京大學(xué)、中科院軟件所、中船重工702所、遠景能源、清華大學(xué)、國家計算流體力學(xué)實驗室等國內(nèi)30多家機構(gòu)或單位建立了應(yīng)用合作關(guān)系。

  除了國家級研究機構(gòu)的貢獻,以聯(lián)想、曙光等為代表的中國企業(yè)也在超算領(lǐng)域有著很好的表現(xiàn)。最新一期TOP500中,聯(lián)想就以92套獲得了全球超算份額第二、中國第一的成績。未來,超算將朝著高性能、低功耗的方向繼續(xù)拓展,芯片設(shè)計、任務(wù)分配、算法優(yōu)化、應(yīng)用范圍、散熱系統(tǒng)等依然是努力的重點。



關(guān)鍵詞: 太湖之光 超算

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉