新聞中心

EEPW首頁(yè) > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > 高性能計(jì)算與AI融合加速 Supermicro推動(dòng)綠色計(jì)算發(fā)展

高性能計(jì)算與AI融合加速 Supermicro推動(dòng)綠色計(jì)算發(fā)展

作者: 時(shí)間:2020-12-17 來(lái)源:電子產(chǎn)品世界 收藏

近年來(lái),高性能計(jì)算(HPC)廣泛應(yīng)用于各個(gè)領(lǐng)域,保持強(qiáng)勁發(fā)展勢(shì)頭,企業(yè)數(shù)字化轉(zhuǎn)型對(duì)算力的需求日益增長(zhǎng)。2017年,全球高性能計(jì)算市場(chǎng)規(guī)模為346.2億美元。從2018年到2025年,預(yù)計(jì)將以7.2%的復(fù)合年增長(zhǎng)率增長(zhǎng)。隨著高性能計(jì)算應(yīng)用程序的復(fù)雜性不斷增加,企業(yè)亟需在軟硬件方面進(jìn)行不斷優(yōu)化和革新。

本文引用地址:http://butianyuan.cn/article/202012/421313.htm

高性能計(jì)算與AI融合加速

AI浪潮加速著各個(gè)行業(yè)的革新,從精準(zhǔn)醫(yī)療到自動(dòng)駕駛,越來(lái)越多的新興應(yīng)用不斷涌現(xiàn)。借助HPC基礎(chǔ)設(shè)施,人工智能能得到更好的發(fā)揮,兩者融合將是未來(lái)幾年的主流趨勢(shì)。

Supermicro北京辦公室總經(jīng)理李運(yùn)杰表示:“AI和HPC的融合發(fā)展迅速。這一趨勢(shì)背后的驅(qū)動(dòng)力是工作負(fù)載量。隨著我們?cè)诳萍?、金融以及其他諸多領(lǐng)域采集的數(shù)據(jù)越來(lái)越多,我們需要更加完善的傳感器和高分辨率來(lái)采集數(shù)據(jù),因此計(jì)算效能將變得愈發(fā)重要。盡管CPU的摩爾定律的發(fā)展可能會(huì)變慢,但是運(yùn)用GPU平行運(yùn)算以及其他CPU技術(shù)的趨勢(shì)將會(huì)逐年增長(zhǎng)。AI深度學(xué)習(xí)以及結(jié)合HPC的應(yīng)用正在往新的領(lǐng)域擴(kuò)展,包括:基因組學(xué)、生物學(xué)研究、社會(huì)研究、虛擬現(xiàn)實(shí)等等。深度學(xué)習(xí)AI算法非常適合處理HPC中的數(shù)據(jù)。此融合成為必然的趨勢(shì),我們期待將來(lái)能見到更多這樣的用例。”

HPC市場(chǎng)需要兼具高密度和高性能的解決方案。對(duì)此,Supermicro的BigTwin系統(tǒng)結(jié)合液冷散熱功能,滿足了市場(chǎng)需求。BigTwin采2U 4節(jié)點(diǎn)規(guī)格,每個(gè)節(jié)點(diǎn)可支持雙插槽處理器、大內(nèi)存和三個(gè)X16 PCIe。Supermicro BigTwin同時(shí)具有采用英特爾架構(gòu)以及采用AMD架構(gòu)的解決方案。Supermicro在HPC領(lǐng)域的優(yōu)勢(shì)主要體現(xiàn)在其各種各樣的GPU系統(tǒng)上:一個(gè)雙插槽系統(tǒng)最多可支持16個(gè)GPU。

Supermicro擁有可支持NVIDIA最新A100 GPU的系統(tǒng),也有可以支持AMD最新MI100 GPU的系統(tǒng)。最近,其在勞倫斯·利弗莫爾國(guó)家實(shí)驗(yàn)室(Lawrence Livermore National Labs)的Corona系統(tǒng)擴(kuò)充了近1,000個(gè)GPU,換言之,在一個(gè)相對(duì)較小的空間增加大約11個(gè)PFLOPs的性能。

邊緣計(jì)算需求呈爆發(fā)式增長(zhǎng)  

無(wú)論是如HPC這類的傳統(tǒng)計(jì)算場(chǎng)景還是邊緣計(jì)算這類新興計(jì)算場(chǎng)景,今后都需要更多技術(shù)賦能來(lái)完善計(jì)算技術(shù)的產(chǎn)業(yè)生態(tài)構(gòu)建。如今有很多企業(yè)將HPC和邊緣計(jì)算技術(shù)融合,讓后端與邊緣更有效地協(xié)同。隨著邊緣計(jì)算不斷發(fā)展,其需求呈現(xiàn)爆發(fā)式增長(zhǎng),許多企業(yè)組織正將數(shù)據(jù)移至邊緣來(lái)處理。這是2021年的主要趨勢(shì)。IDC預(yù)測(cè),2023年將有42.4%的企業(yè)采用邊緣+核心的組合架構(gòu)建立和運(yùn)行數(shù)據(jù)庫(kù),設(shè)備架構(gòu)向“云—邊—端”三級(jí)架構(gòu)演進(jìn)迭代,邊緣數(shù)據(jù)中心將會(huì)成為理想的承載基礎(chǔ)設(shè)施去處理更多對(duì)時(shí)延要求更高的業(yè)務(wù)?;ヂ?lián)設(shè)備正在生成大量的數(shù)據(jù),而企業(yè)組織不能只依賴云計(jì)算來(lái)處理這些龐大的數(shù)據(jù)。因此,企業(yè)組織正逐漸轉(zhuǎn)向邊緣計(jì)算,將實(shí)體資源投入邊緣附近的端點(diǎn)設(shè)備;有時(shí)會(huì)在本地裝置中部署專用網(wǎng)關(guān)和服務(wù)器。

無(wú)論是精密復(fù)雜的HPC系統(tǒng)、基于GPU的計(jì)算系統(tǒng),或是為邊緣的獨(dú)特處理需求以及環(huán)境條件要求而設(shè)計(jì)的系統(tǒng),Supermicro都能提供各種解決方案來(lái)滿足客戶的不同需求。Supermicro的SuperServer?系列擁有每瓦特和每平方英尺最佳效能、支持AI加速卡的擴(kuò)展插槽,以及無(wú)風(fēng)扇和強(qiáng)化加固設(shè)計(jì)等多種配置,可安裝在環(huán)境條件要求嚴(yán)苛的應(yīng)用場(chǎng)景。

image.png

功耗控制是實(shí)現(xiàn)綠色計(jì)算的關(guān)鍵

HPC系統(tǒng)的規(guī)??梢苑浅}嫶螅枰獢?shù)十兆瓦計(jì)的功率支持。對(duì)于某些HPC系統(tǒng)來(lái)說(shuō),功耗控制非常重要,可以確保用電量不會(huì)超過(guò)每日的配額。

降低系統(tǒng)功耗、提高系統(tǒng)可靠性、提高應(yīng)用性能等都需要關(guān)鍵技術(shù)的突破。今年8月,Supermicro與Preferred Networks合作開發(fā)的MN-3在Green500行業(yè)評(píng)比中獲得了第一名。Green500相較于追求極限性能的TOP500超算排行榜更注重能效表現(xiàn),根據(jù)所獲性能與所耗功率的比值評(píng)選最節(jié)能超算系統(tǒng)。這款定制服務(wù)器可滿足眾多應(yīng)用需具備的超高速傳輸能力,而且在耗電量方面也遠(yuǎn)低于以往同等規(guī)模的超級(jí)計(jì)算機(jī)。

為應(yīng)對(duì)功耗挑戰(zhàn),Supermicro推出了SPM電源管理工具 (Supermicro Power Manager),可以監(jiān)測(cè)和控制個(gè)別節(jié)點(diǎn)的電源、全機(jī)柜的電源或成排機(jī)柜的電源。SPM工具可以透過(guò)配置來(lái)控制各種級(jí)別的功率,并將系統(tǒng)劃分為不同的功率級(jí)別,以便進(jìn)行全面的功耗控制。不只是計(jì)算機(jī)系統(tǒng)需要用電,散熱亦需用電。Supermicro的液冷散熱解決方案可以讓HPC系統(tǒng)更密集地架設(shè),并可大幅減少用于系統(tǒng)散熱的電力。液冷散熱解決方案可以消除CPU和GPU產(chǎn)生的廢熱,也就是散熱主要必須處理的部份。除了液冷散熱之外,Supermicro也有采自然通風(fēng)降溫的系統(tǒng),完全不需要冷氣調(diào)節(jié)。

IT經(jīng)理人越來(lái)越希望找到能提供高性能、高成本效益和高效節(jié)能的綠色I(xiàn)T產(chǎn)品供應(yīng)商。他們的主要目標(biāo)是降低飛漲的數(shù)據(jù)中心運(yùn)營(yíng)成本,其中很大一部分是電力相關(guān)成本。隨著電力成本的不斷攀升,用戶用于服務(wù)器硬件供電和散熱的花費(fèi),已遠(yuǎn)超過(guò)購(gòu)買服務(wù)器本身了。

Supermicro一直踐行“綠色計(jì)算”理念,希望通過(guò)綠色I(xiàn)T創(chuàng)新技術(shù)引領(lǐng)市場(chǎng),其資源節(jié)約型架可為客戶節(jié)省TCO。李運(yùn)杰強(qiáng)調(diào):“為了將這種影響力發(fā)揮到極致,我們導(dǎo)入一種總體架構(gòu),它可以優(yōu)化數(shù)據(jù)中心的功耗、散熱、共享資源和刷新周期。這種創(chuàng)新的方法注重系統(tǒng)機(jī)箱的重復(fù)使用、子系統(tǒng)的模塊化刷新,以及使用經(jīng)過(guò)優(yōu)化及延長(zhǎng)使用壽命的各種子系統(tǒng),包括網(wǎng)絡(luò)、存儲(chǔ)、散熱、風(fēng)扇和電源供應(yīng)器。只需置換新版本的CPU和內(nèi)存,即可在原有的服務(wù)器上享有新技術(shù)及新效能。至于其他的各項(xiàng)組件則可依照原有的使用年限,單獨(dú)進(jìn)行刷新即可,從而使數(shù)據(jù)中心降低產(chǎn)品生命周期刷新的成本?!?/p>



關(guān)鍵詞:

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉