新聞中心

EEPW首頁(yè) > 嵌入式系統(tǒng) > 業(yè)界動(dòng)態(tài) > NVIDIA黃仁勛:GPU加速運(yùn)算成為延展摩爾定律主要模式

NVIDIA黃仁勛:GPU加速運(yùn)算成為延展摩爾定律主要模式

作者: 時(shí)間:2018-05-31 來(lái)源:經(jīng)濟(jì)日?qǐng)?bào) 收藏

  在此次GTC Taiwan中,執(zhí)行長(zhǎng)黃仁勛期未來(lái)10年內(nèi),每年對(duì)于運(yùn)算需求的規(guī)模將成長(zhǎng)100倍,同時(shí)預(yù)期在摩爾定律逐漸衰減之下,全球前50大超級(jí)電腦的運(yùn)算量將在未來(lái)5年內(nèi)成長(zhǎng)15倍率,同時(shí)以加速運(yùn)算的方式將成為延展摩爾定律的主要模式。

本文引用地址:http://butianyuan.cn/article/201805/380824.htm



  黃仁勛在GTC Taiwan再次強(qiáng)調(diào)過(guò)去創(chuàng)造CUDA運(yùn)算模式所帶動(dòng)加速效益,同時(shí)說(shuō)明未來(lái)借由加速運(yùn)算的模式將會(huì)持續(xù)擴(kuò)大,預(yù)期在2028年全球運(yùn)算需求將等同1000萬(wàn)組Volta架構(gòu)GPU所推動(dòng)效能,若以傳統(tǒng)通過(guò)多組CPU堆疊構(gòu)成超級(jí)電腦等級(jí)運(yùn)算能力,將會(huì)占據(jù)大規(guī)??臻g及高額電力花費(fèi),若以GPU替換的話,則可節(jié)省更多空間與電力損耗,同時(shí)帶來(lái)更高加速效果。

  就目前超級(jí)電腦底經(jīng)成為現(xiàn)代科學(xué)發(fā)展重要工具,分別在分子建構(gòu)、量子化學(xué)、量子力學(xué)、天氣預(yù)報(bào)、氣象研究、能源探索、物理模擬、數(shù)據(jù)分析與人工智能技術(shù)發(fā)展扮演重要角色,并且提供百萬(wàn)億次或百億等級(jí)運(yùn)算效能。而就OpenAI統(tǒng)計(jì)顯示,未來(lái)5年內(nèi)的人工智能運(yùn)算模型將成長(zhǎng)30萬(wàn)倍,相比摩爾定律預(yù)期成長(zhǎng)速度快3萬(wàn)倍,借由GPU加速能力將可讓數(shù)據(jù)、演算程式復(fù)雜度大幅提升,借此解決過(guò)往人力無(wú)法解決運(yùn)算需求。



  去年宣布推出整合Tensor Core設(shè)計(jì),并且整合32GB HBM2內(nèi)存的Volta架構(gòu)GPU,借此對(duì)應(yīng)125 Tensor TFLOPS運(yùn)算效能,分別對(duì)應(yīng)7.5 FP64 TFLOPS或15 FP32 TFLOPS預(yù)算效能,相比過(guò)往采用GPU加速運(yùn)算模式可提升10倍效率,同時(shí)進(jìn)一步讓占用空間與電力損耗大幅降低。

  而為了突破硬體架構(gòu)限制,在今年的GTC 2018更進(jìn)一步宣布推出NVSwitch,讓16組Volta GPU能共用高達(dá)512GB HBM2內(nèi)存 (32GB x 16),總計(jì)可對(duì)應(yīng)81920組CUDA核心、2000 Tensor Core TFLOPS運(yùn)算效能,構(gòu)成全球最高效能的GPU,并且不受傳統(tǒng)CPU架構(gòu)限制GPU存取內(nèi)存容量影響。借由NVSwitch的設(shè)計(jì),NVIDIA更宣布推出全球最大 (并且可游玩游戲)的DGX-2 GPU,對(duì)應(yīng)借由高達(dá)2PFLOPS運(yùn)算效能,并且特殊多孔纖維設(shè)計(jì)讓運(yùn)作功率高達(dá)10000W的機(jī)盒維持低溫運(yùn)作,相比半年前正式推出的DGX-1運(yùn)算效能提升10倍。

  相比過(guò)往必須借由300組雙核心CPU構(gòu)成、必須消耗180000W功率能耗運(yùn)作的服務(wù)器,通過(guò)單組DGX-2 GPU即可對(duì)應(yīng)相同運(yùn)算效能,但整替價(jià)格僅需1/8與1/18功率能耗,同時(shí)相比過(guò)往Alex 練Alex Krizhevsky通過(guò)兩張NVIDIA GTX 580 GPU,花費(fèi)6天時(shí)間完成訓(xùn)練AlexNet,借由DGX-2 GPU僅需18分鐘即可完成。同時(shí)DGX-2 GPU也分別打破每秒分析1075個(gè)影像,成為最快單晶片運(yùn)算速度,以及每秒可在每個(gè)節(jié)點(diǎn)處理15500個(gè)影像,并且可在14分鐘內(nèi)完成擴(kuò)充,推論延遲時(shí)間僅在1.1毫秒,每秒更可推論演算6250個(gè)影像。

  通過(guò)DGX-2的運(yùn)算能力與NVSwitch串接技術(shù),NVIDIA也宣布推出以DGX-2建構(gòu)的服務(wù)器平臺(tái)設(shè)計(jì)HGX-2,并且與廣達(dá)、云達(dá)、富士康、英業(yè)達(dá)、緯創(chuàng)、緯穎、華碩、技嘉、華擎、泰安、宏碁等臺(tái)灣在地廠商合作,同時(shí)強(qiáng)調(diào)全球約有90%服務(wù)器源自臺(tái)灣,而NVIDIA也與更多臺(tái)灣在地廠商持續(xù)合作。

  借由GPU運(yùn)算能力,配合與Adobe等軟體廠商合作的影像處理技術(shù),將可實(shí)現(xiàn)即時(shí)修改影像中不必要物件,或是重建影像中缺乏內(nèi)容,甚至能進(jìn)一步呈現(xiàn)“美顏”效果。同時(shí)通過(guò)與Google提出的kubernetes容器集群管理系統(tǒng)合作,將可讓更多人工智能系統(tǒng)能因應(yīng)不同運(yùn)算需求動(dòng)態(tài)調(diào)整運(yùn)算效能,借此讓GPU架速運(yùn)算效能有更彈性配置效益,將與阿里巴巴、百度、eBay、HIKVISION、IBM、小米等廠商合作。

  在與臺(tái)灣合作部分,NVIDIA表示目前富士康將借由人工智能技術(shù)檢測(cè)制作生產(chǎn)效率,中國(guó)醫(yī)藥大學(xué)附設(shè)醫(yī)院通過(guò)人工智能技術(shù)協(xié)助醫(yī)師分析預(yù)測(cè)癌癥腫瘤轉(zhuǎn)移情況,臺(tái)灣大學(xué)則通過(guò)人工智能區(qū)分鼻咽癌危及器官,而臺(tái)灣人工智能實(shí)驗(yàn)室也通過(guò)人工智能技術(shù)協(xié)助臺(tái)南市政府監(jiān)測(cè)橋梁結(jié)構(gòu)預(yù)防臺(tái)風(fēng)損害,桃園市政府則計(jì)劃在2020年前讓30%固定行駛路線的公車能配置Level 3自動(dòng)駕駛功能。

  如同先前在GTC 2018期間以“PLASTER”作為主題演講結(jié)尾,黃仁勛也強(qiáng)調(diào)分別借由可編程 (Programmability)、低延遲 (Latency)、高精準(zhǔn)度 (Accuracy)、規(guī)?;?(Size)、數(shù)據(jù)吞吐量 (Throughput)、能耗效率 (Energy Efficiency),進(jìn)而推動(dòng)學(xué)習(xí)訓(xùn)練效率 (Rate of Learning),讓人工智能能以更快速度成長(zhǎng)。



關(guān)鍵詞: NVIDIA GPU

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉