新聞中心

EEPW首頁(yè) > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > 阿里云發(fā)布飛天智算平臺(tái),提供一站式AI計(jì)算開(kāi)發(fā)服務(wù)

阿里云發(fā)布飛天智算平臺(tái),提供一站式AI計(jì)算開(kāi)發(fā)服務(wù)

作者: 時(shí)間:2022-08-30 來(lái)源: 收藏

8月30日,宣布正式推出全棧智能計(jì)算解決方案“”,并啟動(dòng)兩座超大規(guī)模智算中心,以公共云和專(zhuān)有云兩種模式,為各類(lèi)科研、公共服務(wù)和企業(yè)機(jī)構(gòu)提供強(qiáng)大的智能計(jì)算服務(wù),可將計(jì)算資源利用率提高3倍以上,AI訓(xùn)練效率提升11倍,推理效率提升6倍。

本文引用地址:http://butianyuan.cn/article/202208/437837.htm

 

已在阿里內(nèi)部廣泛應(yīng)用,支撐達(dá)摩院前沿AI和電商智能技術(shù)發(fā)展,并服務(wù)了小鵬汽車(chē)、深勢(shì)科技、上汽集團(tuán)、中國(guó)氣象局、南方電網(wǎng)等機(jī)構(gòu)和企業(yè),支撐自動(dòng)駕駛、新藥研發(fā)、氣象預(yù)測(cè)、工業(yè)能源等行業(yè)大幅提升AI訓(xùn)練效率。

 

據(jù)了解,該平臺(tái)提供基于磐久基礎(chǔ)設(shè)施的融合算力和大數(shù)據(jù)AI一體化平臺(tái)整體解決方案,可以運(yùn)行在X86、GPU、ARM等多種芯片類(lèi)型的服務(wù)器上,實(shí)現(xiàn)“一云多芯”,并以最高10倍IO優(yōu)化和5倍通信性能優(yōu)化,實(shí)現(xiàn)90%的千卡并行計(jì)算效率。

 

綠色技術(shù)方面,飛天智算在技術(shù)減排、能源結(jié)構(gòu)優(yōu)化、區(qū)域布局優(yōu)化、供應(yīng)鏈減碳以及資源利用優(yōu)化五個(gè)方面來(lái)降低單位算力的碳排放。在技術(shù)減排方面,通過(guò)液冷、電源技術(shù)以及智能運(yùn)維等方式降低能耗,PUE最低可達(dá)1.09。

 

同時(shí),開(kāi)發(fā)人員可以在平臺(tái)上進(jìn)行數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)治理、數(shù)據(jù)分析、模型開(kāi)發(fā)、模型訓(xùn)練與推理的工作。并提供了預(yù)訓(xùn)練模型,以及語(yǔ)音,圖像、自然語(yǔ)言處理、決策等領(lǐng)域的模型能力,以方便開(kāi)發(fā)者更好的加速AI應(yīng)用的開(kāi)發(fā)。

 

目前,該平臺(tái)正在支撐建設(shè)兩座超大規(guī)模智算中心。其中,張北智算中心建設(shè)規(guī)模為12 EFLOPS(每秒1200億億次浮點(diǎn)運(yùn)算)AI算力,將超過(guò)谷歌的9 EFLOPS和特斯拉的1.8 EFLOPS,成為全球最大的智算中心。烏蘭察布智算中心建設(shè)規(guī)模為3 EFLOPS(每秒300億億次浮點(diǎn)運(yùn)算)AI算力,位于“東數(shù)西算”內(nèi)蒙古樞紐節(jié)點(diǎn)。

 

智能全球銷(xiāo)售總裁蔡英華表示,智算不僅在于規(guī)模大,更是需要綠色、高效并且具備產(chǎn)業(yè)實(shí)踐。計(jì)算是一個(gè)龐大的復(fù)雜系統(tǒng),沒(méi)有體系化的核心技術(shù)能力,堆硬件是堆不出算力的,更無(wú)法帶來(lái)實(shí)際的產(chǎn)業(yè)價(jià)值。

 

據(jù)了解,智能計(jì)算不同于通用型計(jì)算,需要海量數(shù)據(jù)對(duì)AI模式進(jìn)行訓(xùn)練,算力被損耗在數(shù)據(jù)遷移、同步等環(huán)節(jié),千卡以上規(guī)模的算力輸出最低往往僅有40%左右。這導(dǎo)致了智能算力成本高昂,制約了產(chǎn)業(yè)發(fā)展。阿里云通過(guò)體系化的技術(shù)創(chuàng)新,改變了智能計(jì)算的損耗難題,將千卡并行計(jì)算效率提升至90%以上。

 

例如,在通信技術(shù)上,阿里云采用高性能自研Solar-RDMA網(wǎng)絡(luò),實(shí)現(xiàn)端對(duì)端最低2微秒延遲,配合阿里云自研的無(wú)阻塞通信技術(shù),讓計(jì)算過(guò)程中的數(shù)據(jù)交換速度最高提升5倍。同時(shí),自然風(fēng)冷、液冷等綠色技術(shù)的應(yīng)用,讓智算中心的能耗降低,PUE最低可達(dá)1.09。

 

在AI開(kāi)發(fā)層,阿里云提供大數(shù)據(jù)+AI一體化平臺(tái)支撐開(kāi)發(fā)與運(yùn)維全流程。尤其在模型訓(xùn)練環(huán)節(jié),提供分布式訓(xùn)練框架,可以對(duì)分布式策略進(jìn)行自動(dòng)組合和調(diào)優(yōu),將訓(xùn)練效率提升了11倍以上。此外,阿里云為用戶提供了一站式的通用推理優(yōu)化工具,對(duì)算法模型進(jìn)行量化、剪枝、稀疏化、蒸餾等操作,可將推理效率提升6倍以上。

 

不久前,小鵬汽車(chē)基于飛天智算在烏蘭察布建設(shè)智算中心“扶搖”,算力規(guī)模達(dá)600PFLOPS,是國(guó)內(nèi)最大的自動(dòng)駕駛智算中心,將自動(dòng)駕駛模型訓(xùn)練提速近170倍。毫末智行基于飛天智算,實(shí)現(xiàn)128卡并行效率超96%,使自動(dòng)駕駛模型訓(xùn)練成本降低62%,訓(xùn)練速度提升110%,讓模型迭代周期大幅縮短。

 

在生命科學(xué)領(lǐng)域,深勢(shì)科技采用之后,將集群性能優(yōu)化提升超過(guò)100%,讓分子動(dòng)力學(xué)仿真模擬訓(xùn)練效率提升了5倍。在工業(yè)領(lǐng)域,智己汽車(chē)運(yùn)用高性能計(jì)算將工業(yè)仿真的效率提升了25%,智能駕駛訓(xùn)練效率提升了70%,加速了新車(chē)型的研發(fā)上市。山東德州電力通過(guò)AI進(jìn)行復(fù)核預(yù)測(cè),準(zhǔn)確率達(dá)到了98%,耗時(shí)從1小時(shí)縮短至幾分鐘。

 

在城市治理領(lǐng)域,四川成宜高速通過(guò)數(shù)字孿生進(jìn)行車(chē)路協(xié)同優(yōu)化使事故率降低60%。重慶水務(wù)通過(guò)遙感數(shù)據(jù)與仿真推演實(shí)現(xiàn)水利調(diào)度預(yù)測(cè)準(zhǔn)確性高達(dá)95%;南方電網(wǎng)與中國(guó)氣象局利用智算能力提升氣象預(yù)報(bào)的準(zhǔn)確性與穩(wěn)定性。

 

此外,飛天智算還支撐了阿里巴巴的人工智能實(shí)踐,支撐阿里AI日均1萬(wàn)億次調(diào)用,服務(wù)全球10億人。其中,拍立淘訓(xùn)練速度提升了200倍,10億張圖片全量訓(xùn)練時(shí)間從2.5個(gè)月縮短到8小時(shí)。達(dá)摩院大模型M6僅使用512張GPU,在10天內(nèi)就完成了10萬(wàn)億參數(shù)模型訓(xùn)練,能耗僅為GPT-3在同等參數(shù)規(guī)模下的1%。



評(píng)論


相關(guān)推薦

技術(shù)專(zhuān)區(qū)

關(guān)閉