Habana Labs宣布推出Gaudi?人工智能訓(xùn)練處理器
2019年6月19日,中國(guó)北京——行業(yè)領(lǐng)先的人工智能處理器開(kāi)發(fā)商Habana Labs宣布推出Habana Gaudi?人工智能訓(xùn)練處理器,基于Gaudi的訓(xùn)練系統(tǒng)實(shí)現(xiàn)了比擁有相同數(shù)量的GPU系統(tǒng)高四倍的處理能力。
Gaudi?處理器的創(chuàng)新架構(gòu)可實(shí)現(xiàn)訓(xùn)練系統(tǒng)性能的近線性擴(kuò)展,即使是在較小Batch Size的情況下,也能保持高計(jì)算力。因此,基于Gaudi?處理器的訓(xùn)練性能可實(shí)現(xiàn)從單一設(shè)備擴(kuò)展至由數(shù)百個(gè)處理器搭建的大型系統(tǒng)的線性擴(kuò)展。
除了領(lǐng)先的性能,Gaudi?處理器還為人工智能訓(xùn)練帶來(lái)了另一項(xiàng)“行業(yè)第一”。該人工智能處理器片上集成了 RDMA over Converged Ethernet (RoCE v2) 功能,從而讓人工智能系統(tǒng)能夠使用標(biāo)準(zhǔn)以太網(wǎng)擴(kuò)展至任何規(guī)模。憑借Gaudi?處理器,Habana Labs的客戶亦可利用標(biāo)準(zhǔn)以太網(wǎng)交換進(jìn)行人工智能訓(xùn)練系統(tǒng)的縱向擴(kuò)展和橫向擴(kuò)展。同時(shí),以太網(wǎng)交換機(jī)已被數(shù)據(jù)中心應(yīng)用于計(jì)算系統(tǒng)和存儲(chǔ)系統(tǒng)的擴(kuò)展中,在速度和端口數(shù)方面可提供幾乎無(wú)限的可擴(kuò)展性。另外,與Habana的標(biāo)準(zhǔn)設(shè)計(jì)相比,基于GPU的系統(tǒng)依賴于專有的系統(tǒng)接口,對(duì)系統(tǒng)設(shè)計(jì)人員來(lái)說(shuō),這從本質(zhì)上限制了可擴(kuò)展性和選擇性。
Linley集團(tuán)首席分析師Linley Gwennap評(píng)論說(shuō):“Habana Labs推出新產(chǎn)品,其產(chǎn)品組合迅速地從推理處理器擴(kuò)展到訓(xùn)練處理器,涵蓋了神經(jīng)網(wǎng)絡(luò)的所有功能。在眾多的人工智能訓(xùn)練加速器產(chǎn)品中,Gaudi?處理器能夠提供強(qiáng)大的性能,達(dá)到行業(yè)領(lǐng)先的能效水平。作為首款集成100G以太網(wǎng)鏈路并支持RoCE的人工智能處理器,Gaudi?為使用行業(yè)標(biāo)準(zhǔn)組件構(gòu)建而成的大型加速器集群提供了強(qiáng)大的支持。”
Gaudi?人工智能訓(xùn)練處理器配備32GB HBM-2內(nèi)存,目前提供兩種規(guī)格:
·HL-200 - PCIe卡,設(shè)有8個(gè)100Gb以太網(wǎng)端口;
·HL-205 - 基于OCP-OAM標(biāo)準(zhǔn)的子卡,設(shè)有10個(gè)100Gb以太網(wǎng)端口或20個(gè)50Gb以太網(wǎng)端口。
另外,Habana推出了一款名為HLS-1的8-Gaudi系統(tǒng),配備了8個(gè)HL-205子卡、PCIe外部主機(jī)連接器和24個(gè)用于連接現(xiàn)有以太網(wǎng)交換機(jī)的100Gbps以太網(wǎng)端口,讓客戶能夠通過(guò)在19英寸標(biāo)準(zhǔn)機(jī)柜中部署多個(gè)HLS-1系統(tǒng)實(shí)現(xiàn)性能擴(kuò)展。
Gaudi?處理器是Habana Labs繼去年推出Goya?人工智能推理處理器后的第二款人工智能專用處理器。Goya?處理器自2018年第四季度開(kāi)始發(fā)貨,并向業(yè)界展示了領(lǐng)先的推理性能,可實(shí)現(xiàn)業(yè)界最高的吞吐量、功效比(圖片/每秒瓦)以及實(shí)時(shí)。
Habana Labs首席執(zhí)行官David Dahan 表示:“人工智能模型訓(xùn)練所需的計(jì)算能力每年呈指數(shù)增長(zhǎng)。因此,提高生產(chǎn)率和可擴(kuò)展性,解決數(shù)據(jù)中心和云計(jì)算對(duì)計(jì)算能力的迫切需求成為至關(guān)重要的任務(wù)。憑借Gaudi?處理器的創(chuàng)新架構(gòu),Habana Labs帶來(lái)了業(yè)界最高的性能,同時(shí)集成了標(biāo)準(zhǔn)以太網(wǎng),進(jìn)而實(shí)現(xiàn)無(wú)限可擴(kuò)展性。Gaudi?處理器將打破人工智能訓(xùn)練處理器領(lǐng)域的現(xiàn)狀?!?/p>
Facebook技術(shù)和戰(zhàn)略總監(jiān)Vijay Rao表示:“Facebook正在尋找開(kāi)放的平臺(tái)以進(jìn)行行業(yè)創(chuàng)新融合。我們很高興看到Habana Labs的Goya?人工智能推理處理器為Glow機(jī)器學(xué)習(xí)編譯器實(shí)現(xiàn)后端開(kāi)源,并且Gaudi?人工智能訓(xùn)練處理器采用OCP加速器模塊 (OAM) 規(guī)范?!?/p>
Gaudi?是一款完全可編程且可定制的處理器,搭載第二代Tensor處理核 (TPC?) 并集成開(kāi)發(fā)工具、庫(kù)和編譯器,共同提供全面而靈活的解決方案。此外,Habana Labs的SynapseAI?軟件棧包含一個(gè)豐富的內(nèi)核庫(kù)和開(kāi)放工具鏈,以供客戶添加專有內(nèi)核。
Habana Labs將于2019年下半年面向特定客戶提供Gaudi?人工智能訓(xùn)練處理器的樣品。
評(píng)論