新聞中心

EEPW首頁(yè) > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > 英特爾(INTC.US)推出新一代AI芯片Gaudi 3 采用臺(tái)積電5nm工藝

英特爾(INTC.US)推出新一代AI芯片Gaudi 3 采用臺(tái)積電5nm工藝

作者: 時(shí)間:2024-04-10 來(lái)源:智通財(cái)經(jīng) 收藏

周二,(INTC.US)在其Intel Vision 2024產(chǎn)業(yè)創(chuàng)新大會(huì)上,面向客戶和合作伙伴作出了一系列重磅宣布。這些宣布包括推出全新的Gaudi 3人工智能加速器、全新的至強(qiáng)6品牌,以及包括開放、可擴(kuò)展系統(tǒng)和下一代產(chǎn)品在內(nèi)的全棧解決方案,還有多項(xiàng)戰(zhàn)略合作。

本文引用地址:http://butianyuan.cn/article/202404/457362.htm

據(jù)數(shù)據(jù)預(yù)測(cè),到2030年,全球半導(dǎo)體市場(chǎng)規(guī)模將達(dá)到1萬(wàn)億美元,人工智能將是主要的推動(dòng)力。然而,截至2023年,僅有10%的企業(yè)成功將其生成內(nèi)容(GC)項(xiàng)目商業(yè)化。的最新解決方案旨在幫助企業(yè)克服推廣項(xiàng)目時(shí)遇到的挑戰(zhàn),加快AIGC的商業(yè)應(yīng)用。

現(xiàn)有的Gaudi 2在2022年5月推出,并于2023年7月正式進(jìn)入中國(guó)市場(chǎng)。它以高性能、高效率和高性價(jià)比而著稱。該產(chǎn)品采用7nm工藝,具備24個(gè)可編程的Tenor張量核心、48MB的SRAM緩存、21個(gè)10萬(wàn)兆內(nèi)部互連以太網(wǎng)接口、96GB的HBM2E高帶寬內(nèi)存等,能夠滿足大規(guī)模語(yǔ)言模型和生成式AI模型的計(jì)算需求。

新一代Gaudi 3專為AI訓(xùn)練和推理設(shè)計(jì),采用了(TSM.US),帶來(lái)了兩倍的FP8 AI算力和四倍的BF16 AI算力,以及更高的網(wǎng)絡(luò)和內(nèi)存帶寬。與NVIDIA H100相比,Gaudi 3在流行的大型語(yǔ)言模型(LLM)上具有更高的推理性能和更快的訓(xùn)練速度。

預(yù)計(jì)將顯著縮短不同規(guī)模的Llama2模型和GPT-3模型的訓(xùn)練時(shí)間,并在Llama和Falcon等大型語(yǔ)言模型上提供出色的推理吞吐量和能效。支持多種形式因素,包括與OAM兼容的夾層卡、通用基板和PCIe擴(kuò)展卡,滿足各種應(yīng)用需求。

還提供開放的、基于社區(qū)的軟件支持,并通過(guò)標(biāo)準(zhǔn)以太網(wǎng)網(wǎng)絡(luò)實(shí)現(xiàn)從單節(jié)點(diǎn)到超級(jí)集群的靈活擴(kuò)展,以支持大規(guī)模的推理、微調(diào)和訓(xùn)練需求。

Gaudi 3的優(yōu)勢(shì)在于其高性能、經(jīng)濟(jì)實(shí)用、節(jié)能和快速部署能力,能夠有效滿足AI應(yīng)用在復(fù)雜性、成本效益、數(shù)據(jù)可靠性和合規(guī)性等方面的需求。該加速器預(yù)計(jì)將在2024年第二季度開始向OEM廠商出貨,包括戴爾、慧與、聯(lián)想和超威等品牌。

目前,英特爾Gaudi加速器已與NAVER、博世、IBM等眾多行業(yè)客戶和合作伙伴建立了合作關(guān)系。

此外,英特爾還宣布與Anyscale、DataStax等多家合作伙伴共同創(chuàng)建開放平臺(tái),推動(dòng)AI創(chuàng)新。該平臺(tái)旨在開發(fā)開放的、多供應(yīng)商支持的AIGC系統(tǒng),提供先進(jìn)的部署便利性、性能和價(jià)值。

英特爾計(jì)劃利用至強(qiáng)處理器和Gaudi加速器,推出AIGC流水線的參考實(shí)現(xiàn),發(fā)布技術(shù)概念框架,并進(jìn)一步加強(qiáng)Intel Tiber開發(fā)者云平臺(tái)基礎(chǔ)設(shè)施的功能,以助力企業(yè)在AI創(chuàng)新領(lǐng)域取得突破。

截至周二收盤,英特爾收漲0.92%,報(bào)38.33美元。




評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉