英偉達算力壟斷能否被打破？各大廠商下場展開自研AI芯片競賽

作者：陳玲麗時間：2023-10-14 來源：電子產(chǎn)品世界

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

據(jù)市場研究公司Omdia披露，2023年第二季度，英偉達出貨了900噸H100 AI GPU。而一個帶有散熱器的H100 GPU的平均重量超過3公斤，因此英偉達在第二季度出貨了30多萬塊H100。

本文引用地址：http://www.butianyuan.cn/article/202310/451552.htm

以ChatGPT為首的生成式AI工具在全球范圍內(nèi)掀起了一股熱潮，拉升了對英偉達H100、A100、H800和A800等高性能GPU的需求，這使得該公司在全球AI GPU市場拿下達90%的市占率。隨著英偉達從生成式人工智能熱潮中獲利，該公司未來一年的出貨量將加速增長，預(yù)計今年有望銷售約3600噸H100 GPU，相當于大約120萬塊。

對抗英偉達

市面上的大模型越來越多，對算力的需求量爆炸式增長：對于云廠商來說，只能不斷的堆服務(wù)器；對于大模型開發(fā)者來說，對算力的需求也在趨緊。自英偉達發(fā)布大模型專用GPU并量產(chǎn)供貨后，據(jù)行業(yè)內(nèi)部消息稱，由于市場需求遠大于產(chǎn)能供應(yīng)，2023年英偉達H100的產(chǎn)量早已銷售一空，現(xiàn)在交錢訂購，至少要到2024年中才能拿到貨。

英偉達GPU芯片不光不愁賣，利潤率還高得嚇人。美國金融機構(gòu)Raymond James在報告中透露，H100芯片成本約3320美元，但英偉達對其客戶的批量價格仍然高達2.5萬-3萬美元。這一點從季度財報中也能得到充分印證，英偉達Q2財季凈利潤高達61.8億美元，同比上升843%。

截屏2023-10-13 23.56.27.png

英偉達井噴式的業(yè)績增長和長期展望表明AI需求并非曇花一現(xiàn)，AI芯片行業(yè)涵蓋了芯片設(shè)計、制造和應(yīng)用等多個領(lǐng)域。AI芯片的出現(xiàn)讓大規(guī)模的數(shù)據(jù)效率大大提升，技術(shù)升級帶來巨大的生產(chǎn)力飛躍，也正在對各個產(chǎn)業(yè)帶來革命性改變，甚至產(chǎn)業(yè)邏輯也需要被重估。

巨大的市場空間，以及超乎想象的前景，吸引全球眾多大型科技公司都在積極投入AI芯片研發(fā)與生產(chǎn)，將進一步刺激行業(yè)競爭。在此趨勢下，AI芯片的戰(zhàn)役正愈演愈烈。

不管是為了降低成本，還是減少對英偉達的依賴、提高議價能力，在AI芯片市場要對抗英偉達，其他廠商當前只能抓住英偉達的產(chǎn)能仍較低的窗口期進行布局。

AMD

作為英偉達的最大競爭對手，AMD發(fā)布了AI處理器MI300系列芯片，包括MI300A、MI300X兩個版本。其中MI300X是一款直接對標英偉達H100芯片，專門面向生成式AI推出的加速器，采用了8個GPU Chiplet加4個I/O內(nèi)存Chiplet的設(shè)計，總共12個5nm Chiplet封裝在一起，使其集成的晶體管數(shù)量達到了1530億，高于英偉達H100的800億晶體管。

截屏2023-10-13 23.59.50.png

與英偉達的H100芯片相比，MI300X的HBM密度是前者的2.4倍，帶寬則為前者的1.6倍，理論上可以運行比H100更大的模型。此外，AMD還發(fā)布了“AMD Instinct Platform”，集合了8個MI300X，可提供總計1.5TB的HBM3內(nèi)存。

蘇姿豐表示，隨著模型參數(shù)規(guī)模越來越大，就需要更多的GPU來運行。而隨著AMD芯片內(nèi)存的增加，開發(fā)人員將不再需要那么多數(shù)量的GPU，能夠為用戶節(jié)省成本。盡管AMD也在加速布局，但要量產(chǎn)，還要等到本財年第四季度。

英特爾

今年7月，英特爾面向中國市場推出了AI芯片Habana Gaudi 2，直接對標英偉達的A100，是專為訓練大語言模型而構(gòu)建，采用7nm制程，有24個張量處理器核心。數(shù)據(jù)顯示，從計算機視覺模型訓練到1760億參數(shù)的BLOOMZ推理，Gaudi 2每瓦性能約A100的2倍，模型訓練和部署的功耗降低約一半。

相比A100，Gaudi 2價格更有競爭力，且性能更高，接下來采用FP8軟件的Gaudi 2預(yù)計能夠提供比H100更高的性價比。值得注意的是，去年英特爾就已經(jīng)在海外發(fā)布了Gaudi 2。

而英特爾在舊金山舉行的“Intel Innovation”大會上透露，使用5nm工藝打造的下一代Gaudi 3將在性能方面大幅提升。其中，BF16下的性能提升了四倍、計算能力提升了2倍、網(wǎng)絡(luò)帶寬的1.5倍以及HBM容量的提升1.5倍。

在Gaudi 3之后，英特爾還計劃推出一個代號為Falcon Shores的繼任者。按照其最初規(guī)劃，F(xiàn)alcon Shores芯片為“XPU”設(shè)計，即集成CPU和GPU。但在上個月的財報會上，英特爾調(diào)整了Falcon Shores的計劃，將其重新定位為獨立GPU，并將于2025年發(fā)布。

其實在產(chǎn)品路線上，英特爾近年一直強調(diào)XPU，即多樣化、多組合的異構(gòu)計算。在AI相關(guān)的產(chǎn)品線上，既有集成AI加速器的CPU處理器、有GPU產(chǎn)品，以及Habana Gaudi系列代表的ASIC類型AI芯片。

IBM

IBM最近公布了一款新的模擬AI芯片，這款新芯片旨在解決生成式人工智能的主要問題之一：高能耗。通過集成大量的相變存儲單元實現(xiàn)更高效的計算和能效，據(jù)稱其能效比英偉達H100高出14倍。這對于大型模型的運行來說尤為重要，因為這些大型模型通常需要更多的能量來運行，意味著在相同的能量消耗下，它能夠完成更多的計算任務(wù)。

IBM聲稱其14nm模擬AI芯片每個組件可以編碼3500萬個相變存儲設(shè)備，可以建模多達1700萬個參數(shù)。同時，該芯片模仿了人腦的運作方式，微芯片直接在內(nèi)存中執(zhí)行計算，適用于節(jié)能語音識別和轉(zhuǎn)錄。隨著技術(shù)的不斷發(fā)展，預(yù)計未來模擬芯片有望成為人工智能領(lǐng)域的新趨勢。

亞馬遜

亞馬遜已擁有兩款A(yù)I專用芯片 —— 訓練芯片Trainium和推理芯片Inferentia。2018年底，AWS推出自研AI推理芯片Inferentia，可以以低成本在云端運行圖像識別、語音識別、自然語言處理、個性化和欺詐檢測等大規(guī)模機器學習推理應(yīng)用程序；2020年底，AWS推出專用于訓練機器學習模型的Trainium。

2023年初，專為人工智能打造的Inferentia 2發(fā)布，將計算性能提高了三倍，加速器總內(nèi)存提高了四分之一，吞吐量提高了四分之一，延遲提高了十分之一。Inf2實例（可通過芯片之間的直接超高速連接支持分布式推理）最多可支持1750億個參數(shù)，這使其成為大規(guī)模模型推理的有力競爭者。

在亞馬遜、微軟和谷歌這三家中，亞馬遜是唯一一家在服務(wù)器中提供兩種類型芯片（標準計算芯片和用于訓練與運行機器學習模型的專用芯片）的云提供商，其在2015年收購以色列芯片設(shè)計公司Annapurna Labs為這些努力奠定了基礎(chǔ)。

谷歌

早在2013年，谷歌就已秘密研發(fā)一款專注于AI機器學習算法的芯片，并將其用在內(nèi)部的云計算數(shù)據(jù)中心中，以取代英偉達的GPU。2016年5月，這款自研芯片公諸于世，即TPU：TPU可以為深度學習模型執(zhí)行大規(guī)模矩陣運算，例如用于自然語言處理、計算機視覺和推薦系統(tǒng)的模型，其最初專為谷歌的超級業(yè)務(wù)云計算數(shù)據(jù)中心而生。

實際上2020年，谷歌就在其數(shù)據(jù)中心部署了人工智能芯片TPU v4。不過直到今年4月4日，谷歌才首次公開了技術(shù)細節(jié) —— 相比TPU v3，TPU v4性能提升2.1倍；基于TPU v4的超級計算機擁有4096塊芯片，整體速度提高了約10倍。谷歌稱，對于類似大小的系統(tǒng)，谷歌能做到比Graphcore IPU Bow快4.3-4.5倍，比英偉達A100快1.2-1.7倍，功耗低1.3-1.9倍。

目前，谷歌已將負責AI芯片的工程團隊轉(zhuǎn)移到了谷歌云，旨在提高谷歌云出售AI芯片給租用其服務(wù)器的公司的能力，從而與更大的競爭對手微軟和亞馬遜云科技相抗衡。雖然英偉達提供的GPU算力優(yōu)勢在前，但AI行業(yè)頭部的OpenAI、Midjourney的算力系統(tǒng)并沒有采購英偉達的GPU，而是選擇了谷歌的方案。

微軟

據(jù)The Information報道，微軟計劃在下個月的年度開發(fā)者大會上推出該公司首款為人工智能設(shè)計的芯片。2019年，微軟就開始在內(nèi)部開發(fā)代號為“Athena”的芯片，目前芯片已經(jīng)提供給微軟和OpenAI進行測試。Athena是為訓練和運行大型語言模型（LLM）的數(shù)據(jù)中心服務(wù)器設(shè)計的，同時可支持推理，能為ChatGPT背后的所有AI軟件提供動力。

Athena的首個目標是為OpenAI提供算力引擎，以替代昂貴的英偉達A100/H100，如果與英偉達的產(chǎn)品擁有同等競爭力，每個芯片的成本將可以降低三分之一。若明年大規(guī)模推出，Athena將允許微軟內(nèi)部和OpenAI的團隊同時訓練和推理模型。

新聞中心

英偉達算力壟斷能否被打破？各大廠商下場展開自研AI芯片競賽

評論

相關(guān)推薦

技術(shù)專區(qū)