誰在挑戰(zhàn)英偉達的 AI 芯片霸主地位?
日前,英偉達的股價再次迎來上漲,總市值超過 2 萬億美元,成為繼蘋果(2.83 萬億美元)和微軟(3.06 萬億美元)之后第三家估值超過 2 萬億美元的美國公司[1]。
該公司之所以在過去一年里取得如此迅猛的市值增長,主要是因為其在 AI 芯片市場發(fā)揮的領(lǐng)先作用。
顯而易見,隨著以 ChatGPT 為代表的大語言模型的陸續(xù)出現(xiàn),引發(fā)了全世界生成式 AI 市場的蓬勃發(fā)展。
根據(jù)數(shù)據(jù)統(tǒng)計公司 Statista 提供的數(shù)據(jù),預(yù)計到 2024 年,生成式 AI 的市場規(guī)模將達到 666.2 億美元,到 2030 年市場規(guī)模有望達到 2070 億美元[2]。
要想構(gòu)建對于發(fā)展大語言模型來說至關(guān)重要,并且用于深度學(xué)習、大規(guī)模模擬和并行處理的應(yīng)用程序,少不了使用由英偉達開發(fā)的 GPU 芯片。
圖丨英偉達發(fā)布的 H100 芯片(來源:英偉達官網(wǎng))
不過,由于種種原因,自 2018 年以來全球芯片一直存在短缺的現(xiàn)象,這給 AI、電子、汽車、醫(yī)療等行業(yè)的正常生產(chǎn)帶來沉重打擊。
一面是 GPU 短缺,一面是對生成式 AI 服務(wù)需求的持續(xù)增長,這種供不應(yīng)求的態(tài)勢也讓英偉達于 2022 年發(fā)布的 H100 芯片極其昂貴,并且,為打造最好的生成式 AI 產(chǎn)品,包括騰訊、微軟、Meta 等在內(nèi)的中美科技公司都在追捧這款 AI 芯片。
圖丨預(yù)計 H100 已于 2023 年交付給部分買家(來源:CB Insights)
其中,需要說明的是,H100 是英偉達繼 A100 之后推出的最新旗艦 AI 芯片,它作為 AI 基礎(chǔ)設(shè)施的核心,具有強大的計算能力,能夠幫助訓(xùn)練和部署可以生成文本、圖像和音頻的大語言模型。
另外,根據(jù) CB Insights 發(fā)布的 2024 年生成式 AI 預(yù)測報告,一顆 H100 的制造成本大約為 3320 美元,但平均售價已經(jīng)達到 3 萬美元,最高售價甚至一度達到將近 10 萬美元[3]。
圖丨H100 售價大幅上漲(來源:CB Insights)
從另一視角來看,這種囤積芯片的行為,也體現(xiàn)出大型科技公司對英偉達的過度依賴。
在意識到這一點以后,亞馬遜、谷歌、微軟和 Meta 等科技巨頭紛紛構(gòu)建自己的 AI 芯片,以及通過投資 AI 初創(chuàng)企業(yè)等舉措,試圖擺脫上述依賴,并開始試圖搶占芯片市場份額。
具體來說,谷歌部署 TPU(Tensor Processing Units,張量處理器)已經(jīng)有 8 年時間。
2017 年,該公司發(fā)布一款新的專用集成電路產(chǎn)品 TPU,能夠支持 AI 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練以及訓(xùn)練后的推理。
基于數(shù)以萬計的 TPU,谷歌成功地構(gòu)建了自己的 AI 產(chǎn)品,其中就有聊天機器人工具 Bard。
并且,包括 Cohere 在內(nèi)的其他 AI 公司也在通過谷歌的云服務(wù)使用這些芯片,并構(gòu)建類似的技術(shù)。
緊隨谷歌之后的亞馬遜,分別于 2019 年和 2021 年發(fā)布了 Inferentia 和 Trainium 兩款芯片。
前者可提供低成本、高通量的機器學(xué)習推理,后者旨在訓(xùn)練機器學(xué)習模型,包括用于生成式 AI 的模型。
另外,該公司還于 2023 年 9 月給 Anthropic 這家 AI 公司注入 40 億美元的資金,后者將使用亞馬遜的定制芯片來構(gòu)建 AI 模型。
亞馬遜 CEO 安迪·賈西(Andy Jassy)曾在該公司 2023 年第 4 季度財報電話會議中表示:“要獲得每個人都想要的 GPU 數(shù)量確實很困難。
因此,這也是亞馬遜的 Inferentia 和 Trainium 芯片對人們?nèi)绱司哂形Φ囊粋€重要原因?!?/span>
2023 年 5 月和 11 月,Meta 和微軟兩家公司分別發(fā)布了定制 AI 芯片 MTIA 和 Maia 100。
前者是針對 Meta 內(nèi)部推理工作負載定制的,在性能、延遲和效率方面都具有良好的表現(xiàn),后者使用 5 納米工藝制造,能很好地應(yīng)用于大語言模型的訓(xùn)練和推理。
據(jù)了解,在開發(fā)和測試 Maia 100 的過程中,微軟不僅和 OpenAI 開展了廣泛合作,還將基于該產(chǎn)品為后者的 AI 模型提供優(yōu)化和改進。
事實上,上述公司開發(fā)與 AI 有關(guān)的定制芯片的行為,有助于它們控制成本、消除芯片短缺,并最終向使用其云服務(wù)的企業(yè)出售芯片。
正如 AI 初創(chuàng)公司 Nervana 的 CEO 兼聯(lián)合創(chuàng)始人納文·拉奧(Naveen Rao)所言:“理論上,如果它們能夠達到足夠高的產(chǎn)量并降低成本,這些公司應(yīng)該能夠提供比英偉達更好的產(chǎn)品?!?/span>
不過,從目前來看,它們在短期之內(nèi)很難超越英偉達,即便后者開發(fā)的芯片價格昂貴,但卻是市場上性能最高、能與更多軟件完美配合的芯片之一。
亞馬遜 AWS 計算和網(wǎng)絡(luò)副總裁大衛(wèi)·布朗(David Brown)對媒體表示:“我們還有許多年的艱苦創(chuàng)新要做?!?/span>
我們看到各科技公司競相開發(fā)定制芯片,但明顯的是,英偉達也不會停滯不前。
運營/排版:何晨龍
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。