博客專欄

EEPW首頁(yè) > 博客 > 誰(shuí)在挑戰(zhàn)英偉達(dá)的 AI 芯片霸主地位?

誰(shuí)在挑戰(zhàn)英偉達(dá)的 AI 芯片霸主地位?

發(fā)布人:深科技 時(shí)間:2024-02-27 來(lái)源:工程師 發(fā)布文章

日前,英偉達(dá)的股價(jià)再次迎來(lái)上漲,總市值超過(guò) 2 萬(wàn)億美元,成為繼蘋果(2.83 萬(wàn)億美元)和微軟(3.06 萬(wàn)億美元)之后第三家估值超過(guò) 2 萬(wàn)億美元的美國(guó)公司[1]。


該公司之所以在過(guò)去一年里取得如此迅猛的市值增長(zhǎng),主要是因?yàn)槠湓?AI 芯片市場(chǎng)發(fā)揮的領(lǐng)先作用。


顯而易見(jiàn),隨著以 ChatGPT 為代表的大語(yǔ)言模型的陸續(xù)出現(xiàn),引發(fā)了全世界生成式 AI 市場(chǎng)的蓬勃發(fā)展。


根據(jù)數(shù)據(jù)統(tǒng)計(jì)公司 Statista 提供的數(shù)據(jù),預(yù)計(jì)到 2024 年,生成式 AI 的市場(chǎng)規(guī)模將達(dá)到 666.2 億美元,到 2030 年市場(chǎng)規(guī)模有望達(dá)到 2070 億美元[2]。


要想構(gòu)建對(duì)于發(fā)展大語(yǔ)言模型來(lái)說(shuō)至關(guān)重要,并且用于深度學(xué)習(xí)、大規(guī)模模擬和并行處理的應(yīng)用程序,少不了使用由英偉達(dá)開(kāi)發(fā)的 GPU 芯片。


圖片

圖丨英偉達(dá)發(fā)布的 H100 芯片(來(lái)源:英偉達(dá)官網(wǎng))


不過(guò),由于種種原因,自 2018 年以來(lái)全球芯片一直存在短缺的現(xiàn)象,這給 AI、電子、汽車、醫(yī)療等行業(yè)的正常生產(chǎn)帶來(lái)沉重打擊。


一面是 GPU 短缺,一面是對(duì)生成式 AI 服務(wù)需求的持續(xù)增長(zhǎng),這種供不應(yīng)求的態(tài)勢(shì)也讓英偉達(dá)于 2022 年發(fā)布的 H100 芯片極其昂貴,并且,為打造最好的生成式 AI 產(chǎn)品,包括騰訊、微軟、Meta 等在內(nèi)的中美科技公司都在追捧這款 AI 芯片。


圖片

圖丨預(yù)計(jì) H100 已于 2023 年交付給部分買家(來(lái)源:CB Insights)


其中,需要說(shuō)明的是,H100 是英偉達(dá)繼 A100 之后推出的最新旗艦 AI 芯片,它作為 AI 基礎(chǔ)設(shè)施的核心,具有強(qiáng)大的計(jì)算能力,能夠幫助訓(xùn)練和部署可以生成文本、圖像和音頻的大語(yǔ)言模型。


另外,根據(jù) CB Insights 發(fā)布的 2024 年生成式 AI 預(yù)測(cè)報(bào)告,一顆 H100 的制造成本大約為 3320 美元,但平均售價(jià)已經(jīng)達(dá)到 3 萬(wàn)美元,最高售價(jià)甚至一度達(dá)到將近 10 萬(wàn)美元[3]。


圖片

圖丨H100 售價(jià)大幅上漲(來(lái)源:CB Insights)


從另一視角來(lái)看,這種囤積芯片的行為,也體現(xiàn)出大型科技公司對(duì)英偉達(dá)的過(guò)度依賴。


在意識(shí)到這一點(diǎn)以后,亞馬遜、谷歌、微軟和 Meta 等科技巨頭紛紛構(gòu)建自己的 AI 芯片,以及通過(guò)投資 AI 初創(chuàng)企業(yè)等舉措,試圖擺脫上述依賴,并開(kāi)始試圖搶占芯片市場(chǎng)份額。


具體來(lái)說(shuō),谷歌部署 TPU(Tensor Processing Units,張量處理器)已經(jīng)有 8 年時(shí)間。


2017 年,該公司發(fā)布一款新的專用集成電路產(chǎn)品 TPU,能夠支持 AI 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練以及訓(xùn)練后的推理。


基于數(shù)以萬(wàn)計(jì)的 TPU,谷歌成功地構(gòu)建了自己的 AI 產(chǎn)品,其中就有聊天機(jī)器人工具 Bard。


并且,包括 Cohere 在內(nèi)的其他 AI 公司也在通過(guò)谷歌的云服務(wù)使用這些芯片,并構(gòu)建類似的技術(shù)。


緊隨谷歌之后的亞馬遜,分別于 2019 年和 2021 年發(fā)布了 Inferentia 和 Trainium 兩款芯片。


前者可提供低成本、高通量的機(jī)器學(xué)習(xí)推理,后者旨在訓(xùn)練機(jī)器學(xué)習(xí)模型,包括用于生成式 AI 的模型。


另外,該公司還于 2023 年 9 月給 Anthropic 這家 AI 公司注入 40 億美元的資金,后者將使用亞馬遜的定制芯片來(lái)構(gòu)建 AI 模型。


亞馬遜 CEO 安迪·賈西Andy Jassy)曾在該公司 2023 年第 4 季度財(cái)報(bào)電話會(huì)議中表示:“要獲得每個(gè)人都想要的 GPU 數(shù)量確實(shí)很困難。


因此,這也是亞馬遜的 Inferentia 和 Trainium 芯片對(duì)人們?nèi)绱司哂形Φ囊粋€(gè)重要原因?!?/span>


2023 年 5 月和 11 月,Meta 和微軟兩家公司分別發(fā)布了定制 AI 芯片 MTIA 和 Maia 100。


前者是針對(duì) Meta 內(nèi)部推理工作負(fù)載定制的,在性能、延遲和效率方面都具有良好的表現(xiàn),后者使用 5 納米工藝制造,能很好地應(yīng)用于大語(yǔ)言模型的訓(xùn)練和推理。


據(jù)了解,在開(kāi)發(fā)和測(cè)試 Maia 100 的過(guò)程中,微軟不僅和 OpenAI 開(kāi)展了廣泛合作,還將基于該產(chǎn)品為后者的 AI 模型提供優(yōu)化和改進(jìn)。


事實(shí)上,上述公司開(kāi)發(fā)與 AI 有關(guān)的定制芯片的行為,有助于它們控制成本、消除芯片短缺,并最終向使用其云服務(wù)的企業(yè)出售芯片。


正如 AI 初創(chuàng)公司 Nervana 的 CEO 兼聯(lián)合創(chuàng)始人納文·拉奧(Naveen Rao)所言:“理論上,如果它們能夠達(dá)到足夠高的產(chǎn)量并降低成本,這些公司應(yīng)該能夠提供比英偉達(dá)更好的產(chǎn)品?!?/span>


不過(guò),從目前來(lái)看,它們?cè)诙唐谥畠?nèi)很難超越英偉達(dá),即便后者開(kāi)發(fā)的芯片價(jià)格昂貴,但卻是市場(chǎng)上性能最高、能與更多軟件完美配合的芯片之一。


亞馬遜 AWS 計(jì)算和網(wǎng)絡(luò)副總裁大衛(wèi)·布朗(David Brown)對(duì)媒體表示:“我們還有許多年的艱苦創(chuàng)新要做。”


我們看到各科技公司競(jìng)相開(kāi)發(fā)定制芯片,但明顯的是,英偉達(dá)也不會(huì)停滯不前。


參考資料:1.https://www.theverge.com/2024/2/1/24058186/ai-chips-meta-microsoft-google-nvidia2.https://www.statista.com/outlook/tmo/artificial-intelligence/generative-ai/worldwide3.https://www.cbinsights.com/research/report/generative-ai-predictions-2024/https://www.linkedin.com/pulse/amazons-strategic-move-custom-chips-excel-generative-ai-race-greyb-nrblfhttps://tickernerd.com/earnings-call/amazon/https://www.forbes.com/sites/moorinsights/2017/05/22/google-cloud-tpu-strategic-implications-for-google-nvidia-and-the-machine-learning-industry/?sh=1fc67e963af7https://www.zdnet.com/article/microsoft-unveils-first-ai-chip-maia-100-and-cobalt-cpu/https://about.fb.com/news/2023/05/metas-infrastructure-for-ai/https://medium.com/@theeyessource/unveiling-microsofts-groundbreaking-chips-the-maia-100-ai-accelerator-and-cobalt-100-cpu-a00e8ab195echttps://www.theverge.com/2023/11/15/23960345/microsoft-cpu-gpu-ai-chips-azure-maia-cobalt-specifications-cloud-infrastructurehttps://unu.edu/article/when-chips-are-down-increasingly-cutthroat-political-economy-computer-chipshttps://www.cnbc.com/2023/04/14/nvidias-h100-ai-chips-selling-for-more-than-40000-on-ebay.htmlhttps://www.businessinsider.com/meta-zuckerberg-stockpile-tech-hottest-commodity-nvidia-chips-semiconductors-2024-1https://www.nytimes.com/2024/01/29/technology/ai-chips-nvidia-amazon-google-microsoft-meta.htmlhttps://www.businesstimes.com.sg/companies-markets/telcos-media-tech/nvidia-market-cap-threatens-alphabet-after-overtaking-amazonhttps://dig.watch/updates/amazon-introduces-its-next-gen-ai-chip-intensifying-rivalry-with-microsoft-and-google
運(yùn)營(yíng)/排版:何晨龍



*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。



關(guān)鍵詞: 英偉達(dá)

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉