新聞中心

EEPW首頁 > 編輯觀點 > AI時代打造“萬億俱樂部”新成員 —— 英偉達,能否笑到最后?

AI時代打造“萬億俱樂部”新成員 —— 英偉達,能否笑到最后?

作者:陳玲麗 時間:2023-06-13 來源:電子產(chǎn)品世界 收藏

5月30日,總市值突破萬億美元,成為全球首家市值超過萬億美元的芯片公司,也是繼蘋果、微軟、谷歌、亞馬遜之后,第五家邁入“萬億俱樂部”的美國科技巨頭。

本文引用地址:http://www.butianyuan.cn/article/202306/447632.htm

截屏2023-06-13 11.46.24.png

除了外,還有兩家市值超Meta Platforms和Tesla也曾經(jīng)短暫地突破了萬億美元的大關(guān),但后來它們的市值又回落到了千億美元級別。目前已經(jīng)達到萬億美元市值的公司:

  • 蘋果公司:2.79 萬億美元

  • 微軟公司:2.47 萬億美元

  • 谷歌母公司Alphabet:1.58 萬億美元

  • 亞馬遜公司:1.25 萬億美元

  • 公司:1 萬億美元

人工智能技術(shù)的蓬勃發(fā)展推動英偉達的股價在不到八個月的時間內(nèi)翻了三倍,使得該公司在1999年上市后約24年后達到了萬億美元的市值,而蘋果公司則花了38年才達到這一里程碑。

“通用芯片”之夢

時代誕生新的「摩爾定律」:所需算力每100天將翻一倍。算力就像曾經(jīng)的石油,成為新時代進程最稀缺的資源。

英偉達已成為全球最大的新一代產(chǎn)品專用芯片制造商,因為ChatGPT的快速爆紅讓全球幾乎每家公司都在把AI融入其運營。而英偉達之所以能獨領(lǐng)風騷,一個關(guān)鍵原因在于其廣受人工智能領(lǐng)域追捧的芯片產(chǎn)品 —— 即A100芯片及更高一代的H100芯片,目前這些高端芯片及相應(yīng)的顯卡已是一卡難求。

有業(yè)內(nèi)人士稱,確有英偉達急件訂單大量涌入臺積電,包括英偉達AI芯片H100、A100、H800、A800,將臺積電5nm工藝平臺的產(chǎn)能利用率推高至接近滿負荷。臺積電以「超級急件」生產(chǎn)英偉達,訂單已至年底。

為何只有英偉達的芯片成為人工智能領(lǐng)域獨一無二的玩家?向來在顯卡稱霸的公司為何能在深度學習和人工智能領(lǐng)域脫穎而出?

1999年,初露頭角的英偉達首次推出了GPU這一概念。在此之前,包括英特爾在內(nèi)的CPU廠商都認為將圖形工作獨立到另一附屬處理器上的想法十分雞肋,GPU并沒有得到多少市場空間。

而微軟開發(fā)出了Direct X這一標準化的API圖形接口,大量的圖形功能從CPU里面移植出來,轉(zhuǎn)到GPU之上。此后,微軟又引入統(tǒng)一渲染技術(shù),即讓GPU將圖形繪制的頂點計算和之后的渲染兩個步驟進行合并。

在微軟統(tǒng)一渲染架構(gòu)之后,英偉達果斷的把自己從前的GPU架構(gòu)推倒重來:其GPU流處理器被進行了細致的分組,變成一個個小型流處理器且能單獨運行,解決了流處理器此前被綁定無法獨立運行而被迫閑置的問題。

截屏2023-06-13 11.49.42.png

這奠定了英偉達后來革命性CUDA架構(gòu)(Compute Unified Device Architecture,通用并行計算架構(gòu))的出世。由于英偉達的流處理器是很獨立且標準的單元,極易控制和調(diào)度,這讓原本只能串行處理的任務(wù)可以被并行處理,這讓編程難度大大降低。

英偉達又在2017年引入了Tensor Core計算單元概念,其專門為深度學習而設(shè)計,支持更低精度的運算從而大幅節(jié)省了模型算力。這一專用的加速單元很大程度上排擠了CUDA處理深度學習的空間,但也同時打了英偉達競爭對手一個措手不及,讓AI專用芯片也不再吸引人。

真正讓英偉達脫穎而出的,還是其將GPU用在了通用計算上 —— 通過CUDA編程,能夠讓多個GPU并行運算,從而大幅提升計算性能。讓GPU脫離了圖像處理的單一用途,開始真正具備通用計算的能力,并逐步被用到了AI的深度學習之中。

事實上,當AI一瞬間爆發(fā),行業(yè)內(nèi)的企業(yè)無奈發(fā)現(xiàn),GPU是簡單高效運行生成式AI模型的最好選擇。一個本用來玩游戲的GPU不太可能切換去跑AI程序,目前只有英偉達的GPU能夠做到運行AI模型。

財報證實,GPU巨頭英偉達已占據(jù)AI芯片供應(yīng)商中的領(lǐng)先地位,在其財報電話會上稱,眾多云公司競相部署AI芯片,令其業(yè)績的“大幅增長”來自于數(shù)據(jù)中心業(yè)務(wù),個人電腦GPU需求穩(wěn)固。

除了強勁的財務(wù)表現(xiàn)外,英偉達還在不斷拓展其在AI領(lǐng)域的影響力和合作關(guān)系,面對外界龐大的AI芯片需求,英偉達已經(jīng)不滿足于芯片設(shè)計者的角色,而是將觸角伸向基礎(chǔ)服務(wù)設(shè)施領(lǐng)域。

在GTC大會上,英偉達又推出了一項新的AI超級計算服務(wù) —— DGX Cloud 云服務(wù),可以讓企業(yè)快速訪問為生成式人工智能和其他開創(chuàng)性應(yīng)用訓練高級模型所需的基礎(chǔ)設(shè)施和軟件。簡單理解,就是通過這個云平臺,用戶可以直接調(diào)用英偉達的超級計算機DGX的AI算力,而不是去“堆”A100、H100。

目前,英偉達與微軟 Azure、谷歌 OCP、Oracle OCI等其他云廠商一起托管DGX Cloud基礎(chǔ)設(shè)施。黃仁勛還表示,未來中國也可以采用這項服務(wù),中國創(chuàng)業(yè)公司可以期待阿里、百度、騰訊提供的底層算力服務(wù)。

同時,英偉達還發(fā)布了“NVIDIA AI Foundations”,為需要定制大型語言模型和生成AI的客戶提供幫助。這些客戶可以通過英偉達的DGX Cloud AI超級計算機云服務(wù)直接訓練和訪問大型模型產(chǎn)品,無需自己配置超級計算機服務(wù)。

除了計算中心,英偉達也將觸角伸到了芯片代工制造領(lǐng)域:與臺積電、ASML和新思科技等芯片代工制造企業(yè)合作,推出一款新的計算光刻應(yīng)用,可大幅降低芯片代工企業(yè)在光刻工藝上的芯片消耗時間和能力,為生產(chǎn)2nm芯片和未來更先進的芯片做好技術(shù)儲備。

以臺積電為例,使用500臺裝有H100芯片的DGX即可替代需要4萬個用驅(qū)動計算光刻的CPU服務(wù)器,可以將工廠的性能從35兆瓦直接降至5兆瓦,預(yù)計臺積電將于6月開始準備生產(chǎn)這種技術(shù)。

誰能打敗英偉達?

AMD最新AI芯片Instinct MI3000預(yù)計將于今年推出;最近市場還傳出微軟與AMD合作開發(fā)新款A(yù)I芯片,加快推出相關(guān)產(chǎn)品,為自身及市場提供英偉達GPU之外的另一種底層硬件選擇。

英特爾披露了旨在為AI技術(shù)提供動力的產(chǎn)品路線圖細節(jié),下一代GPU“Falcon Shores”芯片預(yù)計2025年推出;Meta公司也披露其正在構(gòu)建首款專門用于運行AI模型的定制芯片MTIA(Meta Training and Inference Accelerator)芯片,使用名為RISC-V的開源芯片架構(gòu),預(yù)計于2025年問世。

但與英偉達相比,AMD和英特爾的競爭實力要弱得多。例如,英偉達的數(shù)據(jù)中心業(yè)務(wù)在第一季度增長了14%,AMD數(shù)據(jù)中心業(yè)務(wù)增長持平,英特爾的AI與數(shù)據(jù)中心業(yè)務(wù)卻下降了39%。

據(jù)The Information報道,微軟正在秘密研發(fā)自己的AI芯片,代號雅典娜(Athena)。據(jù)悉,這些芯片是為訓練大語言模型等軟件而設(shè)計,首個目標是為OpenAI提供算力引擎。微軟希望這款芯片的性能比其斥資數(shù)億美元從其他供應(yīng)商側(cè)購置的芯片性能更優(yōu),這樣就可以為價值高昂的人工智能工作節(jié)省成本。至于推出時間,尚未有明確說法。

更別提AI芯片領(lǐng)域的競爭本就愈發(fā)激烈,不少初創(chuàng)公司正在專門為AI開發(fā)新型芯片,高通和蘋果等專注于移動設(shè)備的公司也在不斷推動這項技術(shù),谷歌和亞馬遜都在設(shè)計自己的人工智能芯片。

截屏2023-06-13 11.51.59.png

制造一個好的AI芯片,至少需要數(shù)年的時間,而英偉達目前已經(jīng)取得了巨大的領(lǐng)先優(yōu)勢。但是值得注意的是,前文已經(jīng)說了,AI所需算力每100天將翻一倍。如果不在當前的軟硬件基礎(chǔ)上做出更多創(chuàng)新,人類目前的算力發(fā)展不可能達到如此恐怖的需求增長。顯然,英偉達雖然強大,但并沒有能力覆蓋整個市場。

據(jù)報道,微軟等客戶對英偉達A100/H100芯片訂單需求追到了2024年,微軟為了給必應(yīng)聊天機器人與Office365留下足夠資源,內(nèi)部已陷入AI服務(wù)器短缺,甚至必須對GPU采取“配額供給”機制。

這很像2021-2022年席卷全球的缺芯潮:成千上萬的AI初創(chuàng)公司、甚至是大型云服務(wù)商,將如當年因缺少關(guān)鍵芯片而停產(chǎn)的車企,或因缺少GPU面臨相似困境。

此外,英偉達還要應(yīng)對全球芯片供應(yīng)短缺、地緣政治風險、監(jiān)管審查等問題。例如,英偉達去年宣布以400億美元收購ARM,但該交易遭到了多國反壟斷機構(gòu)和ARM客戶的質(zhì)疑和反對。

在資源緊缺的極度焦慮之下,必將開始尋求其他品牌的替代品。疊加全球供應(yīng)鏈安全的考量,AI芯片市場從過去的英偉達一家獨大,或慢慢轉(zhuǎn)變?yōu)槿盒鄹顡?jù)。

總體看來,在這場競賽中亞馬遜似乎占據(jù)了先機,已擁有兩款A(yù)I專用芯片 —— 訓練芯片Trainium和推理芯片Inferentia;谷歌則擁有第四代TPU(張量處理單元)。相比之下,微軟等還在很大程度上依賴于英偉達、AMD和英特爾等芯片制造商的現(xiàn)成或定制硬件。

結(jié)語

從長遠來看,未來大模型的研發(fā)和部署是必然趨勢,每個大模型訓練和部署的背后,都需要成千上萬個GPU芯片支持。隨著谷歌、微軟、亞馬遜等科技巨頭開始設(shè)計自己的定制芯片,競爭也在加劇,并有望像GPU打敗CPU一樣,改寫黃仁勛在AI芯片領(lǐng)域的絕對主導地位。

算力是運行模型的基礎(chǔ),場景是運用模型的環(huán)境。To C的大模型是大廠的主戰(zhàn)場,但它們在To B上卻無法做到贏家通吃。要將“ChatGPT”送入千行百業(yè),在通用大模型之外,低算力消耗的專用“小”模型也將誕生更多機會。

目前,AI場景并未固定,而是不斷擴展和演進。未來,隨著新的應(yīng)用場景涌現(xiàn),也許會催生新的細分需求,從而影響芯片產(chǎn)品的形態(tài)。因此,對于國內(nèi)創(chuàng)業(yè)公司而言,通過觸達更多的實際使用場景來夯實自己在芯片領(lǐng)域的算力優(yōu)勢,打造其他競爭對手難以逾越的技術(shù)障礙,將是新的成長機會。



關(guān)鍵詞: AI 英偉達

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉