?GPU市場開始分化,中國迎來更多商機(jī)
最近,關(guān)于 GPU,或與 GPU 相關(guān)的消息不斷,例如,OpenAI 正探索自研 AI 芯片,微軟將在今年 11 月推出自研的 AI 芯片,三星推出 Exynos 2400 處理器,自研的 GPU 再次升級,等等。這些都是市場和廠商尋求更多變化的體現(xiàn)。
本文引用地址:http://butianyuan.cn/article/202310/451436.htm在全球半導(dǎo)體行業(yè)整體不景氣的 2023 年,只有 AI 服務(wù)器系統(tǒng)和相關(guān)芯片一枝獨秀,而 AI 服務(wù)器使用的處理器多數(shù)是 GPU,不幸的是(對于多數(shù) GPU 廠商而言),在這一僅有的優(yōu)秀市場,多數(shù)廠商都只能喝湯,有的甚至連湯都喝不上,唯一大口吃肉的是英偉達(dá)。據(jù) visualcapitalist 統(tǒng)計,在全球現(xiàn)有 1500 億美元的 AI 市場中,英偉達(dá)已經(jīng)占有 80% 以上,AMD 和英特爾遠(yuǎn)遠(yuǎn)落后。更重要的是,這一市場規(guī)模每天都在增長,無論是 GPU 芯片廠商,還是系統(tǒng)和互聯(lián)網(wǎng)大廠,都不想看到英偉達(dá)繼續(xù)擴(kuò)大市場占有率。
除了 AI 應(yīng)用,GPU 在傳統(tǒng)的圖形處理應(yīng)用方面依然發(fā)揮著關(guān)鍵作用,無論是 PC,還是手機(jī),該市場空間依然巨大。在手機(jī)應(yīng)用市場,IP 大廠 Arm 和 Imagination Technologies 占主導(dǎo)地位,高通雖然不是 IP 廠商,但憑借其手機(jī) SoC 的市場霸主地位,使得諸多手機(jī)廠商不僅要購買 Arm 或 Imagination 的 GPU 核,還要被高通卡一刀,在這種情況下,也紛紛另謀 GPU 出路。
綜上,越來越多的 GPU 應(yīng)用大廠(手機(jī)和互聯(lián)網(wǎng)廠商),以及新創(chuàng)芯片設(shè)計公司都開始自研 GPU,或推出與英偉達(dá) GPU 分庭抗禮的新型 AI 處理器,希望在大規(guī)模應(yīng)用市場獲得更多商業(yè)利益。
AI 服務(wù)器需求可能改變產(chǎn)業(yè)鏈
以 ChatGPT 為代表的 AIGC 火遍全球,使得英偉達(dá) GPU 供不應(yīng)求,與此同時,其它芯片供應(yīng)商的類似產(chǎn)品在軟硬件生態(tài)方面無法在短期內(nèi)滿足 AIGC 系統(tǒng)廠商需求,這使得英偉達(dá)處理器的單價水漲船高。然而,水滿則溢,過猶不及,各大系統(tǒng)和互聯(lián)網(wǎng)廠商不能長期接受這種狀況,紛紛開啟自研 AI 芯片之旅。
最近,就連 ChatGPT 的創(chuàng)造者 OpenAI 也加入了自研芯片的行列。有消息人士透露,OpenAI 正在探索自研 AI 芯片,并已開始評估一個潛在的收購目標(biāo),該公司首席執(zhí)行官 Sam Altman 表示,收購一家芯片公司可以加快 OpenAI 開發(fā)自己芯片的進(jìn)程。一位熟悉 OpenAI 計劃的人士透露,該公司已經(jīng)對潛在的收購目標(biāo)進(jìn)行了盡職調(diào)查,不過,目前還不知道究竟是哪家公司。
據(jù)悉,至少從 2022 年開始,OpenAI 就討論了各種新方案,以擺脫對英偉達(dá) GPU 的過度依賴。運行 ChatGPT 系統(tǒng)是非常昂貴的,伯恩斯坦公司 (Bernstein) 分析師 Stacy Rasgon 的分析顯示,每次查詢大約花費 4 美分,如果 ChatGPT 的搜索量增長到谷歌(Google)搜索量的十分之一,它將需要大約價值 481 億美元的 GPU,每年需要 160 億美元的芯片來維持系統(tǒng)運行。
英偉達(dá)預(yù)計今年每美元收入可賺取 56.51 美分的利潤,使其成為全球最賺錢的科技公司之一。正如亞馬遜創(chuàng)始人杰夫·貝佐斯曾經(jīng)說過的那樣,云提供商不必將這些利潤交給芯片廠商,而是可以通過花費時間和金錢來控制其成本結(jié)構(gòu)中日益重要的部分而受益。自研芯片就是主要途徑。
與此同時,OpenAI 的大股東微軟也有望于 11 月推出自研的 AI 芯片 Athena,以減少對英偉達(dá) GPU 的依賴,近期,有消息稱,微軟開始下修英偉達(dá) H100 芯片訂單,并放緩拉貨。微軟自研的芯片與英偉達(dá) GPU 類似,專為訓(xùn)練和運行大型語言模型的數(shù)據(jù)中心服務(wù)器而設(shè)計。
據(jù)悉,微軟從 2019 年就開啟了自研 AI 芯片項目,代號就是 Athena。不過,微軟并非要完全取代英偉達(dá)芯片,而是要降低成本,并在多項服務(wù)中加入 AI 功能。
在微軟之前,亞馬遜和 Google 都已經(jīng)推出了自研 AI 芯片。目前,在英偉達(dá)的大客戶當(dāng)中,已經(jīng)有 6 家開始自研芯片,大家都不想過度依賴一家供應(yīng)商,那樣太被動了。
手機(jī)大廠自研 GPU
不止 AI 服務(wù)器應(yīng)用廠商,手機(jī)大廠也想擺脫對 GPU 芯片和 IP 廠商的過度依賴,典型代表就是三星和蘋果。
最近,三星推出了 Exynos 2400 手機(jī)處理器,其中的 Xclipse 940 GPU 采用了 AMD 最新的 RDNA 3 架構(gòu),特色是提升了硬件光線追蹤能力,這種技術(shù)在當(dāng)下的手機(jī)游戲當(dāng)中發(fā)揮著越來越重要的作用,是高性能產(chǎn)品的標(biāo)配。
為了自研 GPU,三星在 2019 年就與 AMD 展開合作,當(dāng)時,雙方簽署了首個協(xié)議,AMD 將其基于 RDNA 架構(gòu)的定制 GPU IP 授權(quán)給三星使用,用于智能手機(jī)和其它移動設(shè)備。從那時起,三星一直在其 Exynos 系列處理器中使用 AMD Radeon 圖形解決方案。
三星自研手機(jī) GPU,是為了減少對 Arm Mali GPU IP 的依賴。在 Exynos 2100 發(fā)布之前的很多年,三星一直依賴 Mali GPU IP,2022 年初,三星宣布推出全新移動處理器 Exynos 2200,內(nèi)置了基于 AMD RDNA 2 架構(gòu)的 Xclipse 圖形處理單元。不過,這款處理器在推出后的表現(xiàn)并不好,僅搭載于部分 Galaxy S22 系列手機(jī)中,還在性能測試中輸給了高通驍龍 8 Gen1。 之所以如此,主要原因是 Xclipse 的設(shè)計存在缺陷,且優(yōu)化不足。
在 Exynos 2200 之后,三星還有 Exynos 2300,但因為依然存在設(shè)計缺陷,沒有進(jìn)入量產(chǎn)階段。
今年 4 月,三星和 AMD 簽署了一項長期協(xié)議,以加強(qiáng)雙方的戰(zhàn)略合作關(guān)系,雖然前兩款處理器較為失敗,但并沒有打消三星自研手機(jī) GPU 的決心。正是在這樣的背景下,三星于近期推出了 Exynos 2400 手機(jī)處理器。
不過,自研手機(jī) GPU 并不容易,雖然三星沒有畏懼失敗,但前路可能比過去更艱難,特別是與 AMD 合作,難度不小,原因在于,AMD 的 RDNA 架構(gòu)主要針對 PC 端,現(xiàn)在要用于移動端,功耗問題很難解決,對設(shè)計、架構(gòu)、優(yōu)化等工作提出了更高要求,需要雙方深度合作,進(jìn)行優(yōu)化。而這樣的工作似乎沒有成功的先例,當(dāng)年英特爾做手機(jī)芯片,遇到的問題與此非常類似。
為了加快優(yōu)化進(jìn)程,三星電子不斷加大投入力度。2022 年 4 月,三星電子副總裁金泰賢奔赴美國的三星奧斯汀研究中心高階運算實驗室,擔(dān)任 GPU 開發(fā)團(tuán)隊負(fù)責(zé)人。2022 年底,三星電子系統(tǒng) LSI 部門與 MX 部門一起成立了 AP 解決方案開發(fā)團(tuán)隊,以優(yōu)化 AP 并進(jìn)行下一代 AP 研究。此外,三星還通過從 AMD 和 Arm 招募關(guān)鍵崗位開發(fā)人員,建立了一個內(nèi)部 AP 優(yōu)化團(tuán)隊,并不斷增加研發(fā)人員。進(jìn)入 2023 年以來,三星美國子公司持續(xù)招募 GPU 開發(fā)人員,一定要與 AMD 合作,攻下手機(jī) GPU 這道難關(guān)。
與三星相比,蘋果在自研手機(jī) GPU 方面投入得更早,也是一波三折。
早些年,蘋果一直購買 Imagination 的 PowerVR GPU IP,后來,蘋果打算停止采購該公司的 IP,想自研 GPU,其目的是進(jìn)一步控制產(chǎn)品核心技術(shù),降低成本,以確保智能手機(jī)的高額利潤,同時,為未來創(chuàng)新做準(zhǔn)備,特別是在 VR、AR 應(yīng)用領(lǐng)域占據(jù)有利位置。
為了自研 GPU,蘋果從 Imagination 公司招募了很多工程師,不過,在經(jīng)過兩年左右的研發(fā)努力后,宣告失敗,蘋果不得不繼續(xù)與 Imagination 合作,通過購買其 IP,來設(shè)計自家的 A 系列手機(jī)處理器 GPU 模塊。
本文所說的自研 GPU,有兩個層面的意思:一是完全自研,就像蘋果當(dāng)年打算停止與 Imagination 合作,從最底層、最基礎(chǔ)的 IP 開始研發(fā),這是最徹底的,也是最難的;二是目前蘋果和三星采用的自研方式,也就是從合作伙伴那里購買 GPU IP,將其內(nèi)置于自研的手機(jī) SoC 當(dāng)中,這種相對容易,效率也高,但自研的含金量與高通這樣的公司相比,就低了一頭。
以蘋果最新推出的手機(jī)處理器 A17 Pro 為例,GPU 是其一大特色,核心數(shù)量從 A16 的 5 個增加到 6 個,還進(jìn)行了全新的架構(gòu)設(shè)計,峰值性能提升了 20%,引入網(wǎng)格著色 (Mesh Shading),首次支持實時硬件級光線追蹤,這就追上了高通、聯(lián)發(fā)科的腳步。
通過 3DMarkWildlife 跑分來比較 A17 Pro 和高通的驍龍 8Gen2 的 GPU 性能,結(jié)果顯示,A17 Pro 的跑分為 11860,驍龍 8Gen2 為 13500,兩者的跑分差距約為 15% 左右,A17Pro 在 GPU 性能上稍遜一籌。原因在于,高通自研的 Adreno GPU 經(jīng)過多年的技術(shù)積累和應(yīng)用打磨,已經(jīng)非常完善和成熟了,三星和蘋果要想在 GPU 方面與高通競爭,還需要時間和積累。
總體來看,自研 GPU 的手機(jī)廠商還不能擺脫對傳統(tǒng)供應(yīng)鏈的依賴,完全自主還需要時間。
創(chuàng)業(yè)公司挑戰(zhàn) GPU
以上分別介紹了 AI 服務(wù)器 GPU 和手機(jī) GPU 相關(guān)廠商的自研情況,所涉及的公司都是傳統(tǒng)大廠,具有很強(qiáng)的市場影響力,這為它們開創(chuàng) GPU 新路提供了基礎(chǔ)保障,即使不成功,也不會傷筋動骨。然而,對于近些年為搶奪 AI 服務(wù)器 GPU 市場蛋糕而開發(fā)新型處理器的創(chuàng)業(yè)公司來說,情況就不太樂觀了,很多公司已經(jīng)難以為繼,主要原因就是研發(fā)的處理器產(chǎn)品難以滿足客戶的生態(tài)系統(tǒng)要求,很難賣出去。
最近,以英偉達(dá)為主要競爭對手的英國 IC 設(shè)計公司 Graphcore 給英國公司注冊處提交了一份聲明,內(nèi)容顯示,該公司正在與潛在投資者談判,但尚未達(dá)成協(xié)議。聲明還表示,該公司去年稅前虧損同比增加 11%,達(dá)到 2.046 億美元。該公司還表示,2022 年已經(jīng)關(guān)閉了其在挪威、日本、韓國的辦公室,員工數(shù)量從 2021 年的 631 人降至去年的 494 人,同時,該公司 2022 年營收減少了 46%。
Graphcore 成立于 2016 年,曾經(jīng)是最被看好的英國初創(chuàng)公司之一。該公司的 IPU 產(chǎn)品(對標(biāo)英偉達(dá)的 GPU)曾被用于微軟 Azure 平臺。
中國 GPU 有更多機(jī)會
近幾年,出于本土產(chǎn)業(yè)鏈安全,以及商業(yè)利益考慮,中國本土 GPU 廠商也在發(fā)力,且涌現(xiàn)出了幾家比較有特色的廠商。
由于以英偉達(dá)為代表的國際 GPU 龍頭企業(yè)已經(jīng)牢牢掌控了市場,中國本土廠商在產(chǎn)品開發(fā)過程中,要應(yīng)對各種困難和挑戰(zhàn),如專利和生態(tài)系統(tǒng)適配。不過,就像龍芯經(jīng)過多年潛心研究,將 MIPS 吃透,進(jìn)而開發(fā)出屬于自己的指令集和芯片一樣,只要具備坐十年冷板凳的決心和毅力,開發(fā)出自主可控的 GPU,是值得期待的。
不久前,龍芯中科在調(diào)研中表示,自研的 GPU IP 核在公司量產(chǎn)橋片以及新款芯片中已經(jīng)進(jìn)行驗證,集成龍芯自研 GPGPU 的第一款 SoC 預(yù)計 2024 上半年流片,支持圖形加速、科學(xué)計算和 AI 計算。在此基礎(chǔ)上,2024 下半年將完成兼顧顯卡和算力加速功能的專用芯片流片。
景嘉微是中國老牌 GPU 企業(yè),率先研制出了自主 GPU 并已實現(xiàn)大規(guī)模工程應(yīng)用,以 JM5、JM7、JM9 系列等 GPU 為代表,正在從商用向民用市場拓展。除了景嘉微,海光的 DCU 系列以 GPGPU 架構(gòu)為基礎(chǔ),兼容 ROCm 和 CUDA 生態(tài)系統(tǒng),可應(yīng)用于大數(shù)據(jù)處理和 AI 等領(lǐng)域。
新生力量方面,壁仞科技、天數(shù)智芯、芯動科技、摩爾線程、沐曦集成電路等受到越來越多的關(guān)注。
在云端 GPGPU 方面,天數(shù)智芯是在最近幾年異軍突起的本土企業(yè),2021 年,該公司推出了 7nm 制程全自研云端訓(xùn)練 GPGPU「天垓 100」,并于 2022 年發(fā)布了 7nm 云端推理 GPGPU「智鎧 100」,能夠為云端 AI 訓(xùn)練和 HPC 通用計算提供高算力和高能效比。
其它幾家企業(yè)也在近兩三年內(nèi)推出了用于數(shù)據(jù)中心和 AI 的 GPU,如沐曦集成電路的 MXC 系列,壁仞科技的 BR100,摩爾線程的 MTT S2000。
與國際 AI 服務(wù)器芯片廠商相比,中國本土 GPU 廠商具有更好的成長和發(fā)展空間,首先,中國市場空間巨大,有廣闊的施展空間;其次,原本需要面對的來自英偉達(dá)、AMD 等國際大廠的競爭,被美國政府政策屏蔽掉了很大一部分;再有,中國本土系統(tǒng)和互聯(lián)網(wǎng)大廠沒有微軟、亞馬遜和谷歌那樣迫切的自研 GPU 需求。在經(jīng)過資本熱潮消退,市場優(yōu)勝劣汰之后,能推出有「干貨」的產(chǎn)品、保持健康現(xiàn)金流的企業(yè),會有不錯的發(fā)展空間。
評論