融資6.4億美元,AI芯片公司迅速崛起,Yann LeCun出任技術(shù)顧問(wèn)
Groq是一家開(kāi)發(fā)芯片以比傳統(tǒng)處理器更快地運(yùn)行生成式 AI 模型的初創(chuàng)公司,該公司周一表示,已在由貝萊德 (Blackrock) 領(lǐng)投的新一輪融資中籌集了 6.4 億美元。Neuberger Berman、Type One Ventures、思科、KDDI 和三星 Catalyst Fund 也參與其中。
這筆資金使 Groq 的總?cè)谫Y額超過(guò) 10 億美元,公司估值達(dá)到 28 億美元,這對(duì) Groq 來(lái)說(shuō)是一次重大勝利,據(jù)報(bào)道,該公司最初希望以略低的估值(25 億美元)籌集3 億美元。這筆資金是 Groq 在 2021 年 4 月的先前估值(約 10 億美元)的兩倍多,當(dāng)時(shí)該公司在 Tiger Global Management 和 D1 Capital Partners 領(lǐng)投的一輪融資中籌集了 3 億美元。
Meta 首席人工智能科學(xué)家 Yann LeCun 將擔(dān)任 Groq 的技術(shù)顧問(wèn),英特爾代工業(yè)務(wù)前負(fù)責(zé)人、惠普前首席信息官 Stuart Pann 將加入這家初創(chuàng)公司擔(dān)任首席運(yùn)營(yíng)官,Groq 今天還宣布了這一消息??紤]到 Meta 在自己的人工智能芯片上的投資,LeCun 的任命有點(diǎn)出人意料——但毫無(wú)疑問(wèn),這讓 Groq 在競(jìng)爭(zhēng)激烈的領(lǐng)域獲得了一個(gè)強(qiáng)大的盟友。
Groq 于2016 年嶄露頭角,目前正在開(kāi)發(fā)所謂的 LPU(語(yǔ)言處理單元)推理引擎。該公司聲稱(chēng),其 LPU 可以運(yùn)行現(xiàn)有的生成式 AI 模型,其架構(gòu)與 OpenAI 的ChatGPT和GPT-4o類(lèi)似,速度是后者的 10 倍,能耗僅為后者的十分之一。
Groq 首席執(zhí)行官喬納森·羅斯 (Jonathan Ross) 因幫助發(fā)明張量處理單元 (TPU)而聲名鵲起 ,這是谷歌用于訓(xùn)練和運(yùn)行模型的定制 AI 加速器芯片。近十年前,羅斯與企業(yè)家、谷歌母公司 Alphabet X 登月實(shí)驗(yàn)室前工程師道格拉斯·懷特曼 (Douglas Wightman) 合作,共同創(chuàng)立了 Groq。
Groq 提供了一個(gè)由 LPU 驅(qū)動(dòng)的開(kāi)發(fā)者平臺(tái),名為 GroqCloud,該平臺(tái)提供“開(kāi)放”模型,如 Meta 的 Llama 3.1 系列、谷歌的 Gemma、OpenAI 的 Whisper 和 Mistral 的 Mixtral,以及允許客戶(hù)在云實(shí)例中使用其芯片的 API。(Groq 還為去年年底推出的人工智能聊天機(jī)器人 GroqChat 提供了一個(gè)游樂(lè)場(chǎng)。)截至 7 月,GroqCloud 擁有超過(guò) 356,000 名開(kāi)發(fā)人員;Groq 表示,本輪融資的部分收益將用于擴(kuò)大容量并添加新模型和功能。
Groq 首席運(yùn)營(yíng)官 Stuart Pann 告訴 TechCrunch:“這些開(kāi)發(fā)人員中有很多都在大型企業(yè)工作。據(jù)我們估計(jì),財(cái)富 100 強(qiáng)企業(yè)中有超過(guò) 75% 的人都在使用 Groq?!?/p>
隨著生成式人工智能的持續(xù)熱潮,Groq 面臨著來(lái)自其他人工智能芯片新貴以及人工智能硬件領(lǐng)域強(qiáng)大巨頭 Nvidia 日益激烈的競(jìng)爭(zhēng)。
據(jù)估計(jì),Nvidia 控制著用于訓(xùn)練和部署生成式 AI 模型的 AI 芯片市場(chǎng)的 70% 至 95%,該公司正在采取積極措施來(lái)保持其主導(dǎo)地位。
Nvidia 承諾每年發(fā)布一款新的 AI 芯片架構(gòu),而不是像以往那樣每隔一年發(fā)布一款。據(jù)報(bào)道,該公司正在建立一個(gè)新的業(yè)務(wù)部門(mén),專(zhuān)注于為云計(jì)算公司和其他公司設(shè)計(jì)定制芯片,包括 AI 硬件。
除了 Nvidia,Groq 還與亞馬遜、谷歌和微軟競(jìng)爭(zhēng),這些公司都提供(或即將提供)用于云端 AI 工作負(fù)載的定制芯片。亞馬遜擁有 Trainium、Inferentia 和 Graviton 處理器,可通過(guò) AWS 獲得;谷歌云客戶(hù)可以使用上述 TPU,并適時(shí)使用谷歌的Axion芯片;微軟最近為其 Cobalt 100 CPU 推出了 Azure 實(shí)例預(yù)覽版,Maia 100 AI Accelerator 實(shí)例將在未來(lái)幾個(gè)月內(nèi)推出。
一些分析師認(rèn)為,在未來(lái)五年內(nèi),人工智能芯片市場(chǎng)的年銷(xiāo)售額可能達(dá)到 4000 億美元,Groq 可能會(huì)將 Arm、英特爾、AMD 以及越來(lái)越多的初創(chuàng)公司視為競(jìng)爭(zhēng)對(duì)手。Arm和AMD 的人工智能芯片業(yè)務(wù)尤其蓬勃發(fā)展,這要?dú)w功于云供應(yīng)商為滿(mǎn)足生成式人工智能的容量需求而不斷增加的資本支出。
D-Matrix 去年年底籌集了 1.1 億美元,用于將其所謂的首創(chuàng)推理計(jì)算平臺(tái)商業(yè)化。今年 6 月,Etched以 1.2 億美元的價(jià)格脫穎而出,購(gòu)買(mǎi)了一款定制處理器,用于加速當(dāng)今占主導(dǎo)地位的生成式 AI 模型架構(gòu),即 transformer。據(jù)報(bào)道,軟銀的孫正義正尋求籌集 1000 億美元成立一家芯片企業(yè),與 Nvidia 競(jìng)爭(zhēng)。據(jù)說(shuō) OpenAI 正在 與 投資公司洽談啟動(dòng)一項(xiàng) AI 芯片制造計(jì)劃。
為了開(kāi)拓自己的市場(chǎng),Groq 正在大力投資企業(yè)和政府推廣。
今年 3 月,Groq收購(gòu)了Definitive Intelligence,后者是一家總部位于帕洛阿爾托的公司,提供一系列面向企業(yè)的 AI 解決方案,并組建了一個(gè)名為 Groq Systems 的新業(yè)務(wù)部門(mén)。Groq Systems 的業(yè)務(wù)范圍包括為希望將 Groq 芯片添加到現(xiàn)有數(shù)據(jù)中心或使用 Groq 處理器構(gòu)建新數(shù)據(jù)中心的組織(包括美國(guó)政府機(jī)構(gòu)和主權(quán)國(guó)家)提供服務(wù)。
最近,Groq 與政府 IT 承包商 Carahsoft 合作,通過(guò) Carahsoft 的經(jīng)銷(xiāo)商合作伙伴向公共部門(mén)客戶(hù)銷(xiāo)售其解決方案,并且該初創(chuàng)公司已簽署意向書(shū),準(zhǔn)備在歐洲公司 Earth Wind & Power 的挪威數(shù)據(jù)中心安裝數(shù)萬(wàn)個(gè) LPU。
Groq 還與沙特阿拉伯咨詢(xún)公司 Aramco Digital 合作,在中東未來(lái)的數(shù)據(jù)中心安裝 LPU。
在建立客戶(hù)關(guān)系的同時(shí),總部位于加州山景城的 Groq 也在向下一代芯片邁進(jìn)。去年 8 月,該公司宣布將與三星的代工業(yè)務(wù)簽約生產(chǎn) 4nm LPU,預(yù)計(jì)這些 LPU 的性能和效率將超過(guò) Groq 的第一代 13nm 芯片。
Groq 表示,計(jì)劃到 2025 年第一季度末部署超過(guò) 108,000 個(gè) LPU。
風(fēng)險(xiǎn)投資持續(xù)流入人工智能初創(chuàng)企業(yè)
Groq 并不是唯一一家成功利用人工智能炒作的基礎(chǔ)設(shè)施供應(yīng)商。事實(shí)上,6.4億美元遠(yuǎn)不是我們近年來(lái)看到的初創(chuàng)公司獲得的最大一筆收入。
您可能還記得,早在 5 月份,GPU 巨頭 CoreWeave 就在 C 輪融資中獲得了11 億美元,幾周后它就成功說(shuō)服黑石集團(tuán)、貝萊德和其他公司以其 GPU 作為抵押獲得75 億美元貸款。
與此同時(shí),另一家 GPU 云運(yùn)營(yíng)商 Lambda Labs 自 2 月份以來(lái)利用其 GPU 緩存獲得了總計(jì) 8.2 億美元的新資金和債務(wù)融資,但看起來(lái)它還不滿(mǎn)足。上個(gè)月我們了解到,據(jù)報(bào)道,Lambda 正在與風(fēng)險(xiǎn)投資公司洽談再獲得 8 億美元的資金,以支持部署更多 Nvidia GPU。
盡管風(fēng)險(xiǎn)投資資金不斷流入人工智能初創(chuàng)企業(yè),但華爾街的一些人似乎越來(lái)越擔(dān)心這些數(shù)十億美元的人工智能基礎(chǔ)設(shè)施投資是否會(huì)帶來(lái)回報(bào)。
但這并沒(méi)有阻止 Cerebras 等機(jī)器學(xué)習(xí)新貴尋求首次公開(kāi)募股 (IPO)。上周,這家以餐盤(pán)大小的模型訓(xùn)練加速器而聞名的公司透露,它已秘密申請(qǐng)公開(kāi)上市。
首次公開(kāi)募股的規(guī)模和價(jià)格范圍尚未確定。Cerebras 對(duì)人工智能訓(xùn)練問(wèn)題采取了相當(dāng)不同尋常的方法,幫助它從 G42 等公司獲得了超過(guò) 9 億美元的承諾。
與此同時(shí),除了英特爾這個(gè)相當(dāng)引人注目的例外(英特爾計(jì)劃裁員至少 15%,第二季度利潤(rùn)同比下降 16 億美元)之外,芯片供應(yīng)商和轉(zhuǎn)售其加速器訪(fǎng)問(wèn)權(quán)的云提供商一直是人工智能熱潮的最大受益者。上周,AMD透露其MI300X GPU 占其數(shù)據(jù)中心銷(xiāo)售額的 10 億美元以上。
然而,似乎直到本月晚些時(shí)候市場(chǎng)領(lǐng)導(dǎo)者 Nvidia 公布其收益和前景后,人工智能炒作列車(chē)是否會(huì)脫軌的真正試金石才會(huì)到來(lái)。
英偉達(dá)的問(wèn)題,會(huì)否引起AI巨變?
最近,有新聞指出,英偉達(dá)頂級(jí)產(chǎn)品 Blackwell 系列“GB200”因?yàn)槿毕輰?dǎo)致交付時(shí)間推遲了三個(gè)多月。此次延遲預(yù)計(jì)將影響微軟、谷歌和 Meta 等大型科技公司的商業(yè)計(jì)劃,這些公司原本打算利用價(jià)值數(shù)十至數(shù)百萬(wàn)億韓元的 GB200 來(lái)增強(qiáng)其 AI 服務(wù)。行業(yè)分析師認(rèn)為,全球 AI 行業(yè)的“壟斷風(fēng)險(xiǎn)”已成為現(xiàn)實(shí),英偉達(dá)和臺(tái)積電都面臨問(wèn)題,這兩家公司占據(jù)了 AI 加速器設(shè)計(jì)和生產(chǎn)市場(chǎng) 90% 以上的份額。
Blackwell 系列包括“B100”和“B200”,封裝了八個(gè) 192GB 第五代 HBM(HBM3E)和一個(gè) GPU,而“GB200”則在兩個(gè) B200 上增加了一個(gè)中央處理器 (CPU)。據(jù)報(bào)道,問(wèn)題出現(xiàn)在頂級(jí)型號(hào) GB200 上。盡管 GB200 的定價(jià)超過(guò) 40,000 美元(約合 5400 萬(wàn)韓元),比其前身 H100 高出 30% 以上,但微軟和谷歌等客戶(hù)下了價(jià)值數(shù)十至數(shù)百萬(wàn)億韓元的訂單。NVIDIA 甚至最近要求負(fù)責(zé) Blackwell 生產(chǎn)的臺(tái)積電將產(chǎn)量提高 25%。
據(jù)市場(chǎng)研究公司TechInsights統(tǒng)計(jì),去年NVIDIA在AI加速器市場(chǎng)的占有率高達(dá)97.2%。而代工Blackwell的臺(tái)積電,在AI加速器領(lǐng)域的代工市場(chǎng)份額預(yù)估超過(guò)95%。AI半導(dǎo)體供應(yīng)鏈向特定企業(yè)集中,風(fēng)險(xiǎn)極大,一位半導(dǎo)體行業(yè)人士指出,“AI半導(dǎo)體供應(yīng)鏈向特定企業(yè)集中,風(fēng)險(xiǎn)極大”,并預(yù)測(cè)“三星和AMD將有機(jī)會(huì)”。
專(zhuān)家預(yù)測(cè),此次設(shè)計(jì)缺陷事件將加劇“反英偉達(dá)”風(fēng)潮,加速大型科技公司“英偉達(dá)/臺(tái)積電替代戰(zhàn)略”。AMD和谷歌紛紛推出自研GPU,將自己定位為英偉達(dá)的競(jìng)爭(zhēng)對(duì)手。實(shí)際動(dòng)向正在觀察中。最近,微軟和谷歌向第二大AI加速器公司AMD派遣員工,共同開(kāi)發(fā)下一代產(chǎn)品。微軟還開(kāi)始采購(gòu)AMD的AI加速器“MI300X”。蘋(píng)果在AI模型訓(xùn)練方面,已經(jīng)采用谷歌的TPU芯片,而非英偉達(dá)芯片。
NVIDIA 的“反壟斷”風(fēng)險(xiǎn)也在增加。有報(bào)道稱(chēng),美國(guó)司法部正在調(diào)查 NVIDIA 涉嫌違反反壟斷法。占據(jù)超過(guò) 80% AI 芯片市場(chǎng)份額的 NVIDIA 被指控威脅對(duì)試圖購(gòu)買(mǎi)競(jìng)爭(zhēng)對(duì)手產(chǎn)品的客戶(hù)進(jìn)行報(bào)復(fù)。繼法國(guó)之后,另一個(gè)反壟斷風(fēng)險(xiǎn)可能會(huì)阻礙 NVIDIA 的單打獨(dú)斗。
向AMD和谷歌供應(yīng)HBM的三星電子預(yù)計(jì)將受益于AI加速器市場(chǎng)的多元化。三星電子目前向AMD供應(yīng)第4代HBM——HBM3,并已有效確保了HBM3E的供應(yīng)。最近,三星還一直在推動(dòng)其代工和先進(jìn)封裝“交鑰匙服務(wù)”,以替代臺(tái)積電。不過(guò),短期內(nèi),SK海力士和三星電子的HBM3E交貨時(shí)間表也預(yù)計(jì)將因這一設(shè)計(jì)缺陷而略有延遲。GB200共配備16個(gè)第5代HBM——HBM3E。由于Blackwell上市前訂單激增,SK海力士和三星電子一直在轉(zhuǎn)換生產(chǎn)線(xiàn),專(zhuān)注于HBM3E。如果Blackwell的上市推遲到明年,可能會(huì)對(duì)他們今年下半年的業(yè)績(jī)產(chǎn)生負(fù)面影響。
盡管面臨挑戰(zhàn),但 NVIDIA 仍保持樂(lè)觀。該公司官方表示,“AI 加速器產(chǎn)量將在今年下半年增加。我們不會(huì)對(duì)謠言發(fā)表評(píng)論?!盩he Information 預(yù)測(cè),“Blackwell AI 加速器的交付將延遲三個(gè)多月,并將于 2025 年第一季度交付給客戶(hù)?!?/p>
隨著科技行業(yè)努力應(yīng)對(duì)這些發(fā)展,NVIDIA Blackwell AI 加速器設(shè)計(jì)缺陷的連鎖反應(yīng)預(yù)計(jì)將重塑競(jìng)爭(zhēng)格局,為三星和 AMD 等公司提供機(jī)會(huì),同時(shí)挑戰(zhàn) NVIDIA 的市場(chǎng)主導(dǎo)地位。
來(lái)源:半導(dǎo)體行業(yè)觀察
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。