外媒:換芯片、改軟件,中國(guó)AI公司“可有效規(guī)避美國(guó)制裁”
導(dǎo)讀:5月9日據(jù)Tom's Hardware報(bào)道,中國(guó)廠商正通過(guò)更換GPU、調(diào)整軟件等方式來(lái)訓(xùn)練AI大模型,但代價(jià)是效率和成本。
圖:被爆炒的英偉達(dá)H100
芯片大師曾在馬斯克等簽署千人聯(lián)名信:立即停止巨型AI實(shí)驗(yàn)一文中指出,國(guó)內(nèi)AI廠商未來(lái)面臨自主設(shè)計(jì)的ASIC無(wú)法使用先進(jìn)工藝制造,也無(wú)法獲得和競(jìng)爭(zhēng)對(duì)手一樣的進(jìn)口芯片的尷尬,中外由于芯片算力帶來(lái)的差距將進(jìn)一步擴(kuò)大。
報(bào)道稱(chēng),為了彌補(bǔ)強(qiáng)大GPU(NVIDIA的A100/H100)的不足,中國(guó)AI大模型開(kāi)發(fā)人員正在簡(jiǎn)化他們的程序以降低要求,并結(jié)合使用他們可以獲得的所有計(jì)算硬件。
據(jù)瑞銀分析師估計(jì),OpenAI的ChatGPT背后的大規(guī)模語(yǔ)言模型需要5,000到10,000個(gè)Nvidia 的A100 GPU進(jìn)行訓(xùn)練。而阿里巴巴、百度和華為等公司已經(jīng)探索使用NVIDIA的V100、P100及華為Ascend(昇騰)的組合。
圖:中外主要AI算力芯片(浙商證券)
據(jù)SemiAnalysis估計(jì),OpenAI運(yùn)營(yíng)ChatGPT每天的花費(fèi)高達(dá)700,000美元,因?yàn)镃hatGPT需要大量的算力來(lái)響應(yīng)海量用戶(hù)的需求,同時(shí),大部分成本是基于他們所需的昂貴服務(wù)器。
4月,騰訊推出了一個(gè)新的計(jì)算集群,使用NVIDIA H800s進(jìn)行大規(guī)模AI模型訓(xùn)練。但這種方法可能代價(jià)高昂,因?yàn)橹袊?guó)公司可能需要三倍的H800才能達(dá)到美國(guó)同行采用H100獲得的結(jié)果。
這意味著,如果中國(guó)企業(yè)需要運(yùn)營(yíng)一個(gè)類(lèi)似于ChatGPT的項(xiàng)目,每天的成本可能將高達(dá)210萬(wàn)美元,但成本還不是最困難的。
報(bào)道還稱(chēng),盡管中國(guó)有許多公司為AI工作負(fù)載開(kāi)發(fā)處理器,但它們的硬件不受英偉達(dá)CUDA等強(qiáng)大軟件平臺(tái)的支持,這也是此前有報(bào)道稱(chēng)基于此類(lèi)芯片的機(jī)器“容易崩潰”的原因。
圖:華為昇騰系列
在最近的一篇論文中,華為研究人員演示了僅使用Ascend處理器來(lái)訓(xùn)練他們最新一代的大型語(yǔ)言模型PanGu-Σ。雖然存在一些缺點(diǎn),但該模型在閱讀理解和語(yǔ)法測(cè)試等一些中文任務(wù)中取得了最先進(jìn)的性能。
分析人士說(shuō),無(wú)法使用H100芯片給中國(guó)研究人員帶來(lái)了顯著的困難,該芯片包括一項(xiàng)額外的性能增強(qiáng)功能,特別適用于訓(xùn)練類(lèi)似ChatGPT的模型。與此同時(shí),百度和鵬程實(shí)驗(yàn)室去年發(fā)表的一篇論文表明,研究人員正在使用一種可以使附加功能變得無(wú)關(guān)緊要的方法來(lái)訓(xùn)練大型語(yǔ)言模型。
對(duì)此,SemiAnalysis首席分析師Dylan Patel認(rèn)為:“如果運(yùn)作良好,他們可以有效規(guī)避制裁?!?/span>
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。