攪動(dòng)100億美金的ChatGPT，竟然這么依賴TA？

發(fā)布人：傳感器技術(shù) 時(shí)間：2023-01-13 來源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

編輯：Aeneas 好困

【導(dǎo)讀】攪動(dòng)了百億美金市場(chǎng)的ChatGPT，再一次證明了：AIGC，將在2023年給我們的生活帶來革命性的劇變。
這幾天，「微軟砸下百億美金注資OpenAI」的消息瘋狂刷屏。

作為一家沒有商業(yè)模式的公司，OpenAI怎么就能估值百億美金？投資人這么好忽悠嗎？其實(shí)，拉出OpenAI背后的ChatGPT，大家就多少能明白一點(diǎn)了。這個(gè)語(yǔ)言模型「頂流」，最近可謂是無人不知，無人不曉。而近水樓臺(tái)先得月的微軟，已經(jīng)悄咪咪地在互聯(lián)網(wǎng)巨頭混戰(zhàn)中，先下了一城。前腳剛表示ChatGPT即將整合進(jìn)自家搜索引擎必應(yīng)，后腳就放出ChatGPT計(jì)劃加入Office「辦公全家桶」這個(gè)重磅炸彈。

AIGC革命，又到了拼算力的環(huán)節(jié)

2022年，是AIGC的革命元年。

DALL·E 2的誕生讓「文生圖」火了整整一年，緊跟其后的Stable Diffussion、Midjourney更是啟發(fā)了無數(shù)人的藝術(shù)靈感，甚至讓不少畫手感到了「失業(yè)危機(jī)」。到了年末，ChatGPT更是在全民中掀起AIGC的風(fēng)暴。雖然是壓軸出場(chǎng)，但「強(qiáng)化學(xué)習(xí)」（RLHF）賦予它的魔力，成功地掀起了一場(chǎng)全民的狂歡。剛剛我們提到的這些應(yīng)用，雖然看起來花里胡哨，但在背后提供支撐的依然是大家熟知的大模型們。

眾所周知，對(duì)于大模型來說，不管是前期的訓(xùn)練還是后期的推理，都離不開巨量的「算力」。舉個(gè)例子，「當(dāng)紅炸子雞」ChatGPT和DALL·E 2基于的GPT-3，以及國(guó)產(chǎn)自研的源1.0、悟道和文心等等，不僅在參數(shù)量上達(dá)到了千億級(jí)別，而且數(shù)據(jù)集規(guī)模也高達(dá)TB級(jí)別。想要搞定這些「龐然大物」的訓(xùn)練，就至少需要投入超過1000PetaFlop/s-day（PD）的計(jì)算資源。

也難怪OpenAI在大煉GPT-3之前，會(huì)讓微軟花10億美元給自己獨(dú)家定制了一臺(tái)當(dāng)時(shí)全世界排名前五的超級(jí)計(jì)算機(jī)。但是問題在于，并不是每個(gè)需要到大量AI算力的企業(yè)或高校，都能財(cái)大氣粗地斥巨資搞一個(gè)自己的「人工智能高性能計(jì)算中心」。那么，如果我們換一個(gè)思路，讓算力變得更加「普適普惠」，是不是也能實(shí)現(xiàn)相同或更好的效果呢？于是，在2020年12月的時(shí)候，國(guó)家信息中心和浪潮信息聯(lián)合發(fā)布了《智能計(jì)算中心規(guī)劃建設(shè)指南》。其中，便提到了一個(gè)全新的概念——智能計(jì)算中心（簡(jiǎn)稱，智算中心）。

智算中心是什么？

為了能更好地解決人工智能領(lǐng)域的問題，智算中心的發(fā)展就需要基于最新的AI論和先進(jìn)的AI計(jì)算架構(gòu)，并以AI芯片、AI服務(wù)器、AI集群為算力的載體。首先，當(dāng)前主流的AI加速計(jì)算，主要是采用CPU系統(tǒng)搭載GPU、FPGA、ASIC等異構(gòu)AI加速芯片。由于GPU芯片中原本為圖形計(jì)算設(shè)計(jì)的大量算術(shù)邏輯單元（ALU），可為以張量計(jì)算為主的深度學(xué)習(xí)計(jì)算提供很好的加速效果，因此廣受學(xué)術(shù)界和工業(yè)界的歡迎。

隨著越來越深入的應(yīng)用，GPU芯片本身也根據(jù)AI的計(jì)算特點(diǎn)，進(jìn)行了針對(duì)性的創(chuàng)新設(shè)計(jì)，如張量計(jì)算單元、TF32/BF16數(shù)值精度、Transformer引擎（Transformer Engine）等。而更加「專一」的AI計(jì)算加速芯片，主要脫胎于GPU芯片。

特斯拉Dojo人工智能訓(xùn)練芯片其次，作為智算中心算力機(jī)組的AI服務(wù)器，則采用CPU+AI加速芯片的異構(gòu)架構(gòu)，通過集成多顆AI加速芯片實(shí)現(xiàn)超高計(jì)算性能。為了滿足各領(lǐng)域場(chǎng)景和復(fù)雜的AI模型的計(jì)算需求，AI服務(wù)器對(duì)計(jì)算芯片間互聯(lián)、擴(kuò)展性也有著極高要求。最后，智算中心還需要對(duì)業(yè)界主流、開源、開放的軟件生態(tài)提供充分的支持。比如，用于開發(fā)AI算法的深度學(xué)習(xí)框架TensorFlow和PyTorch，為適應(yīng)CV、NLP等特定場(chǎng)景開發(fā)而構(gòu)建的一系列開源庫(kù)等等。

智算中心總體架構(gòu)不過，和國(guó)外那些大廠給自己定制的高性能計(jì)算中心不同，智算中心其實(shí)是一個(gè)面向公眾的基礎(chǔ)設(shè)施，更好地解決建不起、用不起算力的問題。其中最為直觀的便是，作為「神經(jīng)中樞」的智算OS（智算中心操作系統(tǒng)）就是為了讓智算中心可以對(duì)算力資源池進(jìn)行高效管理和智能調(diào)度，從而更好地對(duì)外提供算力、數(shù)據(jù)和算法等服務(wù)。如今，距離2020版《智能計(jì)算中心規(guī)劃建設(shè)指南》的發(fā)布已經(jīng)時(shí)隔兩年，而我國(guó)的智算中心發(fā)展也已經(jīng)進(jìn)入了新階段。為此，國(guó)家信息中心和浪潮信息聯(lián)合開展了與時(shí)俱進(jìn)的研究，于2023年1月推出了更新的《智算中心創(chuàng)新發(fā)展指南》（以下簡(jiǎn)稱「指南」）。

所以，為何還要興建智算中心？

智算中心是數(shù)字經(jīng)濟(jì)時(shí)代促進(jìn)產(chǎn)業(yè)轉(zhuǎn)型升級(jí)、優(yōu)化產(chǎn)業(yè)結(jié)構(gòu)、提升城市競(jìng)爭(zhēng)力的關(guān)鍵基礎(chǔ)設(shè)施，并為快速增長(zhǎng)的人工智能算力需求提供了必不可少的支撐。具體來說可以分為四個(gè)方面：推進(jìn)AI產(chǎn)業(yè)化、賦能產(chǎn)業(yè)AI化、助力治理智能化、促進(jìn)產(chǎn)業(yè)集群化。

AI產(chǎn)業(yè)化

AI產(chǎn)業(yè)化的一個(gè)重要例子，就是自動(dòng)駕駛。在自動(dòng)駕駛的場(chǎng)景中，需要基于AI技術(shù)，讓車輛能夠像人類駕駛員一樣準(zhǔn)確識(shí)別駕駛環(huán)境中的關(guān)鍵信息，并對(duì)周圍運(yùn)動(dòng)單元的潛在軌跡做出預(yù)判。

在訓(xùn)練算力消耗上，自動(dòng)駕駛感所采用的知模型要遠(yuǎn)大于一般的計(jì)算機(jī)視覺感知模型。比如，特斯拉的L2級(jí)FSD自動(dòng)駕駛?cè)诤细兄Ｐ?，?xùn)練過程使用了百萬(wàn)量級(jí)的道路采集視頻，算力投入約為500PD。而且，隨著自動(dòng)駕駛級(jí)別從L2提升到L4，對(duì)算力的需求將進(jìn)一步提高。對(duì)此，智算中心提供的普惠算力，可以極大降低自動(dòng)駕駛所需算力的成本。

產(chǎn)業(yè)AI化

在2022年，有一個(gè)概念非常流行，叫「AI for Science」。這是一種新的科研范式，指科學(xué)家們用AI技術(shù)作為生產(chǎn)工具。要說今年AI for Science最廣為人知的例子之一，就是DeepMind開發(fā)的AlphaFold 2了。

截至目前，AlphaFold 2已經(jīng)可以預(yù)測(cè)出2億多個(gè)蛋白質(zhì)結(jié)構(gòu)，幾乎覆蓋了整個(gè)「蛋白質(zhì)宇宙」。通過AlphaFold 2，單個(gè)蛋白結(jié)構(gòu)的預(yù)測(cè)時(shí)間縮短到了分鐘級(jí)，準(zhǔn)確率也達(dá)到了92.4%。AlphaFold 2的開發(fā)，就是以巨量算力為支撐的。僅在訓(xùn)練數(shù)據(jù)準(zhǔn)備階段，AlphaFold 2就消耗了約2億核時(shí)的CPU算力，訓(xùn)練過程中更是消耗了約300PD的AI算力。而非常契合AI for Science算力需求的智算中心，將成為支撐高校和科研院所高質(zhì)量科研的重要基礎(chǔ)設(shè)施。

治理智能化

另外，智算中心還能為城市公共服務(wù)和智能化治理，提供智算能力支撐。

產(chǎn)業(yè)集群化

智算中心能夠聚合當(dāng)?shù)厝斯ぶ悄艿难邪l(fā)優(yōu)勢(shì)、人才優(yōu)勢(shì)、產(chǎn)品優(yōu)勢(shì)與產(chǎn)業(yè)投資，實(shí)現(xiàn)產(chǎn)業(yè)鏈協(xié)同，促進(jìn)產(chǎn)業(yè)集群化發(fā)展。

智算中心產(chǎn)業(yè)鏈現(xiàn)在，智算中心更是成為提升國(guó)際競(jìng)爭(zhēng)力的關(guān)鍵基礎(chǔ)設(shè)施。我們都知道，人均GDP指標(biāo)可以衡量一個(gè)國(guó)家經(jīng)濟(jì)發(fā)展，人均算力水平的高低也可以衡量一個(gè)國(guó)家的智能化水平。根據(jù)《2021-2022全球計(jì)算力指數(shù)評(píng)估報(bào)告》，國(guó)家計(jì)算力指數(shù)與GDP的****呈現(xiàn)出了顯著的正相關(guān)，計(jì)算力指數(shù)平均每提高1點(diǎn)，數(shù)字經(jīng)濟(jì)和GDP將分別增長(zhǎng)3.5‰和1.8‰

計(jì)算力指數(shù)與GDP回歸分析趨勢(shì)經(jīng)研究測(cè)算，「十四五」期間，在智算中心實(shí)現(xiàn)80%應(yīng)用水平的情況下，城市對(duì)智算中心的投資，可帶動(dòng)人工智能核心產(chǎn)業(yè)增長(zhǎng)約2.9-3.4倍、帶動(dòng)相關(guān)產(chǎn)業(yè)增長(zhǎng)約36-42倍，城市/地區(qū)在智算中心建設(shè)投入的增長(zhǎng)量對(duì)創(chuàng)新產(chǎn)出的貢獻(xiàn)率約為14%-17%。不難看出，智算中心對(duì)于城市經(jīng)濟(jì)發(fā)展，已經(jīng)形成一股不可忽視的力量。

智算中心項(xiàng)目的經(jīng)濟(jì)社會(huì)效益基于這些原因，智算中心這個(gè)概念一經(jīng)提出，便引發(fā)了建設(shè)熱潮。據(jù)統(tǒng)計(jì)，現(xiàn)在全國(guó)有超過30個(gè)城市正在建設(shè)或提出建設(shè)智算中心。

然而，問題也隨之而來

不可忽視的是，在如火如荼的建設(shè)過程中，這些智算中心也暴露出了很多問題和挑戰(zhàn)。

首先，我國(guó)對(duì)智能算力的需求與日俱增。《2022-2023中國(guó)人工智能計(jì)算力發(fā)展評(píng)估報(bào)告》數(shù)據(jù)顯示，2021年我國(guó)智能算力規(guī)模達(dá)155.2 EFLOPS（FP16），預(yù)計(jì)到2026年，我國(guó)的智能算力規(guī)模將達(dá)到1,271.4 EFLOPS。在未來80%的場(chǎng)景都將基于AI，它們所占據(jù)的大部分算力資源，都是由智算中心承載。

我國(guó)智能算力發(fā)展情況其次，圍繞算法的服務(wù)模式也需要完善。自2011年以來，全球AI領(lǐng)軍企業(yè)和研究機(jī)構(gòu)紛紛加入AI大模型研究，模型參數(shù)急劇增長(zhǎng)。在短短三四年時(shí)間內(nèi)，參數(shù)規(guī)?？焖?gòu)膬|級(jí)突破至萬(wàn)億級(jí)，同時(shí)出現(xiàn)了很多代表性大模型，如谷歌發(fā)布的BERT，OpenAI發(fā)布的GPT-3等。傳統(tǒng)計(jì)算范式的改變，也必然推動(dòng)智算中心的服務(wù)模式從提供算力為主，向提供「算法+算力」轉(zhuǎn)變。

最后，現(xiàn)階段存在的概念認(rèn)知尚不清晰、建設(shè)標(biāo)準(zhǔn)尚不統(tǒng)一、應(yīng)用場(chǎng)景尚不豐富、運(yùn)營(yíng)模式尚不成熟等問題，也直接影響著智算中心的發(fā)展。

怎么解決？

對(duì)此，《指南》給出的解決思路是：1. 普適普惠；2. 開放兼容。

先來說什么叫「普適普惠」。普適普惠是指，發(fā)揮公共基礎(chǔ)設(shè)施的社會(huì)價(jià)值，既要滿足用戶對(duì)通用算力的需求，又要滿足不同用戶不同場(chǎng)景對(duì)多元化算力的需求。具體來說，智算中心要朝著標(biāo)準(zhǔn)化、低成本、低門檻方向發(fā)展，使智能計(jì)算可以像水電一樣，成為社會(huì)基本公共服務(wù)，滿足不同用戶不同場(chǎng)景對(duì)算力多元化的需求。其次，就是要「開放兼容」。具體來說，就是要開源開放、培育生態(tài)。以開放硬件和開源軟件為主，融合多元算力，實(shí)現(xiàn)算力的聚合、調(diào)度、釋放，讓智算中心「用起來、用的好」。同時(shí)，要加強(qiáng)對(duì)智算中心關(guān)鍵軟硬件產(chǎn)品的研發(fā)支持和大規(guī)模應(yīng)用推廣。

智算中心建設(shè)架構(gòu)而為了實(shí)現(xiàn)算力服務(wù)的普適普惠、高效利用，也就是智算中心如何「好用、用好」的問題，《指南》指出智算中心建設(shè)還需要構(gòu)建「算力基建化、算法基建化、服務(wù)智件化、設(shè)施綠色化」的「四化」技術(shù)路線。算力基建化是指，智算中心要具備對(duì)外提供高性價(jià)比、普惠、安全算力資源的能力，使AI算力像水、電一樣成為城市的公共基礎(chǔ)資源，供政府、企業(yè)、公眾自主取用。算法基建化是指，智算中心通過提供預(yù)置行業(yè)算法、構(gòu)建預(yù)訓(xùn)練大模型、推進(jìn)算法模型持續(xù)升級(jí)、提供專業(yè)化數(shù)據(jù)和算法服務(wù)，讓更多的用戶享受普適普惠的智能計(jì)算服務(wù)，實(shí)現(xiàn)「帶著數(shù)據(jù)來、拿著成果走」的效果：服務(wù)智件化是指，智算中心的發(fā)展將由傳統(tǒng)的硬件、軟件向「智件」升級(jí)。「智件」是指智算中心提供人工智能推廣應(yīng)用的中間件產(chǎn)品和服務(wù)?！钢羌沟臉?gòu)建，通過可視化操作界面，以及低代碼開發(fā)甚至無代碼開發(fā)的模式，為用戶提供功能豐富、使用便捷的人工智能算力調(diào)度、算法供給和個(gè)性化開發(fā)服務(wù)。最后，還要做到設(shè)施綠色化，目前主要發(fā)展趨勢(shì)就是采用液冷技術(shù)。

展望未來

現(xiàn)在，以AIGC、元宇宙、智慧科研（AI for Science）為代表的新興場(chǎng)景，正在走進(jìn)我們的日常生活，給我們的未來帶來無限的可能。

與之相應(yīng)的，智算中心建設(shè)布局浪潮正在全國(guó)快速掀起。智能算力的普適普惠，對(duì)于大多數(shù)企業(yè)來說，尤其是中小企業(yè)，創(chuàng)新的門檻大大地降低了。相信在不久的將來，我們會(huì)很快見證「以數(shù)據(jù)輸入，讓智能輸出」，智能計(jì)算會(huì)如水電一般，真正惠及每一個(gè)人。來源：新智元

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀點(diǎn)，如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。

博客專欄

攪動(dòng)100億美金的ChatGPT，竟然這么依賴TA？

相關(guān)推薦

技術(shù)專區(qū)

博客專欄

攪動(dòng)100億美金的ChatGPT，竟然這么依賴TA？

相關(guān)推薦

技術(shù)專區(qū)

攪動(dòng)100億美金的ChatGPT，竟然這么依賴TA？