博客專欄

EEPW首頁(yè) > 博客 > 大咖說(shuō)丨云計(jì)算:數(shù)字世界的“中樞神經(jīng)”

大咖說(shuō)丨云計(jì)算:數(shù)字世界的“中樞神經(jīng)”

發(fā)布人:天翼云開發(fā)者 時(shí)間:2023-04-07 來(lái)源:工程師 發(fā)布文章

隨著數(shù)字化轉(zhuǎn)型進(jìn)程加速,云計(jì)算作為重塑商業(yè)模式、加速數(shù)字經(jīng)濟(jì)發(fā)展的關(guān)鍵引擎,其重要性愈發(fā)凸顯。未來(lái)已來(lái),身處數(shù)字宇宙中,云計(jì)算的角色又將如何轉(zhuǎn)變?近日,中國(guó)信息通信研究院云計(jì)算與大數(shù)據(jù)研究所副所長(zhǎng)栗蔚,分享了她對(duì)于云計(jì)算與數(shù)字原生新實(shí)體的獨(dú)到見解:

 

數(shù)字化時(shí)代,云計(jì)算本質(zhì)已經(jīng)發(fā)生根本改變,實(shí)現(xiàn)了由最初的虛擬化技術(shù)向數(shù)字世界的中樞神經(jīng)演升,從以服務(wù)化資源交付向云原生化價(jià)值賦能轉(zhuǎn)變。云計(jì)算正在成為數(shù)字生命體的中樞神經(jīng),成為企業(yè)數(shù)字化轉(zhuǎn)型的胎生力量。

 

image.png 

 

只有腦區(qū)而沒(méi)有中樞神經(jīng)的智能是靜止的智能。傳統(tǒng)人工智能側(cè)重模型算法創(chuàng)新,卻忽略了智能是一個(gè)復(fù)雜的系統(tǒng)化工程,就像人的智慧是建立在完善的中樞神經(jīng)之上的。模型算法實(shí)現(xiàn)的是機(jī)器學(xué)習(xí)能力,相當(dāng)于人類大腦的認(rèn)知腦區(qū)(腦力功能區(qū)的簡(jiǎn)稱),人類有600多個(gè)腦區(qū),但人類整體的智能應(yīng)該包括腦區(qū)部分和中樞神經(jīng),中樞神經(jīng)是由腦和脊髓組成(腦和脊髓是各種反射弧的中樞部分),比起早期腔體動(dòng)物和節(jié)肢動(dòng)物只能處理單維信息的中樞神經(jīng)不同,人類的中樞神經(jīng)可以同時(shí)、分布式傳遞和處理所有來(lái)自“眼耳鼻舌身意”的超高量信息至不同的認(rèn)知腦區(qū),并相互連接他們,促進(jìn)腦區(qū)不斷發(fā)育。

 

模型算法和云計(jì)算恰好分別扮演了腦區(qū)和中樞神經(jīng)的角色。OpenAI與云計(jì)算的聯(lián)姻,充分釋放出以云計(jì)算為中樞構(gòu)建的數(shù)字生命體的競(jìng)爭(zhēng)力,大多企業(yè)和用戶在聚焦模型算法優(yōu)化改良時(shí),不可忽略云計(jì)算作為中樞神經(jīng)的作用。ChatGPT是構(gòu)建在云上的人工智能,就像生物的進(jìn)化一樣,是腦區(qū)與中樞神經(jīng)系統(tǒng)關(guān)系在數(shù)字世界的成功演繹。

 

ChatGPT的兩個(gè)被津津樂(lè)道的創(chuàng)新是系統(tǒng)化工程的創(chuàng)新,這其中云計(jì)算功不可沒(méi),一是情景學(xué)習(xí)模式以及多模態(tài)(文本、代碼、圖片等多維度信息)輸入;二是人類反饋強(qiáng)化學(xué)習(xí)(RLHF)的微調(diào)訓(xùn)練機(jī)制和提示導(dǎo)引模式。這兩個(gè)創(chuàng)新中云計(jì)算的應(yīng)用部署和離混部技術(shù)發(fā)揮了重要作用。

 

image.png 

 

云計(jì)算作為中樞神經(jīng),作用有三:

 

01/ 數(shù)字世界腦區(qū)(應(yīng)用)調(diào)度算力的系統(tǒng)

云計(jì)算分布式調(diào)度超高量異構(gòu)高性能計(jì)算GPU和通用計(jì)算CPU資源,支持ChatGPT模型的1750億參數(shù),對(duì)于異構(gòu)的計(jì)算資源,云計(jì)算屏蔽了復(fù)雜的部署框架,給大規(guī)模參數(shù)一個(gè)標(biāo)準(zhǔn)化計(jì)算環(huán)境,可以高效使用異構(gòu)算力,降低了大量開發(fā)的開銷和運(yùn)行的成本,提高了效率。

 

02/ 數(shù)字世界多維腦區(qū)(多維應(yīng)用)接入、部署和連接的基礎(chǔ)環(huán)境

云計(jì)算實(shí)現(xiàn)了多維模型參數(shù)的標(biāo)準(zhǔn)化部署,使得ChatGPT可以圍繞某個(gè)主題同時(shí)學(xué)習(xí)多維(圖像、語(yǔ)音、文本等)信息,大部分傳統(tǒng)人工智能就像早期腔體動(dòng)物只有一個(gè)腦區(qū),只能學(xué)習(xí)訓(xùn)練單一維度參數(shù),云計(jì)算可以將不同應(yīng)用參數(shù)通過(guò)云原生容器等技術(shù)標(biāo)準(zhǔn)化部署在不同節(jié)點(diǎn),并相互連接處理,通過(guò)云原生數(shù)據(jù)庫(kù)等實(shí)現(xiàn)多維數(shù)據(jù)的統(tǒng)一處理,就像人類的大腦中樞神經(jīng)一樣連接處理不同層級(jí)和不同維度的腦區(qū)。

 

03/ 數(shù)字世界實(shí)現(xiàn)存儲(chǔ)記憶(離線訓(xùn)練)和各個(gè)腦區(qū)反饋(在線提示引導(dǎo))的機(jī)制

通過(guò)云原生離線混部技術(shù)支持ChatGPT離線訓(xùn)練,在線提示引導(dǎo)的算法實(shí)現(xiàn),就像人類中樞神經(jīng)會(huì)不斷傳遞經(jīng)驗(yàn)和現(xiàn)實(shí)信息給大腦進(jìn)行大腦信息修正,在用戶看來(lái)ChatGPT可以根據(jù)交流調(diào)整答案,非常智能。

 

ChatGPT是“數(shù)字原生”人工智能,云原生理念和技術(shù)是其勝出的重要因素之一

 

ChatGPT是長(zhǎng)在云計(jì)算上的“數(shù)字原生”人工智能,就像生物進(jìn)化先進(jìn)化中樞神經(jīng)一樣,ChatGPT天生擁有中樞神經(jīng)、多維腦區(qū)、開放學(xué)習(xí)能力和智慧創(chuàng)新的四位一體的智慧能力。云原生是中樞神經(jīng)整體實(shí)現(xiàn)的關(guān)鍵技術(shù)內(nèi)核,容器在其中就像上千上億的神經(jīng)元承擔(dān)了不同應(yīng)用計(jì)算能力和信息傳遞能力,算法在計(jì)算時(shí)將前端后端的神經(jīng)元部署在不同的容器上,去進(jìn)行每一個(gè)計(jì)算、傳遞和通信。

 

01/ 云原生技術(shù)為ChatGPT提供超大規(guī)模并行計(jì)算的統(tǒng)一調(diào)度分發(fā)服務(wù)能力,顯著降低ChatGPT訓(xùn)練成本

GPT走大規(guī)模訓(xùn)練路線,GPU只負(fù)責(zé)提供底層算力,而云原生則負(fù)責(zé)實(shí)現(xiàn)中間的分布式。GPT有1750億個(gè)參數(shù),這1750億個(gè)參數(shù)在底層進(jìn)行運(yùn)算和計(jì)算時(shí),使用Ray的訓(xùn)練框架。底層基于云原生K8S服務(wù)將1750億的參數(shù)模型根據(jù)不同的維度分布成超高量級(jí)節(jié)點(diǎn)的調(diào)度,進(jìn)行分布式的節(jié)點(diǎn)計(jì)算,如果沒(méi)有云原生,異構(gòu)算力調(diào)度存在壁壘,GPU池化受阻,支撐千億參數(shù)模型訓(xùn)練的多機(jī)多卡分布式訓(xùn)練環(huán)境無(wú)法高效打通,網(wǎng)絡(luò)、存儲(chǔ)、計(jì)算、通信能力下降,ChatGPT每次訓(xùn)練時(shí)間將被一再拉長(zhǎng)。

 

另一方面,人工智能模型計(jì)算所需要消耗的計(jì)算資源每3~4個(gè)月就要翻一倍,資金也需要通過(guò)指數(shù)級(jí)增長(zhǎng)獲得匹配,而運(yùn)用云計(jì)算后過(guò)去兩年半,GPT-3等模型的訓(xùn)練成本下降了80%以上,從首次訓(xùn)練開銷1200萬(wàn)美元降至140萬(wàn)美元。如果沒(méi)有云原生發(fā)揮極致彈性能力,時(shí)間成本和經(jīng)濟(jì)成本雙向上升。

 

02/ 云原生技術(shù)能夠?qū)崿F(xiàn)多維應(yīng)用部署

云原生容器是數(shù)字生命體的神經(jīng)元,承載著模型參數(shù)類型以及調(diào)度連接的容器節(jié)點(diǎn),具有標(biāo)準(zhǔn)化部署多維應(yīng)用的能力,對(duì)“眼耳鼻舌身意”多維信息部署處理,加速數(shù)字大腦,也就是人工智能算法的進(jìn)化,使ChatGPT更具智慧。如果沒(méi)有云原生,多元異構(gòu)數(shù)據(jù)難以標(biāo)準(zhǔn)化接入,單一維度應(yīng)用難以標(biāo)準(zhǔn)化統(tǒng)一部署,模型的信息集成、處理效率、計(jì)算精度、能力輸出將大打折扣,缺乏組合能力的ChatGPT的成功概率會(huì)大幅下降。

 

03/ 云原生離混部技術(shù)實(shí)現(xiàn)離散訓(xùn)練,在線微調(diào)

ChatGPT基于大量?jī)?yōu)質(zhì)的數(shù)據(jù)語(yǔ)料訓(xùn)練,實(shí)現(xiàn)對(duì)話意圖識(shí)別和內(nèi)容生成能力的突破,這主要由于ChatGPT具有強(qiáng)大的智能算法學(xué)習(xí)和記憶調(diào)用基礎(chǔ),通過(guò)云原生離線混部和極致彈性調(diào)用機(jī)制,離線訓(xùn)練千億級(jí)別的超大規(guī)模參數(shù),形成了ChatGPT的存儲(chǔ)記憶資源池,通過(guò)在線補(bǔ)充完成人類反饋強(qiáng)化學(xué)習(xí)(RLHF)的微調(diào)訓(xùn)練機(jī)制和提示導(dǎo)引模式,模擬各個(gè)腦功能區(qū)的反饋,實(shí)現(xiàn)多任務(wù)單詞、句子、圖片之間關(guān)系的小規(guī)模反饋下的自我監(jiān)督學(xué)習(xí)。ChatGPT模型訓(xùn)練需要消耗超大規(guī)模計(jì)算資源,基于K8s的資源隔離和資源調(diào)度實(shí)現(xiàn)的在離線混部技術(shù),極大的提升資源利用率,節(jié)約模型訓(xùn)練成本。

 

04/ 云原生+AI原生開啟全新商業(yè)模式形成良性生態(tài)循環(huán)

開發(fā)側(cè),ChatGPT 生長(zhǎng)在云上, 依賴于云計(jì)算服務(wù),多年來(lái)OpenAI共收到了上百億的投資,這些資金幫助 OpenAI 在平臺(tái)上運(yùn)行和訓(xùn)練其模型;產(chǎn)品側(cè),OpenAI 基于Cloud Native進(jìn)行應(yīng)用開發(fā),基于云計(jì)算提供的便捷高性能計(jì)算運(yùn)算模型和打磨算法,并對(duì)外銷售產(chǎn)品和 API;而投資方基于 AI Native 來(lái)提升搜索、繪畫等產(chǎn)品,未來(lái)會(huì)在Office、Teams甚至操作系統(tǒng)等產(chǎn)品中用到 OpenAI 提供的能力。

 

以上關(guān)于ChatGPT與云計(jì)算的關(guān)系,也得到了ChatGPT本身回答的驗(yàn)證。“ChatGPT,你的底層有沒(méi)有用到云原生技術(shù)?”ChatGPT的答案是肯定的,“底層基于離線混布技術(shù),離線負(fù)責(zé)預(yù)訓(xùn)練,在線處理微調(diào)。”“云原生發(fā)揮了什么功能”?“分布式計(jì)算?!薄胺植际接?jì)算的節(jié)點(diǎn)是什么?”“規(guī)模太大了,無(wú)法告訴你,是一個(gè)超高量級(jí)的?!?/span>

 

云計(jì)算同樣是數(shù)字經(jīng)濟(jì)時(shí)代企業(yè)的中樞神經(jīng),希望其意義被更廣泛認(rèn)知

 

根據(jù)信通院調(diào)研,當(dāng)下企業(yè)上云率總體較低,在30%左右,行業(yè)上云用云呈現(xiàn)階梯狀特征,金融、電信、互聯(lián)網(wǎng)等行業(yè)到達(dá)努力實(shí)現(xiàn)用好云、管好云的階段,傳統(tǒng)的制造業(yè)、農(nóng)業(yè)、醫(yī)療衛(wèi)生等行業(yè)還處在努力實(shí)現(xiàn)上好云的階段。大部分企業(yè)對(duì)于云計(jì)算的認(rèn)識(shí)仍停留在資源集約方面,沒(méi)有認(rèn)識(shí)到云計(jì)算中樞神經(jīng)的作用。未來(lái),企業(yè)對(duì)云計(jì)算的認(rèn)知需要超越資源層面,云計(jì)算作為企業(yè)中樞神經(jīng)的意義應(yīng)該被更廣泛認(rèn)知。

 

就像云計(jì)算實(shí)現(xiàn)了ChatGPT多維信息綜合處理,異構(gòu)算力資源一體化調(diào)度,作為企業(yè)中樞神經(jīng)的云計(jì)算,能夠打通從上游采購(gòu)到下游客戶的全流程業(yè)務(wù)鏈條,打破煙囪式流程,實(shí)現(xiàn)采購(gòu)、生產(chǎn)、銷售、渠道、用戶消費(fèi)、人財(cái)物等全業(yè)務(wù)流程再造和創(chuàng)新,以及各環(huán)節(jié)數(shù)據(jù)統(tǒng)一匯聚和處理。云計(jì)算結(jié)合人工智能、大數(shù)據(jù)等技術(shù),幫助企業(yè)成為擁有“中樞神經(jīng)”和“大腦”的完整智能體,即轉(zhuǎn)型升級(jí)為“數(shù)字原生新實(shí)體”。數(shù)字原生新實(shí)體是技術(shù)和思想的跨越,是企業(yè)數(shù)字原力的覺(jué)醒。

 

認(rèn)知之上,需要針對(duì)不同行業(yè)、規(guī)模、類型的企業(yè)分類施策,以充分發(fā)揮云計(jì)算中樞神經(jīng)的作用。對(duì)于中小企業(yè),云廠商供給即插即用云計(jì)算中樞神經(jīng)能力;對(duì)于大企業(yè),建立自己的云計(jì)算中樞神經(jīng)。第三方通過(guò)建立全方位標(biāo)準(zhǔn)體系指引,和供給方共同打造高質(zhì)量有針對(duì)性的云原生產(chǎn)品生態(tài),中國(guó)信通院已經(jīng)建立定位企業(yè)數(shù)字化轉(zhuǎn)型成熟度IOMM和云原生成熟度CNMM的評(píng)估體系,未來(lái)將同業(yè)界伙伴共同推進(jìn)、持續(xù)完善。

 


*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。



關(guān)鍵詞: 云計(jì)算

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉