大咖說丨云計算:數(shù)字世界的“中樞神經(jīng)”
隨著數(shù)字化轉型進程加速,云計算作為重塑商業(yè)模式、加速數(shù)字經(jīng)濟發(fā)展的關鍵引擎,其重要性愈發(fā)凸顯。未來已來,身處數(shù)字宇宙中,云計算的角色又將如何轉變?近日,中國信息通信研究院云計算與大數(shù)據(jù)研究所副所長栗蔚,分享了她對于云計算與數(shù)字原生新實體的獨到見解:
數(shù)字化時代,云計算本質(zhì)已經(jīng)發(fā)生根本改變,實現(xiàn)了由最初的虛擬化技術向數(shù)字世界的中樞神經(jīng)演升,從以服務化資源交付向云原生化價值賦能轉變。云計算正在成為數(shù)字生命體的中樞神經(jīng),成為企業(yè)數(shù)字化轉型的胎生力量。
只有腦區(qū)而沒有中樞神經(jīng)的智能是靜止的智能。傳統(tǒng)人工智能側重模型算法創(chuàng)新,卻忽略了智能是一個復雜的系統(tǒng)化工程,就像人的智慧是建立在完善的中樞神經(jīng)之上的。模型算法實現(xiàn)的是機器學習能力,相當于人類大腦的認知腦區(qū)(腦力功能區(qū)的簡稱),人類有600多個腦區(qū),但人類整體的智能應該包括腦區(qū)部分和中樞神經(jīng),中樞神經(jīng)是由腦和脊髓組成(腦和脊髓是各種反射弧的中樞部分),比起早期腔體動物和節(jié)肢動物只能處理單維信息的中樞神經(jīng)不同,人類的中樞神經(jīng)可以同時、分布式傳遞和處理所有來自“眼耳鼻舌身意”的超高量信息至不同的認知腦區(qū),并相互連接他們,促進腦區(qū)不斷發(fā)育。
模型算法和云計算恰好分別扮演了腦區(qū)和中樞神經(jīng)的角色。OpenAI與云計算的聯(lián)姻,充分釋放出以云計算為中樞構建的數(shù)字生命體的競爭力,大多企業(yè)和用戶在聚焦模型算法優(yōu)化改良時,不可忽略云計算作為中樞神經(jīng)的作用。ChatGPT是構建在云上的人工智能,就像生物的進化一樣,是腦區(qū)與中樞神經(jīng)系統(tǒng)關系在數(shù)字世界的成功演繹。
ChatGPT的兩個被津津樂道的創(chuàng)新是系統(tǒng)化工程的創(chuàng)新,這其中云計算功不可沒,一是情景學習模式以及多模態(tài)(文本、代碼、圖片等多維度信息)輸入;二是人類反饋強化學習(RLHF)的微調(diào)訓練機制和提示導引模式。這兩個創(chuàng)新中云計算的應用部署和離混部技術發(fā)揮了重要作用。
云計算作為中樞神經(jīng),作用有三:
01/ 數(shù)字世界腦區(qū)(應用)調(diào)度算力的系統(tǒng)
云計算分布式調(diào)度超高量異構高性能計算GPU和通用計算CPU資源,支持ChatGPT模型的1750億參數(shù),對于異構的計算資源,云計算屏蔽了復雜的部署框架,給大規(guī)模參數(shù)一個標準化計算環(huán)境,可以高效使用異構算力,降低了大量開發(fā)的開銷和運行的成本,提高了效率。
02/ 數(shù)字世界多維腦區(qū)(多維應用)接入、部署和連接的基礎環(huán)境
云計算實現(xiàn)了多維模型參數(shù)的標準化部署,使得ChatGPT可以圍繞某個主題同時學習多維(圖像、語音、文本等)信息,大部分傳統(tǒng)人工智能就像早期腔體動物只有一個腦區(qū),只能學習訓練單一維度參數(shù),云計算可以將不同應用參數(shù)通過云原生容器等技術標準化部署在不同節(jié)點,并相互連接處理,通過云原生數(shù)據(jù)庫等實現(xiàn)多維數(shù)據(jù)的統(tǒng)一處理,就像人類的大腦中樞神經(jīng)一樣連接處理不同層級和不同維度的腦區(qū)。
03/ 數(shù)字世界實現(xiàn)存儲記憶(離線訓練)和各個腦區(qū)反饋(在線提示引導)的機制
通過云原生離線混部技術支持ChatGPT離線訓練,在線提示引導的算法實現(xiàn),就像人類中樞神經(jīng)會不斷傳遞經(jīng)驗和現(xiàn)實信息給大腦進行大腦信息修正,在用戶看來ChatGPT可以根據(jù)交流調(diào)整答案,非常智能。
ChatGPT是“數(shù)字原生”人工智能,云原生理念和技術是其勝出的重要因素之一
ChatGPT是長在云計算上的“數(shù)字原生”人工智能,就像生物進化先進化中樞神經(jīng)一樣,ChatGPT天生擁有中樞神經(jīng)、多維腦區(qū)、開放學習能力和智慧創(chuàng)新的四位一體的智慧能力。云原生是中樞神經(jīng)整體實現(xiàn)的關鍵技術內(nèi)核,容器在其中就像上千上億的神經(jīng)元承擔了不同應用計算能力和信息傳遞能力,算法在計算時將前端后端的神經(jīng)元部署在不同的容器上,去進行每一個計算、傳遞和通信。
01/ 云原生技術為ChatGPT提供超大規(guī)模并行計算的統(tǒng)一調(diào)度分發(fā)服務能力,顯著降低ChatGPT訓練成本
GPT走大規(guī)模訓練路線,GPU只負責提供底層算力,而云原生則負責實現(xiàn)中間的分布式。GPT有1750億個參數(shù),這1750億個參數(shù)在底層進行運算和計算時,使用Ray的訓練框架。底層基于云原生K8S服務將1750億的參數(shù)模型根據(jù)不同的維度分布成超高量級節(jié)點的調(diào)度,進行分布式的節(jié)點計算,如果沒有云原生,異構算力調(diào)度存在壁壘,GPU池化受阻,支撐千億參數(shù)模型訓練的多機多卡分布式訓練環(huán)境無法高效打通,網(wǎng)絡、存儲、計算、通信能力下降,ChatGPT每次訓練時間將被一再拉長。
另一方面,人工智能模型計算所需要消耗的計算資源每3~4個月就要翻一倍,資金也需要通過指數(shù)級增長獲得匹配,而運用云計算后過去兩年半,GPT-3等模型的訓練成本下降了80%以上,從首次訓練開銷1200萬美元降至140萬美元。如果沒有云原生發(fā)揮極致彈性能力,時間成本和經(jīng)濟成本雙向上升。
02/ 云原生技術能夠?qū)崿F(xiàn)多維應用部署
云原生容器是數(shù)字生命體的神經(jīng)元,承載著模型參數(shù)類型以及調(diào)度連接的容器節(jié)點,具有標準化部署多維應用的能力,對“眼耳鼻舌身意”多維信息部署處理,加速數(shù)字大腦,也就是人工智能算法的進化,使ChatGPT更具智慧。如果沒有云原生,多元異構數(shù)據(jù)難以標準化接入,單一維度應用難以標準化統(tǒng)一部署,模型的信息集成、處理效率、計算精度、能力輸出將大打折扣,缺乏組合能力的ChatGPT的成功概率會大幅下降。
03/ 云原生離混部技術實現(xiàn)離散訓練,在線微調(diào)
ChatGPT基于大量優(yōu)質(zhì)的數(shù)據(jù)語料訓練,實現(xiàn)對話意圖識別和內(nèi)容生成能力的突破,這主要由于ChatGPT具有強大的智能算法學習和記憶調(diào)用基礎,通過云原生離線混部和極致彈性調(diào)用機制,離線訓練千億級別的超大規(guī)模參數(shù),形成了ChatGPT的存儲記憶資源池,通過在線補充完成人類反饋強化學習(RLHF)的微調(diào)訓練機制和提示導引模式,模擬各個腦功能區(qū)的反饋,實現(xiàn)多任務單詞、句子、圖片之間關系的小規(guī)模反饋下的自我監(jiān)督學習。ChatGPT模型訓練需要消耗超大規(guī)模計算資源,基于K8s的資源隔離和資源調(diào)度實現(xiàn)的在離線混部技術,極大的提升資源利用率,節(jié)約模型訓練成本。
04/ 云原生+AI原生開啟全新商業(yè)模式形成良性生態(tài)循環(huán)
開發(fā)側,ChatGPT 生長在云上, 依賴于云計算服務,多年來OpenAI共收到了上百億的投資,這些資金幫助 OpenAI 在平臺上運行和訓練其模型;產(chǎn)品側,OpenAI 基于Cloud Native進行應用開發(fā),基于云計算提供的便捷高性能計算運算模型和打磨算法,并對外銷售產(chǎn)品和 API;而投資方基于 AI Native 來提升搜索、繪畫等產(chǎn)品,未來會在Office、Teams甚至操作系統(tǒng)等產(chǎn)品中用到 OpenAI 提供的能力。
以上關于ChatGPT與云計算的關系,也得到了ChatGPT本身回答的驗證。“ChatGPT,你的底層有沒有用到云原生技術?”ChatGPT的答案是肯定的,“底層基于離線混布技術,離線負責預訓練,在線處理微調(diào)?!薄霸圃l(fā)揮了什么功能”?“分布式計算。”“分布式計算的節(jié)點是什么?”“規(guī)模太大了,無法告訴你,是一個超高量級的。”
云計算同樣是數(shù)字經(jīng)濟時代企業(yè)的中樞神經(jīng),希望其意義被更廣泛認知
根據(jù)信通院調(diào)研,當下企業(yè)上云率總體較低,在30%左右,行業(yè)上云用云呈現(xiàn)階梯狀特征,金融、電信、互聯(lián)網(wǎng)等行業(yè)到達努力實現(xiàn)用好云、管好云的階段,傳統(tǒng)的制造業(yè)、農(nóng)業(yè)、醫(yī)療衛(wèi)生等行業(yè)還處在努力實現(xiàn)上好云的階段。大部分企業(yè)對于云計算的認識仍停留在資源集約方面,沒有認識到云計算中樞神經(jīng)的作用。未來,企業(yè)對云計算的認知需要超越資源層面,云計算作為企業(yè)中樞神經(jīng)的意義應該被更廣泛認知。
就像云計算實現(xiàn)了ChatGPT多維信息綜合處理,異構算力資源一體化調(diào)度,作為企業(yè)中樞神經(jīng)的云計算,能夠打通從上游采購到下游客戶的全流程業(yè)務鏈條,打破煙囪式流程,實現(xiàn)采購、生產(chǎn)、銷售、渠道、用戶消費、人財物等全業(yè)務流程再造和創(chuàng)新,以及各環(huán)節(jié)數(shù)據(jù)統(tǒng)一匯聚和處理。云計算結合人工智能、大數(shù)據(jù)等技術,幫助企業(yè)成為擁有“中樞神經(jīng)”和“大腦”的完整智能體,即轉型升級為“數(shù)字原生新實體”。數(shù)字原生新實體是技術和思想的跨越,是企業(yè)數(shù)字原力的覺醒。
認知之上,需要針對不同行業(yè)、規(guī)模、類型的企業(yè)分類施策,以充分發(fā)揮云計算中樞神經(jīng)的作用。對于中小企業(yè),云廠商供給即插即用云計算中樞神經(jīng)能力;對于大企業(yè),建立自己的云計算中樞神經(jīng)。第三方通過建立全方位標準體系指引,和供給方共同打造高質(zhì)量有針對性的云原生產(chǎn)品生態(tài),中國信通院已經(jīng)建立定位企業(yè)數(shù)字化轉型成熟度IOMM和云原生成熟度CNMM的評估體系,未來將同業(yè)界伙伴共同推進、持續(xù)完善。
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權請聯(lián)系工作人員刪除。