AI芯片大比拼或許在2024下半年。編輯 | GACS
9月14日~15日,2023全球AI芯片峰會(huì)(GACS 2023)在深圳南山圓滿(mǎn)舉行。在首日開(kāi)幕式上,燧原科技創(chuàng)始人兼COO張亞林分享了題為《生成式人工智能的革命》的主題演講。張亞林談道,AIGC將持續(xù)帶動(dòng)算力需求增長(zhǎng)。參數(shù)量高達(dá)數(shù)千億的大模型,依賴(lài)分布式計(jì)算、更大的內(nèi)存容量和帶寬、更高算力、更實(shí)惠的成本或性?xún)r(jià)比,對(duì)AI芯片生態(tài)提出更高要求。他打了一個(gè)形象的比喻:Transformer正通過(guò)統(tǒng)一的大模型,濃縮出一個(gè)“大樹(shù)型”的AIGC平臺(tái)生態(tài),算力是“樹(shù)根”,大模型是“樹(shù)干”,行業(yè)模型庫(kù)是“樹(shù)枝”,應(yīng)用是“樹(shù)葉”。相比原來(lái)碎片化的CV、NLP中小模型,大模型的“大樹(shù)型”生態(tài)的算力需求更加明確和聚焦。對(duì)此,他倡導(dǎo)聯(lián)合生態(tài)伙伴,通過(guò)統(tǒng)一的大模型技術(shù)生態(tài)棧解決算力瓶頸問(wèn)題。如何針對(duì)統(tǒng)一的大模型技術(shù)生態(tài)棧進(jìn)行加速?張亞林認(rèn)為,支持大模型需求,AI芯片廠商需要“芯片硬件+軟件”雙管齊下?!安荒軆H定位于AI芯片本身,而是從硬件、軟件、系統(tǒng)、方案整體賦能一個(gè)數(shù)據(jù)中心或客戶(hù)。這一高抽象的四大層次需要有緊密的生態(tài)伙伴一起加持,達(dá)到一個(gè)統(tǒng)一生態(tài)棧來(lái)解決算力瓶頸問(wèn)題。”為此,燧原科技推出的智算2.0,從基礎(chǔ)大模型和垂類(lèi)大模型兩個(gè)方面進(jìn)行探索。在基礎(chǔ)大模型訓(xùn)練方面,其強(qiáng)調(diào)更高的性能,以及算力集群化催生創(chuàng)新前瞻性;面向垂類(lèi)大模型,則以算力性?xún)r(jià)比推進(jìn)產(chǎn)業(yè)規(guī)?;?。目前,其已為大型科技機(jī)構(gòu)打造千卡規(guī)模AI訓(xùn)練算力集群,并與大型互聯(lián)網(wǎng)公司合作打磨技術(shù)。在方案方面,燧原科技還推出了大模型應(yīng)用平臺(tái)——燧原曜圖,希望通過(guò)系統(tǒng)化產(chǎn)品的更具象方式以觸達(dá)更多客戶(hù)。從AI芯片商業(yè)化來(lái)說(shuō),所有產(chǎn)品發(fā)布都要擬合時(shí)間點(diǎn)和節(jié)奏。張亞林預(yù)測(cè),2023年將是大模型預(yù)訓(xùn)練元年,2024年可能是大模型部署元年,2025年則是大模型真正成熟的元年。很多人認(rèn)為今年中國(guó)這一波大模型訓(xùn)練已經(jīng)結(jié)束,而實(shí)際上當(dāng)2024年數(shù)據(jù)飛輪轉(zhuǎn)起來(lái),勢(shì)必要重構(gòu)大模型訓(xùn)練,誰(shuí)能在明年下半年提供更有價(jià)值的預(yù)訓(xùn)練產(chǎn)品,變得十分關(guān)鍵。以下為張亞林的演講實(shí)錄:各位朋友,大家好!很榮幸站在這里跟大家分享我們燧原對(duì)生成式人工智能革命的一些理解。今天我的分享分為基本介紹、市場(chǎng)分析、生態(tài)和計(jì)算范式的變革、系統(tǒng)戰(zhàn)略四部分。
01.面向AIGC萬(wàn)億級(jí)市場(chǎng),百模大戰(zhàn)帶動(dòng)算力需求爆發(fā)
這是我們看到的AIGC未來(lái)預(yù)測(cè),生成式的模型橫跨了文本生成、音頻生成、圖像生成、視頻生成、跨模態(tài)生成、策略生成、Game AI、虛擬人生成等。下面這張圖是2020年到2030年十年間以及更遠(yuǎn),我們大概可以看到的文本生成、代碼生成、圖片生成、視頻3D生成、游戲AI的發(fā)展路徑。據(jù)我們看到的情況,現(xiàn)在真正能夠?qū)崿F(xiàn)商業(yè)化或者已經(jīng)有了商業(yè)價(jià)值的,還是在圖像生成部分。我們看到的很多媒體公司、廣告公司、電商以及游戲公司,已經(jīng)利用了文本生成圖像的方式,實(shí)現(xiàn)了一些商業(yè)價(jià)值的變現(xiàn)、用戶(hù)體驗(yàn)的增長(zhǎng)。緊接著我們看到的就是代碼生成和文本生成,很多大語(yǔ)言訓(xùn)練模型都在各地開(kāi)花,代碼生成也成為了大語(yǔ)言模型的一部分。所以我們預(yù)計(jì),到今年底或明年,會(huì)有一波大語(yǔ)言模型,以文字生成文字或者文字生成代碼的方式落地。再進(jìn)一步,可能到了明年,我們會(huì)看到一些文字生成視頻和3D的文生視頻的雛形。現(xiàn)在已經(jīng)有大概一分鐘的(文字生成)短視頻出現(xiàn),明年預(yù)計(jì)會(huì)有更高質(zhì)量、更長(zhǎng)時(shí)間的視頻生成出現(xiàn)。游戲AI會(huì)變得更加智能化,決策、智能化會(huì)隨著AI的方式變得更加豐富。所以在很多的游戲公司也在嘗試用生成式AI,調(diào)整AI的智慧大腦。這是一個(gè)簡(jiǎn)單的AIGC市場(chǎng)規(guī)模預(yù)測(cè),我們截取了一個(gè)智庫(kù)的說(shuō)法:在2023年整個(gè)AIGC市場(chǎng)規(guī)模將達(dá)170億人民幣,預(yù)測(cè)到十年之后或者2030年底將達(dá)到萬(wàn)億級(jí)別。這個(gè)預(yù)測(cè)是非常瘋狂的,基本七到八年要實(shí)現(xiàn)大幾十倍,甚至一百倍的增長(zhǎng)。整個(gè)增長(zhǎng)分成三個(gè)部分:2023到2025年是起勢(shì)階段,這兩年生成式AI還在進(jìn)行算法、部署、商業(yè)模式一系列的探索;到2025年到2028年是生態(tài)的成熟期,開(kāi)始進(jìn)入各行各業(yè),產(chǎn)生一些真正更大規(guī)模的商業(yè)價(jià)值;2028到2030年是井噴,生態(tài)爆發(fā),進(jìn)入所有人的生活。大模型的訓(xùn)練依賴(lài)于分布式計(jì)算、內(nèi)存容量和帶寬不停地增加、更好的算力,同時(shí)更多算力精度的表達(dá),還有非??捎^的成本和性?xún)r(jià)比,直接決定了大模型的應(yīng)用和部署。
02.大模型引發(fā)計(jì)算范式變革,帶來(lái)“大樹(shù)型”生態(tài)格局
這張圖是樹(shù)狀圖,描述了基于Transformer的統(tǒng)一大模型新的生態(tài)格局。原來(lái)我們?cè)诟餍懈鳂I(yè)面對(duì)的模型是比較碎片化的,我們?cè)瓉?lái)看到的模型是非常碎片化的模型。Transformer目前被認(rèn)為是第一個(gè)統(tǒng)一大模型,以它的模型底座構(gòu)建的生態(tài)會(huì)成為樹(shù)狀的結(jié)構(gòu)。這個(gè)樹(shù)狀的結(jié)構(gòu)從底下的樹(shù)根算力支持,就是剛才提到的底下的集群、互聯(lián),各種各樣的底層軟件棧和軟件系統(tǒng),到上層對(duì)于統(tǒng)一大樹(shù)干和多模態(tài)的支持,再到上面各行業(yè)垂類(lèi)的模型,基于大模型生長(zhǎng)出來(lái)能夠觸達(dá)千行百業(yè)的垂類(lèi)模型,再到基于垂類(lèi)模型生長(zhǎng)出的枝葉,就是所謂的應(yīng)用。這樣一種大樹(shù)的結(jié)構(gòu),是使得我們現(xiàn)在面臨的問(wèn)題不再是跟樹(shù)林的小樹(shù)苗做生態(tài)的連接,更多是整個(gè)算力全棧,如何更好地支撐大模型為基礎(chǔ)的樹(shù)狀發(fā)展,以及在上面如何開(kāi)枝散葉,變成更多的行業(yè)應(yīng)用。這是我們現(xiàn)在看到的五層的MaaS結(jié)構(gòu)——Model as a Service是一種在云體系里面的新提法,跟傳統(tǒng)的IaaS、SaaS、PaaS有區(qū)別,它主要是基于模型即服務(wù)的概念。也就是說(shuō),它的生態(tài)?;旧鲜俏鍖拥臉?gòu)建棧,從底下的算力提供商、算力系統(tǒng),以及更大的算力集群,通常成為算力底座的提供商,到上面的云服務(wù)商,以騰訊云、阿里云、百度云等一系列為代表的云服務(wù)商,對(duì)上提供抽象的云服務(wù)組件,然后在上面增長(zhǎng)出通用基礎(chǔ)大模型。這些大模型有開(kāi)源的也有閉源的,但它是通用基礎(chǔ)類(lèi)的,然后在上面生長(zhǎng)出行業(yè)的模型庫(kù),基于這種通用大模型進(jìn)行微調(diào)精調(diào),和一些行業(yè)數(shù)據(jù)的加入,生長(zhǎng)出來(lái)行業(yè)模型庫(kù),再到上面根據(jù)行業(yè)模型庫(kù),所有的應(yīng)用廠商和客戶(hù)端來(lái)進(jìn)行調(diào)用,并且進(jìn)行開(kāi)發(fā)自己的應(yīng)用。在這五層模型里面,很多的公司都有自己的定位:云服務(wù)公司既提供云服務(wù),也提供MaaS,去支撐自己匯聚的大模型通用庫(kù),來(lái)服務(wù)更多的垂類(lèi)模型和用戶(hù);有一些做通用模型的公司,他們既做基礎(chǔ)類(lèi)的大模型,也嘗試做垂類(lèi)大模型,甚至還有一些模型公司也有自己的應(yīng)用,所以他們也跨在不同的層次上。但不管怎么說(shuō),這五層是從底下的算力系統(tǒng)能夠觸達(dá)到整個(gè)大面積的應(yīng)用客戶(hù)之間的五層體系結(jié)構(gòu),它本身把整個(gè)用戶(hù)的方式變得更加高層。也就是今天我作為一個(gè)用戶(hù)開(kāi)發(fā)者,在頂層根本不太需要知道底層的算力系統(tǒng),只要知道行業(yè)模型庫(kù)的調(diào)用、付費(fèi)、效用是否能達(dá)到我的需求。所以,這樣一個(gè)高抽象的結(jié)構(gòu),讓整個(gè)AIGC能走入更多的用戶(hù),整個(gè)界面也變得更加單純和抽象。
03.MaaS服務(wù)模式下,底層芯片差別在用戶(hù)端被屏蔽
這是我們?cè)谥袊?guó)的數(shù)據(jù)中心或者新的數(shù)據(jù)中心看到的“L”型生態(tài)。我們一直在講中國(guó)在做大規(guī)模的計(jì)算中心建設(shè),這個(gè)計(jì)算中心的建設(shè)就是一個(gè)數(shù)據(jù)中心的技術(shù)棧和數(shù)據(jù)中心的產(chǎn)業(yè)鏈。這個(gè)“L”型的結(jié)構(gòu)的Y軸,是五層的技術(shù)棧結(jié)構(gòu),它包括了底下的算力系統(tǒng):芯片、板卡、軟件棧、服務(wù)器集群,上面是云服務(wù)大模型、行業(yè)模型和應(yīng)用。這個(gè)L型的軟件棧的Y軸,決定的是算力的部署和算力的利用,到底有沒(méi)有消納方,有沒(méi)有生態(tài)的伙伴來(lái)消納這個(gè)東西。“L”型生態(tài)的X軸,決定了作為算力系統(tǒng)提供商能不能跟基建、集成、部署、運(yùn)維這些生態(tài)方在一起,能經(jīng)過(guò)三五年的運(yùn)營(yíng),進(jìn)入正常的階段。所以在這樣的圖里面,如果我們真正落一個(gè)計(jì)算中心,或者說(shuō)一個(gè)東數(shù)西算工程中的新基建,必須具備“L”型的拼盤(pán),而不是簡(jiǎn)單地只是做算力的提供方,沒(méi)有算力的消納方,或者沒(méi)有算力的運(yùn)維方。這樣完整的拼盤(pán)把整個(gè)中國(guó)計(jì)算中心的業(yè)態(tài)擴(kuò)大了,它需要一個(gè)更開(kāi)源開(kāi)放式的生態(tài)聯(lián)盟,來(lái)做這樣一件事情,最終把在中國(guó)的計(jì)算中心的生態(tài)拼盤(pán)真正落實(shí)。不然的話,缺少任何一個(gè)軸,里面的數(shù)據(jù)中心都會(huì)用不起來(lái),或者運(yùn)維不起來(lái),或者出現(xiàn)沒(méi)有需求方這樣的問(wèn)題。這是我們看到的一些趨勢(shì),隨著算力集群和AI芯片在整個(gè)芯片系統(tǒng)作為底座,很多軟件框架包括加速庫(kù)、AI的框架等,我們?cè)谏厦嬗旨恿朔植际降目蚣?,這個(gè)分布式的框架以更抽象的方式,能夠讓更多大模型的編程者可以更好地使用各種模型變形、數(shù)據(jù)變形等變形策略,能更好地調(diào)用底下更大規(guī)模的算力。這種分布式的框架已經(jīng)成為了一個(gè)更高抽象的代表,在它上面構(gòu)建出所有的大模型、行業(yè)模型、大規(guī)模應(yīng)用,也就是MaaS棧。在這樣的情況下,底下的算力越來(lái)越海量,但上面的編程越來(lái)越海量,當(dāng)我作為一個(gè)大模型的編程者,我要使用的算力本身,已經(jīng)不再像以前這么具象了,不只是面對(duì)一張卡一個(gè)芯片這樣的方式,以什么樣的抽象方式更好地真正地使能編程。所以它從底下來(lái)看,從芯片到集群,本身就是一個(gè)大的系統(tǒng)抽象。因?yàn)楹芏嗟木幊陶吒静惶P(guān)心芯片的實(shí)際指標(biāo),只關(guān)心作為一個(gè)集群的呈現(xiàn),能提供什么樣的價(jià)值。所以從系統(tǒng)化來(lái)看,本身就是在往上抽象的。另外,Transformer的出現(xiàn),讓更好的部署和微調(diào)變得更加專(zhuān)注。以前可能要面對(duì)千行百業(yè)不同種類(lèi)的模型,現(xiàn)在開(kāi)始變得更加聚焦、匯聚,如何針對(duì)統(tǒng)一大模型以及統(tǒng)一大模型上面的垂直模型進(jìn)行專(zhuān)門(mén)的加速,能夠讓它變得更加高性?xún)r(jià)比。整個(gè)編程在往上移動(dòng),平臺(tái)在往上抽象,所以一切的一切都在從底下的芯片往更高層次用戶(hù)觸達(dá)。同時(shí)基礎(chǔ)大模型的更新并不像以前的中小模型一樣更新迭代非常快。大家看到ChatGPT至少有半年甚至更長(zhǎng)時(shí)間更新一次,所以這種更新迭代的過(guò)程中,遷移的東西怎么樣能夠更好地匹配它的開(kāi)發(fā)周期,在更大的開(kāi)發(fā)尺度上,怎么樣讓它變得更有效,而不是像原來(lái)的中小模型一樣,兩三周甚至一個(gè)月迭代一次,這也變成非常大的挑戰(zhàn)。所以我們想表達(dá)的是,系統(tǒng)的高抽象、更高編程的層次和框架,以及更大規(guī)模用戶(hù)的觸達(dá),以及系統(tǒng)性上更高的復(fù)雜度,讓大模型真正能夠被產(chǎn)生和訓(xùn)練,這在更大程度上增加了在AIGC技術(shù)上的壁壘和生態(tài)的難度。再講到L型生態(tài),整個(gè)AIGC其實(shí)是給整個(gè)業(yè)內(nèi)生態(tài)布局和更大規(guī)模的開(kāi)源開(kāi)放,創(chuàng)造了一個(gè)大的可能。
04.芯片硬件+軟件雙管齊下,燧原試水文生圖AIGC平臺(tái)
對(duì)于我們燧原科技來(lái)說(shuō),在2.0里面把生態(tài)分成了兩個(gè)部分:一個(gè)是以預(yù)訓(xùn)練為代表的大集群、大模型,高互聯(lián)、大帶寬這樣一種方式,我們叫Pre-train,它是大模型的產(chǎn)生。但在右邊我們會(huì)看到,當(dāng)統(tǒng)一大模型變成垂類(lèi)大模型進(jìn)入千行百業(yè),甚至賦能更多用戶(hù)應(yīng)用的時(shí)候,它其實(shí)是通過(guò)微調(diào)Fine-tune或者Prompt-tune以及推理的部署來(lái)做到的,所以在右邊我們更強(qiáng)調(diào)極致性?xún)r(jià)比,在左邊強(qiáng)調(diào)的是更高性能、更好的前瞻性。目前為止我們看了很多的商業(yè)模式,大語(yǔ)言模型在真正實(shí)現(xiàn)商業(yè)化的路徑上還有很多的挑戰(zhàn)。OpenAI都還沒(méi)有賺錢(qián),那誰(shuí)愿意為它付費(fèi)?怎么讓大語(yǔ)言模型真正能夠?qū)崿F(xiàn)商業(yè)的正向價(jià)值?這個(gè)其實(shí)跟右邊的部署系統(tǒng)和生態(tài)極其相關(guān),而所有的用戶(hù)看重的就是能不能把你的部署性?xún)r(jià)比拉到極限。而極限每在性?xún)r(jià)比上增加一步,在整個(gè)大規(guī)模的部署上省的錢(qián)就更加可觀,這是我們看到業(yè)內(nèi)非常明顯的點(diǎn)。我們現(xiàn)在在中國(guó)已經(jīng)推出了這樣的集群系統(tǒng)來(lái)賦能,當(dāng)然這個(gè)生態(tài)需要一定的建立,所以選擇一些國(guó)家的實(shí)驗(yàn)室、國(guó)央企,來(lái)作為更好的推動(dòng)力和訓(xùn)練上更好的試水,是整個(gè)生態(tài)成長(zhǎng)的必要階段。同時(shí),跟大的互聯(lián)網(wǎng)戰(zhàn)略客戶(hù)進(jìn)行完全匹配部署,是我們?cè)谕评砗筒渴鹕戏浅jP(guān)鍵的抓手。因?yàn)榇蟮幕ヂ?lián)網(wǎng)公司戰(zhàn)略客戶(hù),它會(huì)在所有真正的內(nèi)容理解、智能交互、智能會(huì)議、推薦搜索、大模型的應(yīng)用,包括游戲等場(chǎng)景。他們會(huì)極致關(guān)注性?xún)r(jià)比,要求你做到跟競(jìng)爭(zhēng)對(duì)手更好的性?xún)r(jià)比,他才會(huì)進(jìn)行試用。所以跟大的互聯(lián)網(wǎng)客戶(hù)進(jìn)行極致打磨,把性?xún)r(jià)比做上去,這也是符合大模型未來(lái)部署市場(chǎng)里面非常關(guān)鍵的點(diǎn)。同樣在中國(guó)的計(jì)算中心里面,我們?nèi)绾文軌蛟谥袊?guó)計(jì)算中心里面有這樣的落地抓手,能夠保證我們剛才講的“L”型生態(tài),包括數(shù)據(jù)中心的業(yè)態(tài)能更好地建立,這也需要我們的最佳實(shí)踐,保證這個(gè)業(yè)態(tài)在生態(tài)上很好的抓手。所以一個(gè)以前定位AI芯片的公司,在AIGC的風(fēng)潮里面,肯定不能只定位在AI芯片的本身,這離我們剛才講的用戶(hù)更大的生態(tài)、更高的抽象離得太遠(yuǎn)。這樣一個(gè)金字塔的結(jié)構(gòu),必須得是從底下的軟件、硬件,各種各樣的裸金屬底座,到整個(gè)軟件;我們剛才講了所有分布式的大模型支撐、各種內(nèi)存、計(jì)算的優(yōu)化,還有各種大模型的部署;然后再在系統(tǒng)層面對(duì)業(yè)務(wù),端到端進(jìn)行部署,最后才是整合整體的方案,整體賦能,一個(gè)大的數(shù)據(jù)中心或者一個(gè)大的客戶(hù)。所以從硬件、軟件、系統(tǒng)、方案這么高的四個(gè)層次,需要有一些非常緊密的生態(tài)伙伴一起加持這個(gè)事情,然后達(dá)到真正通過(guò)統(tǒng)一棧,幫助中國(guó)解決算力瓶頸的問(wèn)題。這是我們?cè)诮衲陜蓚€(gè)月前發(fā)布的曜圖,這是一個(gè)文生圖的平臺(tái),我們緊接著會(huì)有一個(gè)文生文的平臺(tái)發(fā)布,做這個(gè)平臺(tái)的目的就是為了讓燧原的系統(tǒng)化和方案的能力直接通過(guò)這個(gè)產(chǎn)品的展示,直接觸達(dá)高層用戶(hù)。因?yàn)槿绻愣ㄎ皇且粋€(gè)芯片公司或者是一個(gè)硬件提供商,你很難通過(guò)一種具像的方式去跟應(yīng)用方、模型方聊,而這樣的一種系統(tǒng)化產(chǎn)品的搭建,讓你輕易地以產(chǎn)品原型的方式去觸達(dá)更多的客戶(hù),這種方式本身就是擬合了文生圖,能夠在燧原所有的全棧軟硬件里面直接體現(xiàn)它的價(jià)值。當(dāng)然它最終落地在商業(yè)化的時(shí)候,一定要跟行業(yè)或者跟生態(tài)伙伴進(jìn)行結(jié)合,但它的方式可以讓我們很快地觸達(dá)到更多抽象的客戶(hù),能夠讓客戶(hù)用比較簡(jiǎn)單輸入的語(yǔ)言來(lái)理解你的產(chǎn)品,來(lái)實(shí)現(xiàn)你的產(chǎn)品價(jià)值。
05.AI芯片大比拼或在2024下半年
最后這張是我們的產(chǎn)品節(jié)奏。所有產(chǎn)品的發(fā)布和生態(tài)的建立,都必須得擬合時(shí)間點(diǎn)和節(jié)奏。在對(duì)的時(shí)間點(diǎn)出來(lái)一個(gè)錯(cuò)誤的產(chǎn)品,那是完全不符合市場(chǎng)需求的。所以我們從2022年把模型分成了LLM和多模態(tài),這兩條線看上去現(xiàn)在情況差不多。我們?cè)?022年是剛剛啟動(dòng)的階段,包括年底的ChatGPT。2023年在中國(guó)我們稱(chēng)之為大模型訓(xùn)練的元年,所謂的百模大戰(zhàn)、千模大戰(zhàn)都會(huì)用非常高端的訓(xùn)練卡,用最快的時(shí)間,把整個(gè)大語(yǔ)言模型和多模態(tài)模型訓(xùn)練出來(lái),搶時(shí)間,然后更好地建立自己的護(hù)城河。但是到了現(xiàn)在,基本上所有的看法都認(rèn)為,中國(guó)的第一波大訓(xùn)練已經(jīng)結(jié)束了,如果現(xiàn)在才進(jìn)入這個(gè)局面已經(jīng)沒(méi)有機(jī)會(huì)了。現(xiàn)在不管是從大的互聯(lián)網(wǎng)公司還是從比較大型的初創(chuàng)公司,還是從媒體類(lèi)公司,都進(jìn)入了一個(gè)新的階段,就是怎么樣把我訓(xùn)練的模型進(jìn)行商業(yè)變現(xiàn),花了這么多錢(qián),怎么體現(xiàn)商業(yè)價(jià)值,讓企業(yè)獲益,這是所有人面臨的終極問(wèn)題。這也是為什么文生文還在這個(gè)階段中,怎么樣商業(yè)變現(xiàn),但文生圖已經(jīng)實(shí)現(xiàn)了商業(yè)價(jià)值,已經(jīng)有很多上市公司因?yàn)樗嵉搅说谝煌敖稹?/span>所以今年年底,誰(shuí)能真正幫助大模型去部署,去推理,同時(shí)打造極致性?xún)r(jià)比,這樣的事情會(huì)在明年真正使能大模型更大規(guī)模的部署,所以明年我們認(rèn)為是大模型的部署元年。明年也會(huì)有更多更有趣的大模型商業(yè)模式出現(xiàn),包括剛才講的訂閱式方式收費(fèi),這也是大模型以前的時(shí)代沒(méi)有經(jīng)歷過(guò)的。所以在明年大模型的部署元年開(kāi)始之后,我們可以再想象一下,當(dāng)數(shù)據(jù)的飛輪重新轉(zhuǎn)起來(lái),所有的大模型以及應(yīng)用開(kāi)始收到用戶(hù)大量數(shù)據(jù),勢(shì)必在明年下半年要開(kāi)始重構(gòu)他的訓(xùn)練,所以我們叫它再訓(xùn)練。這樣的數(shù)據(jù)飛輪轉(zhuǎn)起來(lái)之后,誰(shuí)能在明年的下半年提供真正更有性?xún)r(jià)比,或者更高性能,或者幫助用戶(hù)的預(yù)訓(xùn)練產(chǎn)品,能把大模型2.0時(shí)代真正推動(dòng)起來(lái),把數(shù)據(jù)的迭代轉(zhuǎn)起來(lái),又變得更加關(guān)鍵。2023年,我們認(rèn)為是大模型的預(yù)訓(xùn)練元年;2024年,我們認(rèn)為是大模型的商業(yè)部署元年;2025年,我們認(rèn)為是大模型2.0真正成熟的元年。所以如果各位的產(chǎn)品也好,整個(gè)市場(chǎng)的需求也好,是放在這里的。以極致部署的性?xún)r(jià)比,更好的算力和系統(tǒng)的彈性化,能夠使能大模型的2.0,這被認(rèn)為是未來(lái)發(fā)展的關(guān)鍵。我的演講就到這里,我最后想說(shuō)的是:我認(rèn)為這是開(kāi)天辟地的時(shí)代,這是第四次工業(yè)革命的核心,讓我們進(jìn)一步地向AIGC靠近,也希望跟各位業(yè)內(nèi)專(zhuān)家伙伴一起打造AIGC的生態(tài),不負(fù)這個(gè)時(shí)代,一起幫助中國(guó)把這個(gè)算力支撐起來(lái)。謝謝大家!以上是張亞林演講內(nèi)容的完整整理。
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。