人工智能專題報(bào)告:生成式AI,人工智能新范式,重新定義生產(chǎn)力
AI:從判別決策到創(chuàng)造生成
AI模型可大致分為決策式/分析式AI(Discriminant/Analytical AI)和生成式AI (Generative AI)兩類。決策式AI:學(xué)習(xí)數(shù)據(jù)中的條件概率分布,根據(jù)已有數(shù)據(jù)進(jìn)行分析、判斷、預(yù)測(cè),主要應(yīng)用模型有用于推薦系 統(tǒng)和風(fēng)控系統(tǒng)的輔助決策、用于自動(dòng)駕駛和機(jī)器人的決策智能體。 生成式AI:學(xué)習(xí)數(shù)據(jù)中的聯(lián)合概率分布,并非簡(jiǎn)單分析已有數(shù)據(jù)而是學(xué)習(xí)歸納已有數(shù)據(jù)后進(jìn)行演技創(chuàng)造,基 于歷史進(jìn)行模仿式、縫合式創(chuàng)作,生成了全新的內(nèi)容,也能解決判別問(wèn)題。
決策式AI:推薦系統(tǒng)、圖像識(shí)別等已創(chuàng)造巨大市場(chǎng)
2016年,人工智能技術(shù)全面爆發(fā),決策式AI開(kāi)始大規(guī)模應(yīng)用,包括推薦系統(tǒng)、計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理等。 全球人工智能市場(chǎng)規(guī)模從2016年的約600億美元發(fā)展到2021年的近3000億美元,在推薦系統(tǒng)、計(jì)算機(jī)視覺(jué)、自 然語(yǔ)言處理等技術(shù)加持下,亞馬遜、字節(jié)、商湯、特斯拉等公司快速發(fā)展。 我們認(rèn)為,生成式AI經(jīng)過(guò)前期技術(shù)積累進(jìn)入爆發(fā)期,隨著技術(shù)與應(yīng)用的進(jìn)一步成熟,后續(xù)市場(chǎng)空間更為廣闊。
決策式AI應(yīng)用:推薦系統(tǒng)助力電商、視頻等行業(yè)快速發(fā)展
電商推薦:深度挖掘用戶和物品的關(guān)聯(lián)關(guān)系,將商品、店鋪精準(zhǔn)推送給用戶。2003年,亞馬遜將協(xié)同過(guò)濾推薦 算法應(yīng)用到電商行業(yè),憑借推薦商品與用戶需求精準(zhǔn)匹配、大幅降低用戶檢索用時(shí),推薦算法在電商交易中心逐 漸成為資源配置的核心。 推薦系統(tǒng)顯著提升電商平臺(tái)銷售額。2006年,據(jù)VentureBeat,亞馬遜的個(gè)性化推薦系統(tǒng)為其貢獻(xiàn)了35%以 上的銷售額;2015年,京東基于大數(shù)據(jù)個(gè)性化推薦算法的訂單占到總訂單的10%。 新聞、音樂(lè)、視頻等推薦:分析用戶長(zhǎng)期興趣和短期興趣,根據(jù)興趣標(biāo)簽將內(nèi)容實(shí)時(shí)推送給用戶。推薦算法通 過(guò)對(duì)用戶觀看、停留、點(diǎn)贊等行為的實(shí)時(shí)分析,精準(zhǔn)刻畫用戶畫像,將用戶可能感興趣的內(nèi)容推薦給用戶,降低 人工運(yùn)營(yíng)規(guī)則的攝入,顯著提高了用戶粘性。
決策式AI應(yīng)用:圖像識(shí)別推動(dòng)自動(dòng)駕駛市場(chǎng)快速增長(zhǎng)
自動(dòng)駕駛:AI智能分析、識(shí)別路況,滲透率不斷提升。借助決策式AI,自動(dòng)駕駛汽車可分析判別各種路況,并可 對(duì)多種物體進(jìn)行識(shí)別與跟蹤,從而提高行車的安全性,例如行人、空曠行駛空間、地上標(biāo)注、紅綠燈、車輛等。 目前自動(dòng)駕駛市場(chǎng)規(guī)??焖僭鲩L(zhǎng),據(jù)Research And Markets,2021年全球無(wú)人駕駛汽車的市場(chǎng)規(guī)模約273億美 元,2026年全球無(wú)人駕駛汽車市場(chǎng)規(guī)模將達(dá)到594億美元,年復(fù)合增長(zhǎng)率為16.84%。
帶動(dòng)產(chǎn)業(yè)鏈發(fā)展,多環(huán)節(jié)均有高市值上市公司及高估值公司。判別式AI為自動(dòng)駕駛汽車提供核心技術(shù)支持,自動(dòng) 駕駛汽車的銷售則帶動(dòng)整個(gè)相關(guān)產(chǎn)業(yè)鏈的發(fā)展,如車用無(wú)線通信技術(shù)V2X、高精度地圖、激光雷達(dá)、芯片、 ADAS駕駛輔助系統(tǒng)、智能車解決方案等。多個(gè)產(chǎn)業(yè)鏈環(huán)節(jié)均有高估值、大市值公司誕生,例如蔚來(lái)汽車(造 車)、商湯科技(激光雷達(dá)、V2X、ADAS等)、Momenta(高精度地圖)等。
生成式AI:范式升級(jí),應(yīng)用多元
生成式AI VS Web 3.0 :不僅是web3.0的生產(chǎn)工具,更是人工智能的新范式
生成式AI可以作為Web3.0的生產(chǎn)工具,但Web3.0中的應(yīng)用僅是其應(yīng)用的冰山一角。 Web3.0圍繞去中心化的理念展開(kāi),結(jié)合區(qū)塊鏈、智能合約、加密貨幣等技術(shù),核心是產(chǎn)生的數(shù)據(jù)由用戶擁有, 能夠改變用戶數(shù)據(jù)及原創(chuàng)內(nèi)容等均由互聯(lián)網(wǎng)中心化實(shí)體控制的現(xiàn)狀,在創(chuàng)作者經(jīng)濟(jì)中取得更好的平衡從而提 升用戶創(chuàng)作內(nèi)容的積極性。生成式AI在內(nèi)容領(lǐng)域的應(yīng)用能夠滿足用戶不斷提升的創(chuàng)作需求,但這僅是其應(yīng)用的 冰山一角。 生成式AI在廣大垂直領(lǐng)域的應(yīng)用帶來(lái)的是AI用途的結(jié)構(gòu)性改變以及生產(chǎn)力的進(jìn)一步提高,未來(lái)可能創(chuàng)造巨大 的市場(chǎng)價(jià)值。
生成式AI VS Web 3.0 :不追求生產(chǎn)關(guān)系的重塑,但將大幅度提升和創(chuàng)造生產(chǎn)力
創(chuàng)造是生成式AI的核心,本質(zhì)是對(duì)生產(chǎn)力的大幅度提升和創(chuàng)造。生成式AI通過(guò)從數(shù)據(jù)中學(xué)習(xí)要素,進(jìn)而生成 全新的、原創(chuàng)的內(nèi)容或產(chǎn)品,不僅能夠?qū)崿F(xiàn)傳統(tǒng)AI的分析、判斷、決策功能,還能夠?qū)崿F(xiàn)傳統(tǒng)AI力所不及的創(chuàng) 造性功能。生成式AI已催生了營(yíng)銷、設(shè)計(jì)、建筑和內(nèi)容領(lǐng)域的創(chuàng)造性工作,并開(kāi)始在生命科學(xué)、醫(yī)療、制造、 材料科學(xué)、媒體、娛樂(lè)、汽車、航空航天進(jìn)行初步應(yīng)用,為各個(gè)領(lǐng)域帶來(lái)巨大的生產(chǎn)力提升。
生成式AI將促進(jìn)生產(chǎn)關(guān)系高效發(fā)展,而不是像Web3.0重塑生產(chǎn)關(guān)系。Web3.0通過(guò)底層的分布式與去中心化、 密碼學(xué)的應(yīng)用、加密貨幣的結(jié)算方式,為集體協(xié)作、分工、收益提供了更好的結(jié)算方式,去中心化自治組織 (Decentralized Autonomous Organization,DAO)將是常見(jiàn)的組織形態(tài),打破了原有的生產(chǎn)關(guān)系。生成式 AI不是打破傳統(tǒng)的生產(chǎn)關(guān)系,而是通過(guò)提高生產(chǎn)力促進(jìn)現(xiàn)有生產(chǎn)關(guān)系高效發(fā)展。
資本:海外一級(jí)投資涌入
多家生成式AI公司進(jìn)入Madrona、高盛、微軟、亞馬遜網(wǎng)絡(luò)服務(wù)和 PitchBook聯(lián)合發(fā)布的2022年智能應(yīng)用前40 名榜單(Intelligent Applications 40,IA40)。IA40招募了來(lái)自40多家頂級(jí)風(fēng)險(xiǎn)投資和投資公司的50多名風(fēng)險(xiǎn) 投資人,提名并投票選出塑造智能應(yīng)用未來(lái)的頂級(jí)公司,這些公司自成立以來(lái)募資超160億美元,今年募資超過(guò) 50億美元,其中包括Runway、Jasper、Copy.ai在內(nèi)的14家生成式AI相關(guān)公司,占比達(dá)35%。
技術(shù):模型迭代
變分自編碼器(Variational Autoencoder,VAE):2013年由Diederik P. Kingma和Max Welling提出,編碼器 將原始高維輸入轉(zhuǎn)換為對(duì)潛在空間的概率分布描述,從中采樣輸入解碼器,得到新生成的結(jié)果,可用于圖像生成、 語(yǔ)音合成等,生成的圖像較為模糊。
生成式對(duì)抗網(wǎng)絡(luò)(Generative Adversarial Nets,GAN):2014年由Ian J. Goodfellow等人提出,模型由生成 器和判別器組成,以圖像生成為例,生成器輸入訓(xùn)練噪聲后生成圖像,判別器用來(lái)判斷圖像是真實(shí)的還是由生成 器生成的,隨著訓(xùn)練不斷進(jìn)行,生成器水平提升,判別器不再分辨圖像真?zhèn)危潭ㄉ善鲗?duì)判別器進(jìn)行馴良,直 到判別器能夠分辨圖像真?zhèn)?,固定判別器再次訓(xùn)練生成器,不斷循環(huán),獲得生成效果好的生成器。GAN模型能夠 生成圖像、3D模型甚至視頻,但對(duì)輸出結(jié)果控制較弱,易產(chǎn)生隨機(jī)結(jié)果。
生成式AI應(yīng)用:內(nèi)容制作,從輔助人到“替代”人
生成式AI應(yīng)用:娛樂(lè)媒體內(nèi)容制作
當(dāng)前階段生成式AI最常見(jiàn)的應(yīng)用場(chǎng)景為娛樂(lè)媒體內(nèi)容的輔助生產(chǎn)。以文字續(xù)寫或糾錯(cuò)、文字轉(zhuǎn)語(yǔ)音、文字生成語(yǔ) 音、圖像智能編輯、視頻智能剪輯等方式替代既有創(chuàng)意產(chǎn)生后的專業(yè)性機(jī)械勞動(dòng),同時(shí)通過(guò)內(nèi)容生成滿足用戶的 娛樂(lè)需求或者為其提供創(chuàng)作靈感。
隨著生成式AI的不斷成熟,部分專業(yè)內(nèi)容生產(chǎn)者將被替代。數(shù)據(jù)、算力的進(jìn)一步提升將帶來(lái)具有更強(qiáng)生成效果的 AI,能夠根據(jù)用戶需求生成個(gè)性化定制內(nèi)容終稿,并且AI生成內(nèi)容達(dá)到專業(yè)內(nèi)容生產(chǎn)者水平且具有獨(dú)特新穎的創(chuàng) 意,從而替代部分文字作者、翻譯人員、插畫創(chuàng)作者、配音人員、音樂(lè)制作人、視頻編輯人員等等。
AIGC:生成式AI在娛樂(lè)媒體領(lǐng)域的應(yīng)用
AIGC(AI-Generated Content)指利用人工智能技術(shù)自動(dòng)生成的內(nèi)容,是繼專業(yè)生成內(nèi)容(PGC)和用戶生成 內(nèi)容(UGC)之后一種新型生成內(nèi)容的方式。國(guó)際上被稱為人工智能合成媒體(AI-generated Media或Synthetic media),是通過(guò)人工智能算法對(duì)數(shù)據(jù)或媒體進(jìn)行生產(chǎn)、操作和修改的統(tǒng)稱。
AI繪畫作品出圈、一級(jí)投資活躍,2022年AIGC爆發(fā)式發(fā)展。2022年8月,在美國(guó)科羅拉多州舉辦的新興數(shù)字藝 術(shù)家競(jìng)賽中,參賽者提交AIGC繪畫作品《太空歌劇院》獲得了此次比賽“數(shù)字藝術(shù)/數(shù)字修飾照片”類別一等獎(jiǎng), 而參賽者沒(méi)有繪畫基礎(chǔ),通過(guò)AI繪圖軟件MidJourney耗時(shí)80個(gè)小時(shí)創(chuàng)作了該作品。AI繪畫技術(shù)發(fā)展快速,從年初 的技藝生疏到目前能夠生成專業(yè)級(jí)別的圖像僅過(guò)去幾個(gè)月的時(shí)間,目前國(guó)外已有Stable Diffusion Midjourney等多 個(gè)成熟的AIGC平臺(tái)。其中技術(shù)領(lǐng)先的AI公司Open AI當(dāng)前估值或達(dá)290億美元,Stable Diffusion背后的Stability AI 估值也達(dá)到10億美元。
文本生成:對(duì)話機(jī)器人、新聞稿撰寫廣泛應(yīng)用
文本生成是生成式AI最早應(yīng)用的領(lǐng)域之一,已經(jīng)在對(duì)話機(jī)器人、內(nèi)容續(xù)寫、新聞稿撰寫、詩(shī)歌小說(shuō)創(chuàng)作等領(lǐng)域具 有廣泛的應(yīng)用。 對(duì)話機(jī)器人:包括問(wèn)答型機(jī)器人、閑聊型機(jī)器人、任務(wù)型機(jī)器人、知識(shí)圖譜型機(jī)器人、多輪對(duì)話機(jī)器人,在智能 客服場(chǎng)景中能夠顯著降低企業(yè)人力成本。 新聞稿撰寫:在全球范圍具有廣泛的應(yīng)用,很多新聞機(jī)構(gòu)使用AI生成稿件,尤其是體育、天氣、股市交易變動(dòng)、 公司業(yè)績(jī)報(bào)道等結(jié)構(gòu)性新聞報(bào)道。自然語(yǔ)言生成公司Automated Insights僅在2014年就產(chǎn)生了10億篇新聞文章, 每秒可撰寫多達(dá)2000篇新聞報(bào)道,用戶包括雅虎、美聯(lián)社等。
音頻生成:語(yǔ)音生成廣泛應(yīng)用,大廠均有布局
自動(dòng)語(yǔ)音生成:將文本轉(zhuǎn)化為語(yǔ)音,廣泛應(yīng)用于新聞閱讀、有聲書、出行導(dǎo)航、通知播報(bào)、視頻配音等領(lǐng)域。目 前,谷歌、微軟、亞馬遜、騰訊、阿里、百度、科大訊飛等均推出了相關(guān)平臺(tái),支持在不同場(chǎng)景下將文本轉(zhuǎn)化為 流暢逼真的語(yǔ)音。 谷歌Text-to-Speech:谷歌基于DeepMind 的語(yǔ)音合成專業(yè)技術(shù)打造,支持40多種語(yǔ)言、220多種語(yǔ)音和參數(shù) 調(diào)整,并且支持用戶上傳自己錄制的音頻來(lái)訓(xùn)練自定義語(yǔ)音模型。 科大訊飛在線語(yǔ)音合成:提供了100+發(fā)音人,支持多語(yǔ)種、多方言和中英混合,可靈活配置音頻參數(shù),只需 用戶上傳15分鐘錄音便能夠生成專屬聲音。
生成式AI應(yīng)用:多行業(yè)垂直應(yīng)用
代碼生成:大廠廣泛布局,極大提升編程效率
代碼生成:生成式AI將自然語(yǔ)言翻譯成代碼,極大提升了計(jì)算機(jī)編程的智能化、自動(dòng)化,使得程序員能夠在相 同時(shí)間內(nèi)編寫更多的代碼,同時(shí)提高debug的效率。目前,OpenAI、微軟、谷歌、亞馬遜、華為等均在AI代碼 生成領(lǐng)域有所布局。
Codex:2021年8月由OpenAI基于GPT-3推出,精通Python、JavaScript、Go、Perl、PHP、Ruby、Swift、 TypeScript、SQL甚至 Shell 等十幾種編程語(yǔ)言,其中最為擅長(zhǎng)Python。具有將注釋變成代碼、為代碼生成 注釋、代碼自動(dòng)補(bǔ)全、查找可用庫(kù)或API、代碼檢查、代碼重構(gòu)、代碼語(yǔ)言轉(zhuǎn)換等功能,是Github Copilot的 底層支持,目前免費(fèi)開(kāi)放,需要通過(guò)API或 Playground 訪問(wèn)。
代碼生成:ChatGPT調(diào)試代碼表現(xiàn)優(yōu)于傳統(tǒng)搜索引擎
ChatGPT:2022年11月由OpenAI推出,是一個(gè)對(duì)話語(yǔ)言模型,但在代碼生成領(lǐng)域具有優(yōu)秀的表現(xiàn),能夠?qū)?自然語(yǔ)言轉(zhuǎn)為代碼、找出代碼的問(wèn)題并給出修改意見(jiàn),且支持用戶和AI連續(xù)對(duì)話,在調(diào)試代碼過(guò)程中的使用 體驗(yàn)優(yōu)于傳統(tǒng)的搜索引擎。
代碼生成:Github Copilot每年節(jié)約開(kāi)發(fā)人員成本或達(dá)百億美元
Github Copilot:2021年6月由微軟旗下GitHub推出,由OpenAI Codex 提供支持,可以集成到Neovim, JetBrains IDEs, Visual Studio, and Visual Studio Code等編輯器中,支持 Python、JavaScript、TypeScript、 Java、Ruby 和 Go 等編程語(yǔ)言。可以根據(jù)上下文自動(dòng)寫代碼,包括文檔字符串、注釋、函數(shù)名稱、代碼, 只要用戶給出提示,就可以寫出完整的函數(shù)。
Github Copilot每年節(jié)約開(kāi)發(fā)人員成本或達(dá)百億美元。在2021年6月-2022年6月中,超過(guò)120萬(wàn)開(kāi)發(fā)者注冊(cè) 使用 GitHub Copilot 預(yù)覽版,在啟用的文件中,有近 40% 的代碼是由 Copilot 編寫的。以使用人數(shù)120萬(wàn)、 開(kāi)發(fā)人員時(shí)薪20-200美元,Copilot每年可節(jié)省開(kāi)發(fā)成本48-1920億美元。
海內(nèi)外發(fā)展:多家科技巨頭、初創(chuàng)公司積極布局
創(chuàng)業(yè)公司嶄露頭角,科技巨頭積極布局
國(guó)外多家生成式AI創(chuàng)業(yè)公司獲得大筆融資且擁有較高估值。主要包括OpenAI、 Stability AI、 Midjourney、 Jasper等,其中OpenAI技術(shù)積累最強(qiáng),發(fā)布了多款生成式AI底層算法,估值或達(dá)290億美元。 國(guó)內(nèi)外科技巨頭在生成式AI領(lǐng)域多有布局。國(guó)內(nèi)公司百度、騰訊、阿里、字節(jié)、網(wǎng)易等及國(guó)外公司谷歌、Meta、 微軟等均推出了生成式AI的應(yīng)用產(chǎn)品,其中谷歌通過(guò)谷歌大腦、旗下Deepmind布局最為豐富。
Open AI:提供底層算法,開(kāi)發(fā)水平強(qiáng)、算法通用性高的AI技術(shù)公司
OpenAI是一家大型人工智能研究公司。公司AI開(kāi)發(fā)水平處于第一梯隊(duì),研發(fā)人員包括世界著名AI專家,2022年 6月,量子計(jì)算專家、ACM計(jì)算獎(jiǎng)得主Scott Aaronson宣布將加盟公司。公司以實(shí)現(xiàn)安全的通用人工智能(AGI) 為核心宗旨。 2015年成立之初,公司為一家非營(yíng)利性研究機(jī)構(gòu),2019年接受微軟10億美元的注資,由非營(yíng)利性機(jī)構(gòu)轉(zhuǎn)為盈利 性公司。公司的投資者包括微軟 、Reid Hoffman’s charitable foundation和 Khosla Ventures。The Information稱公司2021年估值已經(jīng)達(dá)200億美元。 據(jù)Semafor報(bào)道,微軟正商談以 290 億美元估值,向 OpenAI 投資 100 億美元,這筆投資還將引入其他風(fēng)投公司。 2022年公司收入約2500萬(wàn)-4000萬(wàn)美元,以290億美元的估值測(cè)算,市銷率達(dá)725-1160倍。
評(píng)論