博客專欄

EEPW首頁 > 博客 > 10億元砸向研發(fā),小冰到底要搞什么?

10億元砸向研發(fā),小冰到底要搞什么?

發(fā)布人:傳感器技術(shù) 時(shí)間:2022-11-18 來源:工程師 發(fā)布文章

意外。

今年科技圈的“寒冬”大潮還在持續(xù)上演著,而有這么一則消息卻與這股大勢“背道而馳”:

小冰公司,完成10億元新一輪融資。

圖片

這家公司,很多友友們并不陌生。

因?yàn)榻鼛啄瓿鲎运业谋姸?strong style="margin: 0px; padding: 0px; outline: 0px; max-width: 100%; box-sizing: border-box !important; overflow-wrap: break-word !important; color: rgb(0, 153, 127);">虛擬人,經(jīng)?;钴S出現(xiàn)在人們的熱議話題中。

而隨著這次最新消息的曝光,新融資的歸去來,也成了外界最關(guān)心的問題,特別還是大環(huán)境不好的當(dāng)前。

對(duì)此,小冰公司在官宣中也直接做了解答:

用于加速AI Being小冰框架技術(shù)研發(fā)。

未來一個(gè)季度內(nèi),完成框架中正在運(yùn)行的30萬名虛擬員工(AI Being Employee)的升級(jí)。

更進(jìn)一步的,小冰公司更是直言了這些動(dòng)作背后的一個(gè)“小目標(biāo)”——

推動(dòng)虛擬員工的普及。

至此,新的疑問也接踵而至:

讓虛擬員工普及,靠譜嗎?不會(huì)影響人類員工嗎?

為什么現(xiàn)在“寒冬”已然如此,這事還如此受資本熱捧?

帶著種種疑問,我們不妨一同來挖一挖。

虛擬員工,真的有在干實(shí)事嗎?

或許很多人對(duì)虛擬人能做的事情,印象都停留在具備娛樂、藝術(shù)性質(zhì)的創(chuàng)作上。

例如小冰公司最初一批走紅的虛擬人之一,夏語冰,就是一位作畫高手。

圖片

而在此之后,國內(nèi)市場上也逐步浮現(xiàn)出眾多顏值超高、擅長繪畫唱歌的虛擬人。

圖片柳夜熙、Ayayi

但事實(shí)上,虛擬人現(xiàn)在在人類生活中起到的作用,可不只是“你以為的你以為”了。

因?yàn)樗麄円呀?jīng)悄然在人類社會(huì)中上崗打工了,也就是我們剛才提到的小冰公司的虛擬員工。

既然是上崗,業(yè)績是考核虛擬人打工的一個(gè)很好的標(biāo)準(zhǔn),我們不妨一同來看看他們做的事,到底夠不夠?qū)嵲凇?/p>

例如每日經(jīng)濟(jì)新聞的主播N小黑/N小白,他倆便是非常典型的虛擬員工代表選手。

而且最初由于形象、播報(bào)方式過于逼真,連續(xù)播報(bào)了70天新聞,愣是沒有觀眾發(fā)覺他倆不是真人。

圖片

再如招商集團(tuán)最近推出的一名虛擬員工招小影,外貌上不僅實(shí)現(xiàn)了與真人無異的神態(tài),更是身懷“十八般武藝”。

她既有工作匯總、信息通知等通用技能,又具備專業(yè)領(lǐng)域知識(shí)和業(yè)務(wù)自動(dòng)處理等能力。

而在今年的冬奧賽事上,也出現(xiàn)了虛擬員工的身影,他就是冬奧數(shù)字教練——觀君。

更令人詫異的是,從披露的信息來看,“觀君”作為非人類,冬奧前已在自由式滑雪空中技巧運(yùn)動(dòng)隊(duì)“服役”了三年,助力取得了兩金一銀。

觀君會(huì)針對(duì)運(yùn)動(dòng)員的每一跳做出專業(yè)判斷,嚴(yán)格判別扣分動(dòng)作,而且是與國際裁判計(jì)分準(zhǔn)則保持高度一致的那種。

圖片

具體應(yīng)用里,觀君會(huì)在運(yùn)動(dòng)員起跳、空中和落地三個(gè)階段,做一個(gè)全流程動(dòng)作量化的工作。

例如在下面的這段訓(xùn)練過程中,觀君便能實(shí)時(shí)提供運(yùn)動(dòng)出臺(tái)的速度和角度、最高點(diǎn)達(dá)到了多少米,還有落地點(diǎn)等信息。

圖片

不僅如此,就連冬奧播報(bào)天氣的主播,也是由虛擬員工馮小殊來擔(dān)任。

更早像萬科集團(tuán)的財(cái)務(wù)數(shù)字員工崔筱盼,更是因?yàn)閿孬@集團(tuán)總部優(yōu)秀新人獎(jiǎng)而破圈出名。

圖片

……

不難看出,從業(yè)務(wù)能力上來看,小冰公司的這些虛擬員工可以說是高分通過考核。

所以他們是如何做到的?

主要依托其自研的小冰框架技術(shù)(Avatar Framework)。

例如在面容、表情、肢體動(dòng)作在內(nèi)的整體自然度可以做到真假難辨,主要是結(jié)合了小冰深度神經(jīng)網(wǎng)絡(luò)渲染(Xiaoice Neural Rendering,XNR)及小樣本學(xué)習(xí)技術(shù)。

簡單來說,這項(xiàng)技術(shù)主要包含三個(gè)步驟。

第一步是構(gòu)建兩個(gè)專家模型。

第一個(gè)是語音專家模型,基本的思路便是利用很大量的數(shù)據(jù)來學(xué)習(xí)、理解人類的語音。

例如人類在講話講到激動(dòng)的時(shí)候,他的嘴型都會(huì)有比較明顯的變化,而語音專家模型就是學(xué)會(huì)這項(xiàng)技能。

第二個(gè)是專家模型,則是通過采集攝像機(jī)等設(shè)備拍出來的人物視頻數(shù)據(jù),學(xué)習(xí)人類在說話過程中,嘴部的變化與眼睛、臉部其它肌肉之間如何產(chǎn)生微妙的聯(lián)動(dòng)變化。

如此一來,就能會(huì)讓虛擬人在說話時(shí),整個(gè)面部表情能夠變得自然流暢。

第二步便來到了渲染的環(huán)節(jié)。

也就是將語音輸入到深度神經(jīng)網(wǎng)絡(luò)渲染模型,而后會(huì)一幀一幀地渲染出自然的臉,并形成動(dòng)態(tài)的過程。

但在這個(gè)過程中,前兩個(gè)專家模型也會(huì)起到一個(gè)監(jiān)督的作用,目的還是讓整體效果能夠自然。

第三步,則是一個(gè)自動(dòng)化的過程。

也就是當(dāng)把文字輸入進(jìn)來的時(shí)候,就會(huì)通過TTS(TextToSpeech)的方式,將文本變成語音。

而當(dāng)機(jī)器接收到這些語音信號(hào)后,又會(huì)將其聯(lián)動(dòng)虛擬人的所有姿態(tài)、動(dòng)作、表情等,最終生成一個(gè)完整的視頻。

也正是在這種技術(shù)路線上的改變,最終才得以讓小冰的虛擬人“瞞天過?!钡仳_過了人眼。

除此之外,小冰框架中還會(huì)涉及情感計(jì)算、全雙工交互、超級(jí)自然語音等等,可以說是從全方面讓虛擬員工無限逼近真人。

在此次融資消息對(duì)外公布的同時(shí),小冰公司也宣稱要拿這筆錢全部投入到研發(fā)當(dāng)中。

其中就包括對(duì)旗下人工智能虛擬員工產(chǎn)品線啟動(dòng)年度升級(jí),加強(qiáng)的技術(shù)包括大模型對(duì)話引擎、3D神經(jīng)網(wǎng)絡(luò)渲染、超級(jí)自然語音及AIGC人工智能內(nèi)容生成。

……

所以,如此對(duì)比下來之后,不難看出現(xiàn)在虛擬人已經(jīng)不再是“花瓶”般的擺設(shè)。

而是確確實(shí)實(shí)在各自的崗位上干著實(shí)事,并且還是讓工作效率變得更高、工作質(zhì)量也能加強(qiáng)的那種。

但小冰公司很顯然的沒有滿足于此,從此次消息公布上來看,它還要繼續(xù)造“人”。

虛擬員工的未來如何?

要回答這個(gè)問題,我們不妨從虛擬人賽道的大環(huán)境著手來看。

單就從2020年以來,小冰公司自身便已經(jīng)經(jīng)歷了三次融資,并且早在去年便已經(jīng)被估值到了10億美元之多。

圖片

很顯然的,市場和資本對(duì)于虛擬人賽道可以說是看好的態(tài)度。

在量子位智庫的《虛擬數(shù)字人深度產(chǎn)業(yè)報(bào)告》中,更大范圍來看亦是如此。報(bào)告預(yù)測:

在2030年,我國虛擬數(shù)字人整體市場規(guī)模將達(dá)到2700億。

其中,得益于虛擬IP的巨大潛力,以及虛擬第二分身的起步,身份型虛擬數(shù)字人將占據(jù)主導(dǎo)地位,約1750億,并逐步成為Metaverse中的重要一環(huán)。

服務(wù)型虛擬數(shù)字人則相對(duì)穩(wěn)定發(fā)展,多模態(tài)AI助手仍有待進(jìn)一步發(fā)展,多種對(duì)話式服務(wù)升級(jí)至虛擬數(shù)字人形態(tài),總規(guī)模超過950億。

而且從目前虛擬人市場發(fā)展情況來看,這個(gè)賽道仍處于前期培育階段。

圖片

在各行業(yè)近兩年開始意識(shí)到其技術(shù)可行性和商業(yè)價(jià)值后,虛擬人行業(yè)將快速進(jìn)入高速發(fā)展期。

首先,作為多模態(tài)升級(jí)的代表技術(shù),虛擬數(shù)字人的應(yīng)用場景眾多,可廣泛與各行業(yè)領(lǐng)域相結(jié)合,變現(xiàn)路徑和市場潛力明確。其中虛擬直播、虛擬偶像已得到明確的商業(yè)價(jià)值驗(yàn)證。而虛擬分身生成等場景也已得到了資本和相關(guān)產(chǎn)業(yè)方的認(rèn)可。

其次,大多數(shù)國內(nèi)玩家為綜合實(shí)力較強(qiáng),發(fā)展成熟的AI科技公司,在客戶積累、技術(shù)實(shí)力、銷售渠道、資金供給等方面較為可靠,行業(yè)預(yù)計(jì)可直接進(jìn)入平穩(wěn)發(fā)展期。

最后,在多家業(yè)內(nèi)代表公司看來,虛擬數(shù)字人作為Metaverse 主要的交互載體,具有明確的巨大增長潛力,并基于NFT、VR等有理想的延展空間。行業(yè)天花板高,能夠維持長期和衍生發(fā)展。

這也就不難理解為何市場和資本會(huì)如此青睞以小冰公司為代表的虛擬人賽道了。

但另一方面,從更大范圍的AIGC(AI生成內(nèi)容)市場發(fā)展來看,更是印證了這點(diǎn)。

像Stable Diffusion的爆火,在僅發(fā)布一個(gè)月的時(shí)間內(nèi),其背后的公司便被估值到了69億元。

這種火爆,未來的市場規(guī)模和前景也已經(jīng)有了推測:

到2030年,AIGC市場規(guī)模或?qū)⒊^萬億人民幣。

圖片

這是市場對(duì)于虛擬人、AIGC的肯定,而回歸到小冰公司自身,其“打法”也是值得討論一番。

其實(shí)早在元宇宙、AIGC等成為熱詞出現(xiàn)之前,小冰公司已然在AI作畫、創(chuàng)作,情感計(jì)算等方面著手發(fā)力,像夏語冰那批虛擬人,便是很好的印證。

并且像AI Being這樣的概念,也是由小冰于2019年率先提出,其前瞻性可見一斑。

在2020年年末,小冰公司董事長、清華大學(xué)雙聘教授沈向洋在給吳恩達(dá)的新年賀詞中也表示:

我預(yù)見2021年,人工智能社區(qū)將創(chuàng)造出更多工具來釋放人類的創(chuàng)造力。人工智能將幫助世界各地的人們,以各有態(tài)度的方式去溝通和表達(dá)情感和情緒。

過去,期待在藝術(shù)領(lǐng)域里有所成就的專業(yè)人士,比如繪畫、音樂、詩歌和舞蹈,必須長年學(xué)習(xí)和苦練。用中國老話講,是“臺(tái)上三分鐘,臺(tái)下十年功”;用流行語說,就是從平凡到專業(yè)的“一萬小時(shí)”門檻。

我預(yù)期,諸如小冰X Suites這樣的工具,可以幫助每一個(gè)人減少花費(fèi)在重復(fù)練習(xí)上的成本,把寶貴的精力投入到創(chuàng)造更圓融的創(chuàng)意、更具想象力的表達(dá)上。

從現(xiàn)在開始,我們應(yīng)該將注意力轉(zhuǎn)移到AI幫助人們釋放創(chuàng)造力這件大事上。

就目前看來,小冰公司已經(jīng)是率先在AIGC形成穩(wěn)定商業(yè)落地與文本、聲音、圖像的產(chǎn)品化陣列。

例如文本方面,小冰金融文本生成產(chǎn)品覆蓋約90%的機(jī)構(gòu)投資人。

在繪畫方面,“夏語冰”創(chuàng)作的水墨畫是唯一入選去年迪拜世博會(huì)中國館的人工智能繪畫作品。

又比如聲音,由小冰進(jìn)行詞曲創(chuàng)作及歌聲生成的各類作品,先后被采用為上海大劇院演出季、成都大運(yùn)會(huì)、世界人工智能大會(huì)等重要活動(dòng)的主題曲,也是今年首屆全民閱讀大會(huì)推廣曲集中,唯一入選的人工智能作品。

而至于現(xiàn)在為什么要推廣虛擬員工,小冰公司此前也是有所透露,這樣做的目的并不是要讓虛擬人替代人類,而是釋放機(jī)械性質(zhì)的勞動(dòng)力,讓人類更專注于創(chuàng)造性工作:

但目前的創(chuàng)新成就與未來理想狀態(tài)相比還有很長一段路要走。

因此,這次小冰公司的融資要全部投入研發(fā)也就不難理解了。

或許在不久的將來,和你共事的同事是虛擬人不再會(huì)是什么新鮮事,反倒身邊沒有虛擬人同事,會(huì)成為怪事兒。


*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。



關(guān)鍵詞: 小冰

技術(shù)專區(qū)

關(guān)閉