機(jī)器人“大腦”:中國(guó)企業(yè)不比老外差!
《星際穿越》在中國(guó)大陸首映的當(dāng)天,光年無(wú)限創(chuàng)始人兼CEO 俞志晨攜自己的團(tuán)隊(duì)一同觀看了這部電影。在《星際穿越》中,有諸多對(duì)“蟲洞”的描述,蟲洞是宇宙中的隧道,它能扭曲空間,讓原本相隔億萬(wàn)公里的地方近在咫尺。熱愛物理學(xué)的俞志晨將公司第一款產(chǎn)品命名為“蟲洞語(yǔ)音助手”,這款產(chǎn)品支持自然語(yǔ)言理解的人機(jī)對(duì)話、智能問答應(yīng)用,可內(nèi)置于智能手機(jī)、智能硬件等平臺(tái)。
本文引用地址:http://butianyuan.cn/article/266689.htm俞志晨告訴記者,他們?cè)?010年就取了蟲洞語(yǔ)音助手這個(gè)名字,當(dāng)時(shí)業(yè)內(nèi)知道蟲洞這個(gè)詞的人寥寥無(wú)幾。近年來(lái),隨著科幻電影以及電視劇的普及,讓人們了解了蟲洞、黑洞、五維空間在內(nèi)的多種物理名詞,引發(fā)了國(guó)內(nèi)的科幻熱。從某種意義上說(shuō),科幻熱的興起反映了國(guó)人對(duì)于技術(shù)變革的期待。國(guó)內(nèi)的大部分互聯(lián)網(wǎng)公司只是在商業(yè)模式上取得了新的突破,而技術(shù)變革帶來(lái)的震動(dòng)將會(huì)是商業(yè)變革所無(wú)法比擬的。
俞志晨和他的團(tuán)隊(duì)正處于一場(chǎng)巨大技術(shù)變革的中心。2014年,全球十大科技核心熱點(diǎn)是智能機(jī)器,而智能機(jī)器終極的版本就是智能機(jī)器人。
就像30年前比爾蓋茨預(yù)言,每家每戶都會(huì)擁有PC一樣,智能機(jī)器人也將在十年之內(nèi)走進(jìn)每一個(gè)家庭。與此同時(shí),對(duì)于智能機(jī)器人核心——“大腦”的爭(zhēng)奪也進(jìn)入了白熱化階段。特別是產(chǎn)品出現(xiàn)的前夕,標(biāo)準(zhǔn)的爭(zhēng)奪更為激烈。在這場(chǎng)戰(zhàn)役中,我們欣喜的看到以小i機(jī)器人為代表的國(guó)內(nèi)公司與谷歌、蘋果、雅虎這些國(guó)際互聯(lián)網(wǎng)大佬站到了同一起跑線上。
虛擬機(jī)器人的啟蒙運(yùn)動(dòng)
其實(shí),上世紀(jì)90年代,國(guó)外很多實(shí)驗(yàn)室里面就已經(jīng)出現(xiàn)可以跟人互動(dòng)聊天的機(jī)器人。2011年底,隨著蘋果手機(jī)上Siri語(yǔ)音機(jī)器人的發(fā)布,聊天機(jī)器人概念真正爆發(fā),瞬間激活了全球智能機(jī)器人產(chǎn)業(yè)。自此,智能機(jī)器人進(jìn)入快速發(fā)展階段,谷歌相繼收購(gòu)了十家機(jī)器人公司,覆蓋運(yùn)動(dòng)、家庭服務(wù)、虛擬大腦等眾多領(lǐng)域,同時(shí)蘋果、微軟也都在全世界范圍內(nèi)大力發(fā)展相關(guān)業(yè)務(wù)。
機(jī)器人大致可分為兩大類,第一類是工業(yè)機(jī)器人,像機(jī)械手、機(jī)械臂這樣的形態(tài)在加工工廠里很普遍,上汽集團(tuán)里很多汽車制造都是由機(jī)器人完成的。未來(lái),全球人工成本將會(huì)不斷上漲,通過(guò)機(jī)器人去替代人工從而降低成本。工廠中的產(chǎn)品大多為流水化作業(yè),機(jī)器人操作起來(lái)難度并不大。另一類是服務(wù)類機(jī)器人,又叫家用機(jī)器人。家用機(jī)器人又分為兩類,一類為實(shí)體機(jī)器人,一類為虛擬機(jī)器人。
現(xiàn)階段,我們還把虛擬機(jī)器人和實(shí)體機(jī)器人割裂開,但未來(lái)二者一定會(huì)合二為一。虛擬機(jī)器人可以看做是實(shí)體機(jī)器人的前奏,而虛擬機(jī)器人最終會(huì)移植到實(shí)體機(jī)器人之中,或者是其他智能硬件。
雖然大眾還沒有享受實(shí)體機(jī)器人的帶來(lái)的好處,但是虛擬機(jī)器人已經(jīng)無(wú)處不在。手機(jī)用戶給運(yùn)營(yíng)商發(fā)送查詢短信就能得到相應(yīng)的自動(dòng)回復(fù),通過(guò)銀行的微信服務(wù)號(hào)及時(shí)查詢信用卡額度、積分,這些便利服務(wù)的背后就是虛擬機(jī)器人,更確切的說(shuō)是小i機(jī)器人。
國(guó)內(nèi)很多企業(yè)都有自己的呼叫中心,這些呼叫中心普遍面臨人工成本居高不下、用戶問題重復(fù)率高的問題。以招商銀行為例,平均每天有60萬(wàn)通交互,如果用人工來(lái)處理,最少需要兩三千人,有了i小機(jī)器人后,現(xiàn)在只用了12個(gè)人,95%的問題都是由機(jī)器人回答。
企業(yè)營(yíng)銷和服務(wù)的需求越來(lái)越強(qiáng)烈,今年11月,光年無(wú)限推出“圖靈機(jī)器人”,將自己的后臺(tái)開放給開發(fā)者,可以很好地與微博、微信、App、智能硬件相結(jié)合結(jié)合。
上海智臻網(wǎng)絡(luò)公司董事長(zhǎng)袁輝告訴記者,“在虛擬機(jī)器人這個(gè)領(lǐng)域,就像教育小孩子一樣,需要不斷去學(xué)習(xí),機(jī)器人也是。從小孩誕生,一年級(jí)、二年級(jí),積累不同行業(yè)的知識(shí)庫(kù)才能成長(zhǎng)的?!碧摂M機(jī)器人的研發(fā)需要極大的耐心和恒心,需要持久的關(guān)注和投入。
從軟到硬的發(fā)展路徑
隨著大數(shù)據(jù)、云計(jì)算、4G、智能硬件等相關(guān)技術(shù)的不斷成熟,袁輝認(rèn)為是時(shí)候重新啟動(dòng)他的夢(mèng)想了。袁輝告訴記者,“我們的名字就是小i機(jī)器人,公司創(chuàng)立之初就是想做實(shí)體機(jī)器人,只不過(guò)是當(dāng)時(shí)的硬件不具備條件而已。我當(dāng)年創(chuàng)立的夢(mèng)想和今天沒有區(qū)別,就是讓機(jī)器人改變?nèi)说纳?,每個(gè)人都擁有自己機(jī)器人?!?/p>
近兩三年來(lái),智能硬件風(fēng)靡全球,能夠支撐實(shí)體機(jī)器人的條件越來(lái)越成熟?!耙郧埃瑱C(jī)器人的身體不夠強(qiáng)壯,現(xiàn)在足夠強(qiáng)壯了,這樣我們就可以把大腦移植過(guò)來(lái)。以前大腦都是在互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)中使用,現(xiàn)在可以用實(shí)體機(jī)器人作為載體?!痹x在2011年就萌生了這樣的想法。
當(dāng)然,從軟到硬的發(fā)展路徑并不僅僅局限于智能實(shí)體機(jī)器人,智能電視、智能汽車、智能家居也是虛擬機(jī)器人大展宏圖的機(jī)會(huì)。袁輝向記者介紹道,LG、聯(lián)想等智能電視中,都搭載了小i機(jī)器人的系統(tǒng),用戶完全可以跟遙控器進(jìn)行語(yǔ)音對(duì)話,發(fā)出類似“我想看鋼鐵俠!”式的指令,智能電視便能提供相應(yīng)的服務(wù)。
與小i機(jī)器人不同,蟲洞語(yǔ)音助手最初的定位就是把手機(jī)變成智能化機(jī)器人。俞志晨認(rèn)為,手機(jī)除了跟機(jī)器人形狀不一樣,本質(zhì)并無(wú)太大區(qū)別。未來(lái),各種硬件不過(guò)就是功能硬件而已。
人工智能有三層次,分別是感知層、認(rèn)知層、控制操作層。感知層類似人的眼睛、耳朵、皮膚等,不斷去感知信息,并將其轉(zhuǎn)換成機(jī)器可以理解的語(yǔ)言。隨后,將感知到的信息反饋到認(rèn)知層,認(rèn)知層就像人的大腦一樣,做出相應(yīng)的判斷。最后,由控制操作層完成操作,例如講話或者拿東西等。
未來(lái),硬件終端只需要存在感知層和控制操作層,認(rèn)知層將會(huì)移步云端。也就是說(shuō),智能機(jī)器人的硬件只做兩件事兒,一個(gè)是感知外部信息,另一個(gè)是完成這件事情,比如發(fā)出聲音或者移動(dòng)幾步。這時(shí)候,手機(jī)、智能硬件、智能玩具只需要聯(lián)網(wǎng)即可。
多點(diǎn)開花的時(shí)代
當(dāng)硬件的成本越來(lái)越低,鏈條越來(lái)越成熟,產(chǎn)業(yè)化程度越來(lái)越高,未來(lái)機(jī)器人的硬件生產(chǎn)一定不是門檻。門檻體更多體現(xiàn)在軟件服務(wù),“如果說(shuō)一個(gè)20歲的小伙子長(zhǎng)得很帥,但你問他幾個(gè)問題他回答的像個(gè)智障。你還會(huì)喜歡他嗎?即便你硬件做的特別好,軟件很差,還是失敗的?!痹x如是說(shuō)。
IBM的Watson、谷歌大腦Nao、小i機(jī)器人、圖靈機(jī)器人都在人工智能的認(rèn)知層上做文章。語(yǔ)音只是認(rèn)知層的一部分,俞志晨將它比做耳朵,
“它只是一個(gè)引擎,把這種信號(hào)轉(zhuǎn)化成機(jī)器可以理解的語(yǔ)言。但是他真正去認(rèn)知、思考、決策,跟語(yǔ)音沒太大關(guān)系?!?/p>
很多時(shí)候,語(yǔ)音并不不是一個(gè)好的交互方式。在嘈雜的環(huán)境下,無(wú)論用戶怎樣喊叫都無(wú)濟(jì)于事,這個(gè)時(shí)候用戶能夠擺擺手或是搖搖頭,智能機(jī)器人就可以領(lǐng)會(huì)用戶傳達(dá)了“不”的意思。
未來(lái),像圖像、語(yǔ)音、體感交互等技術(shù)將會(huì)在認(rèn)知層、控制操作層上融合,用戶和智能機(jī)器人之間將會(huì)有多種交互方式。
LeapMotion CEO Michael Buckwald告訴記者,“對(duì)于機(jī)器人來(lái)說(shuō)我們要良好控制好機(jī)器人,全世界都是把這種控制作為一個(gè)研究,我們?nèi)绾螠?zhǔn)確控制機(jī)器人來(lái)抓東西,甚至如何控制機(jī)器人在太空修理機(jī)器?!盠eapMotion工作原理很簡(jiǎn)單,即通過(guò)兩個(gè)攝像頭捕捉手跟手指的動(dòng)作。手掌上面總共有14節(jié)指骨,5節(jié)掌骨總共27個(gè)骨頭,演算28個(gè)追蹤點(diǎn),追蹤更精細(xì),可以辨別左手跟右手。在新的算法了,還能夠區(qū)別抓取跟捏取,開發(fā)者更容易去發(fā)展他們所要、想要的功能。
今年8月,在LeapMotion入華的發(fā)布會(huì)上,兩位來(lái)自北京市第35中學(xué)的高中生向大家展示了,如何借助LeapMotion,優(yōu)雅操作地機(jī)器人。在演示過(guò)程中,通過(guò)電腦程序和機(jī)器人連接,就可以用手來(lái)控制復(fù)雜的機(jī)器臂。比如說(shuō)讓機(jī)器人遞一杯水,人們?cè)诂F(xiàn)實(shí)中的第一反應(yīng)是伸手去抓,隨即機(jī)器臂就會(huì)去抓,而不是不是去刻意控制拿水、遞水的每個(gè)角度。
語(yǔ)音識(shí)別、圖像識(shí)別、體感交互都是人工智能一部分,現(xiàn)在還沒有一家公司能把每一領(lǐng)域都做好。人工智能發(fā)展的第一步是各點(diǎn)開花,第二步是融合,第三步才是智能化。顯然,現(xiàn)在還處于各點(diǎn)開花的階段,未來(lái)幾年會(huì)慢慢融合。
融合帶來(lái)的好處將是成本的降低。智能機(jī)器人定價(jià)居高不下,一款看似很普通的機(jī)器人動(dòng)輒10萬(wàn)塊,購(gòu)買者往往都是極客,普通消費(fèi)者并不會(huì)購(gòu)買。俞志晨告訴記者,“硬件機(jī)器人很貴就是因?yàn)樗麄冊(cè)谕瑫r(shí)做感知、認(rèn)知、控制操作這三件事。如果是分離的話,認(rèn)知層去云端,硬件成本會(huì)降低,如果真的跟手機(jī)一樣便宜,智能機(jī)器人才會(huì)走進(jìn)每個(gè)家庭,這個(gè)事兒才合理?!?/p>
在很多科幻電影中,機(jī)器人能夠?yàn)橹魅俗鏊械氖虑?,現(xiàn)實(shí)生活中顯然是不現(xiàn)實(shí)的,或者說(shuō)實(shí)現(xiàn)的路徑比較長(zhǎng)。未來(lái),智能機(jī)器人的服務(wù)會(huì)走向場(chǎng)景化,把每個(gè)場(chǎng)景都做到極致,再談融合。在眾多場(chǎng)景中,用戶黏性最高的有三類,分別是4—10歲的小孩,50歲以上的老人,車載用戶。其中,智能玩具、老年人陪護(hù)機(jī)器人都已經(jīng)在國(guó)外一一實(shí)現(xiàn)。
2006年,袁輝去講機(jī)器人,臺(tái)下大家就說(shuō)你講的太好了,能不能把機(jī)器人牽出來(lái)我看看。當(dāng)時(shí)大家都停留在工業(yè)、物理這個(gè)認(rèn)識(shí)層面,對(duì)虛擬大腦就沒有認(rèn)識(shí)。熬過(guò)了十幾年,外部環(huán)境終于具備了,小i機(jī)器人還活著,并擁有了先發(fā)的優(yōu)勢(shì),這是讓袁輝最慶幸的事。他向記者許諾,不久后就能在市面上買到和還海外公司合作的實(shí)體機(jī)器人,并且是普通消費(fèi)者能夠承擔(dān)的費(fèi)用。
評(píng)論