AI大航海時(shí)代,對(duì)話機(jī)器人如何引領(lǐng)交互方式變革
自計(jì)算機(jī)出現(xiàn)以來(lái),人機(jī)交互界面經(jīng)歷了命令行到圖形化界面的更新迭代,而隨著人工智能(AI)在生活中的逐漸普及和應(yīng)用,例如蘋(píng)果的Siri、亞馬遜的Alex,甚至是京東的JIMI已經(jīng)紛紛闖入我們的生活,我們現(xiàn)在正在經(jīng)歷從圖形化界面向?qū)υ捠浇缑娴募夹g(shù)變革時(shí)刻,而這其中,對(duì)話機(jī)器人的發(fā)展將會(huì)是一個(gè)關(guān)鍵點(diǎn)。
本文引用地址:http://butianyuan.cn/article/201801/374486.htm圖形化界面VS對(duì)話式界面
比較一下圖形化界面和對(duì)話式界面,主要有以下四點(diǎn)差異:
1)圖形化界面是二維的,更加重視廣度;對(duì)話式界面是一維的,更加注重深度,用戶可以更專注于一件事情上。
2)圖形化界面更加注重空間感,主次關(guān)系也要通過(guò)顏色和距離感來(lái)實(shí)現(xiàn)差異化,這是圖形化界面設(shè)計(jì)時(shí)的一個(gè)原則;對(duì)話式界面更加強(qiáng)調(diào)的是時(shí)間感,例如剛剛討論的話題,過(guò)一段時(shí)間討論同樣的話題就不太重要了。
3)圖形化界面更加強(qiáng)調(diào)共性,就用戶體驗(yàn)來(lái)看,在圖形化界面,同一個(gè)系統(tǒng)中每個(gè)人看到的東西都差不太多;對(duì)話式界面則更強(qiáng)調(diào)個(gè)性,我們每個(gè)人的對(duì)話內(nèi)容都是不一樣的,對(duì)話機(jī)器人和我說(shuō)的話應(yīng)該和另外一個(gè)人說(shuō)的話不一樣,更加偏個(gè)性一些。
4)圖形化界要求比較穩(wěn)定,用戶希望不要天天改版;對(duì)話式界面則是進(jìn)化的,用戶更希望說(shuō)過(guò)的話不需要一遍一遍地再去重復(fù)。
由此可見(jiàn),在更注重個(gè)性化和精準(zhǔn)度的當(dāng)下,對(duì)話式界面顯然更符合用戶需求。
對(duì)話機(jī)器人根據(jù)應(yīng)用場(chǎng)景不同主要可以分為三類:個(gè)人信息助理、聊天機(jī)器人和客服導(dǎo)購(gòu)機(jī)器人。
個(gè)人信息助理是用對(duì)話形態(tài)做人機(jī)交互比較好的應(yīng)用場(chǎng)景,同時(shí)由于基本上都是由行業(yè)巨頭在做的,例如蘋(píng)果、谷歌、亞馬遜等,因而發(fā)展速度較快,應(yīng)用也比較多。愛(ài)因互動(dòng)CTO洪強(qiáng)寧先生介紹稱,其實(shí),這一領(lǐng)域也確實(shí)應(yīng)該由巨頭來(lái)做,因?yàn)槿肟谑莻€(gè)人信息助理最核心部分,要想將其做好,就要能夠?qū)崿F(xiàn)快速調(diào)動(dòng),而最好的入口資源大部分都是掌控在巨頭手中的。同時(shí),隨著技術(shù)飛速發(fā)展,也有很多不同技術(shù)在個(gè)人信息助理中應(yīng)用來(lái)提升其用戶體驗(yàn),預(yù)計(jì)一兩年后,大家會(huì)比較習(xí)慣用個(gè)人信息助理,例如智能手機(jī)、智能手表及家里的智能音箱。
聊天機(jī)器人相對(duì)于另外兩類對(duì)話機(jī)器人較為簡(jiǎn)單,這類機(jī)器人并不能完成具體某項(xiàng)任務(wù),主要用作心理陪伴和娛樂(lè)。針對(duì)這類對(duì)話機(jī)器人,對(duì)話輪次是一個(gè)比較重要的技術(shù)指標(biāo),能夠與用戶進(jìn)行自然對(duì)話輪次越多,時(shí)間越長(zhǎng),可以說(shuō)機(jī)器人的能力就越好。目前來(lái)看,業(yè)內(nèi)最好的聊天機(jī)器人能夠與人類自然對(duì)話二十多輪,再往后聊,你就能夠發(fā)現(xiàn)它跟不上人類的思維了。目前應(yīng)用在聊天機(jī)器人上比較好的技術(shù)是seq2seq算法,為了提高其在聊天中的應(yīng)對(duì)能力,還需要使用諸多增強(qiáng)技術(shù),例如為聊天機(jī)器人注入背景信息、個(gè)人信息、知識(shí)庫(kù)信息,并引入上下文等。
客服導(dǎo)購(gòu)機(jī)器人是為了完成一件事情與機(jī)器人溝通,最后能夠達(dá)到某種目的。在這種應(yīng)用場(chǎng)景中,尤其是在做售前應(yīng)用時(shí),主要有三種主要的對(duì)話形態(tài):人主導(dǎo)的形態(tài),即人問(wèn)一個(gè)問(wèn)題,機(jī)器回答一個(gè)問(wèn)題;機(jī)器人主導(dǎo)形態(tài),即機(jī)器人問(wèn)人問(wèn)題,人來(lái)回答;交叉主導(dǎo)形態(tài),即人問(wèn)一個(gè)問(wèn)題,機(jī)器人發(fā)現(xiàn)不知道該怎么答,會(huì)反問(wèn)一句,人回答了機(jī)器人的問(wèn)題之后,機(jī)器人再給出答案。大體上可以分成這三種形態(tài),很多其他復(fù)雜的對(duì)話則是由這三種形態(tài)反復(fù)切換來(lái)實(shí)現(xiàn)。其中人主導(dǎo)的形態(tài)是最簡(jiǎn)單的形態(tài),也是目前在商業(yè)應(yīng)用中最為成熟的形態(tài)。
作為AI領(lǐng)域重要重要內(nèi)容之一,對(duì)話機(jī)器人有怎樣的技術(shù)要求?需要怎樣的工程團(tuán)隊(duì)?初創(chuàng)企業(yè)又該怎樣入局?近日,《電子產(chǎn)品世界》編輯在“AI時(shí)代的移動(dòng)技術(shù)革新”大會(huì)上采訪了愛(ài)因互動(dòng)CTO洪強(qiáng)寧先生。
語(yǔ)音市場(chǎng)發(fā)展趨于成熟,創(chuàng)業(yè)公司更應(yīng)關(guān)注語(yǔ)義
電子產(chǎn)品世界:在對(duì)話機(jī)器人領(lǐng)域,創(chuàng)業(yè)公司應(yīng)該怎樣選擇切入點(diǎn)?
洪強(qiáng)寧:語(yǔ)音轉(zhuǎn)文本和文本轉(zhuǎn)語(yǔ)音,現(xiàn)在都有比較專業(yè)的公司在做,而且很多企業(yè)做得已經(jīng)很好了,對(duì)于創(chuàng)業(yè)公司而言,我們覺(jué)得現(xiàn)在再去做語(yǔ)音就是技術(shù)的浪費(fèi)了,而更應(yīng)該將資源用到像語(yǔ)義這樣發(fā)展還不是很完備的方向。
現(xiàn)在在做語(yǔ)義的大概有兩種形態(tài):一種形態(tài)是做基礎(chǔ)語(yǔ)義服務(wù)的,并不在乎具體的應(yīng)用場(chǎng)景,例如情感探測(cè)、實(shí)體抽取等;另外一種是做應(yīng)用場(chǎng)景的,像我們是在考慮機(jī)器人在具體應(yīng)用場(chǎng)景下該怎樣去回答問(wèn)題,和場(chǎng)景與行業(yè)聯(lián)系的非常緊密。
在真實(shí)的應(yīng)用場(chǎng)景中,需要用到語(yǔ)音識(shí)別的時(shí)候,我們會(huì)調(diào)用第三方的服務(wù)來(lái)生成文本,例如科大訊飛等廠商的語(yǔ)音識(shí)別做得已經(jīng)很好了,我們可以直接使用他們的技術(shù)完成前面語(yǔ)音識(shí)別部分,而從文本理解是什么含義的時(shí)候則是用到我們自己的技術(shù),因?yàn)檫@項(xiàng)技術(shù)還沒(méi)有一家公司聲稱做出了一個(gè)任何場(chǎng)景都可以使用的平臺(tái),針對(duì)售前對(duì)話機(jī)器人,我們的技術(shù)效果是更好的;同時(shí),這也是我們的核心競(jìng)爭(zhēng)力和技術(shù)壁壘,我們需要在這上面去深入研究。
機(jī)器人服務(wù)平臺(tái)要先做專用領(lǐng)域
電子產(chǎn)品世界:如何理解現(xiàn)在的通用機(jī)器人服務(wù)平臺(tái)和專用機(jī)器人服務(wù)平臺(tái)?
洪強(qiáng)寧:工程團(tuán)隊(duì)的一個(gè)非常大的產(chǎn)出是在機(jī)器人服務(wù)平臺(tái)上,但是創(chuàng)建對(duì)外開(kāi)發(fā)的機(jī)器人服務(wù)平臺(tái)目前從商業(yè)上看還不是一個(gè)好的時(shí)機(jī),因?yàn)楝F(xiàn)在對(duì)話機(jī)器人仍然是和場(chǎng)景緊密結(jié)合的,現(xiàn)在還不太可能脫離場(chǎng)景去搭建一個(gè)通用的機(jī)器人服務(wù)平臺(tái)。
實(shí)際上,前兩年已有通用的機(jī)器人服務(wù)平臺(tái)出現(xiàn),但是效果都不是很好。因而我們更加傾向于做行業(yè)專用的平臺(tái),先使機(jī)器人服務(wù)平臺(tái)在售前應(yīng)用中用起來(lái)效果非常好,之后再在這個(gè)基礎(chǔ)上做泛化,做到其他場(chǎng)景中去。
現(xiàn)在我們正在規(guī)劃一個(gè)大的機(jī)器人服務(wù)平臺(tái),這個(gè)是一個(gè)工程化的事情,需要做云平臺(tái)、PAAS架構(gòu),需要在服務(wù)功能飛速增長(zhǎng)的時(shí)候有一個(gè)非常好的、穩(wěn)定的服務(wù),能夠包括像大數(shù)據(jù)處理等。這個(gè)機(jī)器人服務(wù)平臺(tái)是我們內(nèi)部自己用的,是為了加快算法調(diào)優(yōu)的速度,使算法工程師不再需要去關(guān)心一些工程上的技術(shù)細(xì)節(jié),更專注到算法調(diào)優(yōu)本身。
對(duì)話設(shè)計(jì)師將會(huì)成為新崗位
電子產(chǎn)品世界:AI創(chuàng)業(yè)公司更需要怎樣的人才,對(duì)工程團(tuán)隊(duì)有怎樣的要求?
洪強(qiáng)寧:對(duì)于AI創(chuàng)業(yè)公司來(lái)說(shuō),更需要的是項(xiàng)目落地人才,即能夠把AI的技術(shù)應(yīng)用到具體場(chǎng)景中的人才。如果是純研究算法的人,對(duì)于高校或者是研究院會(huì)更小,而對(duì)于創(chuàng)業(yè)公司則會(huì)更關(guān)注落地的能力,我們追求的是效果,而不是炫酷的技術(shù),有的時(shí)候會(huì)發(fā)現(xiàn)深度學(xué)習(xí)的效果還不如一些傳統(tǒng)方法的時(shí)候,我們也會(huì)選擇傳統(tǒng)的方法。
同時(shí),工程團(tuán)隊(duì)也需要懂AI算法。工程團(tuán)隊(duì)如果完全不懂算法的話是無(wú)法和算法工程師進(jìn)行配合的,工程團(tuán)隊(duì)做的很大一部分是建立機(jī)器人服務(wù)平臺(tái),算法工程師是平臺(tái)的用戶,因而工程團(tuán)隊(duì)需要知道算法工程師需要的東西是什么,從而給他們提供好用的工具,也需要了解AI是怎么做的,至少需要知道數(shù)據(jù)是怎樣組織的、訓(xùn)練是怎么一回事、模型是怎么加載的,在這些地方,哪些是性能的瓶頸,這都需要工程團(tuán)隊(duì)的工程師完全了解的。
電子產(chǎn)品世界:做對(duì)話機(jī)器人的公司相對(duì)于其他AI行業(yè)會(huì)有怎樣的特別需要?
洪強(qiáng)寧:在對(duì)話機(jī)器人領(lǐng)域,產(chǎn)品經(jīng)理有一個(gè)很重要的工作職責(zé)是做對(duì)話設(shè)計(jì),這個(gè)也可能是未來(lái)可能產(chǎn)生的一個(gè)新崗位?,F(xiàn)在對(duì)話機(jī)器人的技術(shù)還做不到完全像人一樣溝通,這個(gè)崗位要考慮的是當(dāng)機(jī)器和人對(duì)話的時(shí)候,如何設(shè)計(jì)機(jī)器人的語(yǔ)言,使整個(gè)對(duì)話變得更自然,這個(gè)技術(shù)在真實(shí)落地的應(yīng)用中是一件很重要的事情。
AI人才緊缺現(xiàn)狀與高薪資現(xiàn)狀
電子產(chǎn)品世界:如何理解AI人才緊缺和高薪資這一現(xiàn)狀?
洪強(qiáng)寧:掌握新技術(shù)的人就是整個(gè)社會(huì)的推動(dòng)力,社會(huì)也一定對(duì)這種人才的需求是非常旺盛的。其實(shí)我們現(xiàn)在身處第四次工業(yè)革命的開(kāi)始階段,在變革的早期,這樣的人才很少,掌握這類技能的人才被市場(chǎng)爭(zhēng)搶在所難免。在任何技術(shù)早期,你掌握了這項(xiàng)技術(shù),薪資都會(huì)相對(duì)較高,但是同時(shí)也會(huì)有這樣一個(gè)趨勢(shì):AI技術(shù)越來(lái)越成為程序員一個(gè)基礎(chǔ)技術(shù)。例如谷歌在面試程序員的時(shí)候,不論你面試的是哪個(gè)崗位,都會(huì)考察你的AI能力。
這就類似云計(jì)算的發(fā)展,云計(jì)算發(fā)展這么多年,現(xiàn)在工程師如果不懂云計(jì)算的基礎(chǔ)知識(shí)就不是一個(gè)合格的程序員。未來(lái),十年以后,如果不懂得AI的工程師就不是一個(gè)合格的程序員。隨著掌握AI技術(shù)的人群越來(lái)越多,薪資水平也將會(huì)逐漸回到一個(gè)相對(duì)合理的狀態(tài)。
AI創(chuàng)業(yè)公司與大公司競(jìng)爭(zhēng)的優(yōu)勢(shì)
電子產(chǎn)品世界:與大公司相比,創(chuàng)業(yè)公司有哪些競(jìng)爭(zhēng)優(yōu)勢(shì)?
洪強(qiáng)寧:相比巨頭公司,創(chuàng)業(yè)公司動(dòng)作更快,關(guān)注點(diǎn)更超前。創(chuàng)業(yè)公司更多專注于場(chǎng)景,而對(duì)于單個(gè)場(chǎng)景的投入,大公司往往是不足的,只有可能觸及到平臺(tái)利益時(shí),大公司才會(huì)投入大量資源與創(chuàng)業(yè)公司競(jìng)爭(zhēng),而只要?jiǎng)?chuàng)業(yè)公司在這之前建立起很好的競(jìng)爭(zhēng)壁壘,是不害怕這樣的競(jìng)爭(zhēng)。
AI行業(yè)其實(shí)一個(gè)很好的范例,AI行業(yè)需要的是數(shù)據(jù)的積累,而不論是大公司還是小公司都需要時(shí)間的積累收集數(shù)據(jù)和處理數(shù)據(jù),例如收集數(shù)據(jù)、清洗數(shù)據(jù)、理解數(shù)據(jù)以及結(jié)合應(yīng)用場(chǎng)景的過(guò)程,而這些都需要時(shí)間和經(jīng)驗(yàn)的積累,并不是說(shuō)大公司會(huì)比小公司擁有有更多的競(jìng)爭(zhēng)優(yōu)勢(shì)。
對(duì)話機(jī)器人的準(zhǔn)確率評(píng)判指標(biāo)
電子產(chǎn)品世界:如何評(píng)判對(duì)話機(jī)器人的準(zhǔn)確率,現(xiàn)在對(duì)話機(jī)器人準(zhǔn)確率是多少?
洪強(qiáng)寧:對(duì)話機(jī)器人大概可以分為兩類:閑聊機(jī)器人和任務(wù)導(dǎo)向機(jī)器人。對(duì)于閑聊機(jī)器人,對(duì)話輪次是一個(gè)評(píng)價(jià)指標(biāo),時(shí)間越長(zhǎng),機(jī)器人做的就越好;而對(duì)于任務(wù)導(dǎo)向機(jī)器人,主要有兩個(gè)評(píng)價(jià)指標(biāo):任務(wù)完成率和攔截率。
對(duì)于任務(wù)導(dǎo)向機(jī)器人,我們是希望他可以幫我辦事的,這個(gè)時(shí)候,對(duì)話輪次就不再是一個(gè)很好的指標(biāo),相對(duì)短的輪次反而會(huì)更好;針對(duì)此類機(jī)器人,單輪對(duì)話會(huì)有準(zhǔn)確率的概念,具體指機(jī)器人對(duì)用戶提問(wèn)響應(yīng)是否正確就是準(zhǔn)確率,此時(shí)任務(wù)完成率會(huì)作為核心指標(biāo)。
而有些準(zhǔn)確率的數(shù)據(jù)是不可信的,例如機(jī)器人自己對(duì)自己作出決策和評(píng)價(jià),即攔截率。這是指你說(shuō)的話,機(jī)器人覺(jué)得可以回答的比率;而準(zhǔn)確率是指我答了,而且還答對(duì)的比率。因而準(zhǔn)確率是要比攔截率要低一些的。
現(xiàn)在的準(zhǔn)確率還是要人來(lái)判斷的,而為了降低工作量,機(jī)器人可以先做一個(gè)預(yù)判,然后人再做更正。針對(duì)對(duì)話機(jī)器人,具體準(zhǔn)確率要分應(yīng)用場(chǎng)景,越復(fù)雜、用戶說(shuō)的話越發(fā)散,準(zhǔn)確率會(huì)越低, 大體上應(yīng)該會(huì)在百分之七十多到百分之九十多之間波動(dòng)。 如果是單輪問(wèn)答,主要還會(huì)取決于知識(shí)庫(kù)的建立情況,一般在百分之八十多到百分之九十多之間波動(dòng)。
對(duì)話機(jī)器人要達(dá)要到人的平均水平,至少還要十年
電子產(chǎn)品世界:當(dāng)下很多智能產(chǎn)品并不夠智能,對(duì)話機(jī)器人也還處在“低配智能”階段,還要多久我們才能到達(dá)“高配智能”階段?
洪強(qiáng)寧:現(xiàn)在對(duì)話機(jī)器人,甚至AI還處在早期大航海時(shí)代,大家都在嘗試在各種應(yīng)用場(chǎng)景下使用這個(gè)技術(shù),根據(jù)反饋去優(yōu)化和調(diào)整。我們會(huì)全力以赴地關(guān)注用戶的反饋,快速更新技術(shù),并不斷完善我們的產(chǎn)品。
就智能的程度而言,現(xiàn)在確實(shí)是受限的,不光是對(duì)話機(jī)器人,整個(gè)AI行業(yè)都存在這個(gè)問(wèn)題,不管是深度學(xué)習(xí),還是傳統(tǒng)機(jī)器學(xué)習(xí)方法,都面臨著準(zhǔn)確率不為100%的現(xiàn)狀。通過(guò)學(xué)習(xí)大量的現(xiàn)有知識(shí),然后生成一個(gè)模型,用這個(gè)模型去匹配現(xiàn)有的知識(shí),預(yù)測(cè)之后的輸入可以給出一個(gè)怎樣的輸出,這樣的一個(gè)模型永遠(yuǎn)都會(huì)與真實(shí)模型有一定的誤差。雖然可以用深度學(xué)習(xí)的方法不斷增加學(xué)習(xí)信息,準(zhǔn)確率會(huì)越來(lái)越高,但永遠(yuǎn)都無(wú)法達(dá)到100%。
我們并不能期望對(duì)話機(jī)器人不出錯(cuò),要期望的是對(duì)話機(jī)器人出的錯(cuò)要比人少。我覺(jué)得現(xiàn)在談像人一樣的對(duì)話機(jī)器人還尚早,至少還要兩三年,對(duì)話機(jī)器人在某些特定場(chǎng)景能夠達(dá)到人的平均水平;而要談通用對(duì)話機(jī)器人能夠達(dá)到人的平均水平,甚至在某些特定場(chǎng)景超越人類,至少還要十年之久。
評(píng)論