新聞中心

EEPW首頁 > 智能計(jì)算 > 業(yè)界動態(tài) > 聽懂”人話 智能語音爭奪人工智能皇冠上的“明珠”

聽懂”人話 智能語音爭奪人工智能皇冠上的“明珠”

作者: 時間:2019-03-04 來源:億歐網(wǎng) 收藏

  吼一吼就可登App?近日,云知聲聲紋登錄系統(tǒng),成功率可達(dá)99%。與先行者科大訊飛相似,兩家公司創(chuàng)始人師出同門。

本文引用地址:http://www.butianyuan.cn/article/201903/398189.htm

  除了專業(yè)的語音技術(shù)廠商,互聯(lián)網(wǎng)科技巨頭也紛紛涌入語音賽道中來。2月20日,在小米的新品發(fā)布上,小愛觸屏音箱亮相,而在這兩天前,騰訊也出面澄清,聽聽(音箱)一直在正常研發(fā)和銷售運(yùn)營,面向行業(yè)輸出全棧語音解決方案能力。

  被譽(yù)為皇冠上的“明珠”,近段時間以來熱度不減,隨著深度學(xué)習(xí)技術(shù)的突破,大數(shù)據(jù)技術(shù)以及自然語言理解能力的提升,帶動了一波產(chǎn)業(yè)熱潮,除了在教育、客服、電信等傳統(tǒng)行業(yè)之外,還開辟出了車載、家居、醫(yī)療、智能硬件等語音技術(shù)應(yīng)用新天地。

  “聽懂”人話,語音方案“百花齊放”

  走進(jìn)廣州迅羽通信技術(shù)公司的客服中心,敲擊鍵盤的聲音不再此起彼伏,客服人員更多在傾聽和安靜地回復(fù)來電。

  迅羽先后承運(yùn)了香港快運(yùn)、電訊盈科、和記電訊、東亞銀行、亞航以及廣東省12348司法、廣東電力與國稅熱線等國內(nèi)外超大型客服服務(wù)。一直以來,傳統(tǒng)的客服呼叫中心是勞動密集型產(chǎn)業(yè),由于內(nèi)地人力成本優(yōu)勢,香港一些電信業(yè)、銀行業(yè)、航空業(yè)等將呼叫中心外包,但隨著人力成本的提升,呼叫中心的利潤進(jìn)一步被壓縮。

  從去年9月起,迅羽聯(lián)合哈工大共同成立自動問答技術(shù)研發(fā)實(shí)驗(yàn)室,著手引入AI。經(jīng)測算,有七成動作是可替代的——客服人員大部分時間都在文字錄入和反復(fù)確認(rèn),而如今,每當(dāng)客戶一報(bào)完身份證號碼、家庭地址等信息時,就已經(jīng)自動錄入系統(tǒng),而客服人員則可專注聽取客戶的反饋。在臺風(fēng)等極端天氣下,面對激增的訂改機(jī)票業(yè)務(wù)也更從容,避免了人員配備過多。

  機(jī)器能“聽懂”人話,已經(jīng)深入各種場景??拼笥嶏w與上海高院合作的刑事案件輔助辦案系統(tǒng)投用后,目前已開始在全國范圍內(nèi)擴(kuò)展,輔助辦案系統(tǒng)有望在國內(nèi)法院系統(tǒng)全面鋪開,并向更多罪種、民商行政案件等方向延伸,截至今年初,審訊產(chǎn)品于法庭拓展迅速,已覆蓋815個法院、4200個法庭。

  陪你聊,陪你跳,會管家,會傳情……深圳狗尾草智能科技公司不僅推出了呆萌又暖心的情感社交機(jī)器人,還打造出全球首個3D全息AI虛擬生命“琥珀”,在日趨白熱化的語音市場中走出了一條差異化道路。

  “幫我調(diào)下明天上午7點(diǎn)的鬧鐘。”語音識別距離大眾并不遙遠(yuǎn),在移動終端上,用戶可以實(shí)現(xiàn)手機(jī)讀短信、介紹餐廳、詢問天氣、語音設(shè)置鬧鐘等,智能音箱更被認(rèn)為是控制智能家居的自然入口,從“百箱大戰(zhàn)”到現(xiàn)在的語音方案“百花齊放”,互聯(lián)網(wǎng)平臺商、語音技術(shù)硬件服務(wù)商、內(nèi)容和云服務(wù)商、芯片商等,都相繼推出了各自支持設(shè)備智能化升級的方案。

  不是替代人,而是更好發(fā)揮人的價值

  通過人工交互,機(jī)器不僅能聽懂人話,還能更好地發(fā)掘人的價值。

  通過匯聚學(xué)生的家庭作業(yè)、課堂訓(xùn)練數(shù)據(jù),科大訊飛用語音識別對內(nèi)容進(jìn)行語義理解分析,判斷作業(yè)對錯,提供改進(jìn)方案?!叭斯ぶ悄?大數(shù)據(jù)結(jié)合因材施教,比如同一個班學(xué)生對內(nèi)容接受度是不一樣的,每個人的知識點(diǎn)情況掌握又是怎樣的,單個學(xué)生上一個知識點(diǎn)有沒有掌握,都可以有針對性地改進(jìn)。”科大訊飛高級副總裁杜蘭說。

  杜蘭說,AI賦能教育產(chǎn)業(yè)不是要取代老師這個職業(yè),而是可替代批改等瑣碎事務(wù),解放老師更多時間。

  迅羽副總經(jīng)理黃勉超也同樣認(rèn)為,AI的出現(xiàn),并不是要用機(jī)器人來取代人,而是與機(jī)器有更好分工,“有一半用戶是帶著情緒或投訴打進(jìn)電話來,但如果他們面對的是一臺毫無表情的機(jī)器,只會繼續(xù)帶著憤怒掛掉電話”。

  黃勉超還發(fā)現(xiàn),引入AI后,客服業(yè)務(wù)有了更多科技含量,品牌形象大為提升,公司在招人時也更有底氣,“以前這行業(yè)的人會覺得,大好青春就在這1平米的格子間日復(fù)一日從事簡單枯燥的事情,他們會覺得沒有前途,而現(xiàn)在工作沒有那么枯燥后,人員流動沒有那么頻繁,而且人員培訓(xùn)周期也大為縮短,新手很快就可以進(jìn)入角色,在整個過程中,人的價值就發(fā)揮出來了”。

  向B端發(fā)力,與產(chǎn)業(yè)結(jié)合構(gòu)筑生態(tài)

  盡管智能音箱大戰(zhàn)火熱,但不少人始終認(rèn)為,目前AI產(chǎn)品尤其是語音產(chǎn)品還只是一種年輕人的科技玩具,實(shí)用性并不強(qiáng)。

  狗尾草創(chuàng)始人、CEO邱楠對此表示,任何一個代表未來方向的科技類產(chǎn)品的流行,比如手機(jī)、電腦、智能手表等,一定是從年輕人開始。年輕人對AI有想象力,他們知道自己需要的場景是怎樣的。盡管現(xiàn)有AI技術(shù)還不足夠成熟,但這就和電腦早期發(fā)展一樣,技術(shù)本身是需要時間去發(fā)展的。當(dāng)年P(guān)C也同樣是從最開始的性能不足到后面慢慢被消費(fèi)者接受。

  C端產(chǎn)品火過一陣后,越來越多的玩家開始深入B端,與行業(yè)相結(jié)合。黃勉超說,C端產(chǎn)品可以戲謔、搞笑的方式與用戶溝通,當(dāng)用戶說我要在附近找吃時,智能音箱回答不了就會說,“哎呀,你是個吃貨”,但客服語音對答就不能有絲毫調(diào)侃,用戶查詢明天下午3:30是否有飛往大阪的航班,有就是有,沒有就是沒有,不可能存在第三個答案。

  不過,整體移動互聯(lián)網(wǎng)用戶增長見頂,以及BAT等行家也紛紛入局,語音技術(shù)日趨成熟,客戶變對手,讓科大訊飛的技術(shù)優(yōu)勢漸消。但杜蘭認(rèn)為,BAT的到來會讓語音技術(shù)變得更好,這片海域是非常寬闊的,并不存在相互競爭的問題。

  而科大訊飛也在加快構(gòu)建一個融合共享的人工智能產(chǎn)業(yè)生態(tài)。有這樣一個經(jīng)典的故事:一位四川人石城川,11歲那年高燒因失去聽覺,2015年,他發(fā)現(xiàn)科大訊飛有一種語音識別技術(shù),盡管自己聽不到自己的發(fā)音,但是可以通過這種技術(shù)矯正自己發(fā)音,并識別正常人的語音轉(zhuǎn)換成文字,這樣就可以實(shí)現(xiàn)自己和正常人的對話。在咿咿呀呀的發(fā)音中,他重拾語言能力。后來,他創(chuàng)立了“音書”App,為聽障者和健聽者之間建立溝通的橋梁。

  目前,科大訊飛開放平臺已為超過90萬開發(fā)者提供服務(wù),2018年,共有55.8%的創(chuàng)業(yè)團(tuán)隊(duì)借助科大訊飛技術(shù)實(shí)現(xiàn)創(chuàng)業(yè)夢想。

  隨著技術(shù)迭代更新越來越快,語音識別準(zhǔn)確率方面的提升越來越難,在眾多玩家之間,競爭差距是更大還是更小?“企業(yè)間并不存在太大的技術(shù)差距,早期都是同一個技術(shù)公司,隨著技術(shù)紅利和技術(shù)壁壘的下降,后期推動開源,不只是看單一的技術(shù)能力?!鼻耖f,論技術(shù),有哪一家企業(yè)能競爭過中科院?但企業(yè)是給技術(shù)找到技術(shù)場景,在此基礎(chǔ)上不斷延展,競爭的維度一定是多元的,語音技術(shù)的壁壘也不會一直持續(xù)下去。

  “我把企業(yè)分成兩大類,分別是技術(shù)輸出型和產(chǎn)品創(chuàng)新型,前者如谷歌,輸出安卓系統(tǒng);后者如蘋果,其技術(shù)能力是為自己定義差異化、尋找差異化服務(wù)?!鼻耖f,我給我們的定位就是追求產(chǎn)品的差異化和創(chuàng)新性。

  專家點(diǎn)評:智能語音市場整體處于啟動期

  智能語音是最早落地的人工智能技術(shù)。隨著行業(yè)數(shù)據(jù)資源的積累,深度學(xué)習(xí)算法的進(jìn)步,以及與其他人工智能技術(shù)之間的整合,語音識別、語義理解、語音合成技術(shù)將取得進(jìn)一步突破,語音交互有望成為新一代人機(jī)交互的主要方式。

  目前,國內(nèi)外幾乎所有的科技巨頭都相繼進(jìn)入了智能語音市場,國外有IBM的Watson、GoogleNow、蘋果的Siri、微軟的Cortana、Facebook的MessagePlatform、亞馬遜的Aleax等,國內(nèi)有阿里的天貓精靈、百度的度秘、騰訊的微信語音,以及科大訊飛、華為、小米、云知聲、依圖等發(fā)展的智能語音技術(shù)和產(chǎn)品。據(jù)《2017-2018中國智能語音產(chǎn)業(yè)白皮書》的數(shù)據(jù)顯示,2014年至2018年,中國智能語音產(chǎn)業(yè)規(guī)模由30億元增長至159.7億元,五年間增長了五倍。雖然有這么多的科技巨頭和新創(chuàng)AI企業(yè)進(jìn)入智能語音領(lǐng)域,產(chǎn)業(yè)規(guī)模也快速增長,但智能語音市場整體依然處于啟動期,智能語音產(chǎn)品和技術(shù)變現(xiàn)尚處于起步階段,真正成熟的語音產(chǎn)品還需要時間的打磨。

  國家高度重視新一代人工智能產(chǎn)業(yè)的發(fā)展,隨著新一代人工智能發(fā)展規(guī)劃的啟動實(shí)施,加快產(chǎn)業(yè)化和應(yīng)用是著力點(diǎn)。工信部將進(jìn)一步推動以智能語音為代表的人工智能核心技術(shù)發(fā)展,加強(qiáng)技術(shù)攻關(guān)、促進(jìn)行業(yè)融合應(yīng)用、優(yōu)化發(fā)展環(huán)境,務(wù)實(shí)推動智能語音產(chǎn)業(yè)規(guī)模發(fā)展??梢灶A(yù)見,隨著行業(yè)應(yīng)用和場景的大規(guī)模切入,智能語音產(chǎn)品將快速迭代,產(chǎn)品的性能和用戶體驗(yàn)也會不斷提升,智能語音的發(fā)展大有可期。



關(guān)鍵詞: 智能語音 人工智能

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉