全球智能語音市場將達200億美元
在大數(shù)據(jù)、移動互聯(lián)網(wǎng)、云計算以及其他技術(shù)的推動下,全球的智能語音產(chǎn)業(yè)已經(jīng)步入應(yīng)用的快速增長期。
本文引用地址:http://butianyuan.cn/article/201605/291295.htm2010年前后,科技巨頭,例如谷歌、微軟和蘋果、科大訊飛紛紛強化在語音市場上的參與,全球的語音市場逐漸從一家獨大發(fā)展成為競爭市場,雖然從整體上看,該市場依然被巨頭牢牢把控。數(shù)據(jù)顯示,2015年,語音識別領(lǐng)頭羊公司Nuance依然牢牢占據(jù)著市場份額第一的寶座,占有率為31.1%,但是已經(jīng)呈現(xiàn)出明顯的下滑趨勢。而谷歌、微軟、蘋果和科大訊飛則獲得了迅速的增長,全球市場份額分別為20.7%、13.4%、12.9%和6.7%。
中國智能語音產(chǎn)業(yè)獲得了前所未有的發(fā)展。ResearchandMarkets估算認為,2015年,中國的語音市場規(guī)模為46.8億人民幣,比前一年增長53.1%,占世界的12%。
根據(jù)中國工業(yè)和信息化部電子科技信息情報研究所數(shù)據(jù)顯示,2013年,全球智能語音產(chǎn)業(yè)規(guī)模整體達33.7億美元,同比增長38.1%;2014年較2013年同比增長41.0%,產(chǎn)業(yè)規(guī)模大幅提升。預(yù)計到2017年,全球智能語音產(chǎn)業(yè)規(guī)模將達112.4億美元,復(fù)合年均增長率達35.1%。
語音產(chǎn)業(yè)從最初的萌芽到技術(shù)突破,再到產(chǎn)業(yè)化階段以及目前的快速應(yīng)用階段,已經(jīng)形成了相當成熟的產(chǎn)業(yè)。簡單看來,世界智能語音產(chǎn)業(yè)發(fā)展歷程可分為四個階段:
第一階段是技術(shù)萌芽階段(20世紀50~70年代),以孤立詞和少詞匯量句子識別,并通過關(guān)鍵詞匹配實現(xiàn)簡單命令操作為主要內(nèi)容,AT&T貝爾實驗室開發(fā)的Audrey語音識別系統(tǒng)是其主要標志。Audrey能夠通過跟蹤語音中的共振峰,識別10個英文數(shù)字,正確率高達98%。
第二階段是技術(shù)突破階段(20世紀80年代),語音識別和自然語言處理技術(shù)有了較大進展。智能語音技術(shù)研究由傳統(tǒng)的基于標準模板匹配的技術(shù)思路開始轉(zhuǎn)向基于統(tǒng)計模型(HMM)的技術(shù)思路,并再次提出了將神經(jīng)網(wǎng)絡(luò)技術(shù)引入語音識別問題的技術(shù)思路。
第三階段是產(chǎn)業(yè)化階段(20世紀90年代到21世紀初),智能語音技術(shù)由研究走向?qū)嵱貌㈤_始產(chǎn)業(yè)化,以1997年IBM推出的ViaVoice為重要標志。自此,智能語音產(chǎn)品開始進入呼叫中心、家電、汽車等各個領(lǐng)域。比如,上世紀70年代由美國國防部遠景研究計劃局資助的,旨在支持語言理解系統(tǒng)的研究開發(fā)工作的計劃DARPA,進入90年代后,研究重點已轉(zhuǎn)向識別裝置中的自然語言處理部分,識別任務(wù)設(shè)定為“航空旅行信息檢索”。
第四個階段是快速應(yīng)用階段(2010年以后),以蘋果Siri的發(fā)布為重要引爆點,智能語音應(yīng)用領(lǐng)域由傳統(tǒng)行業(yè)開始向移動互聯(lián)網(wǎng)等新興領(lǐng)域延伸。在一些發(fā)達國家,大量的語音識別產(chǎn)品已經(jīng)進入市場和服務(wù)領(lǐng)域并取得很好的效果。
快速應(yīng)用階段打開了市場的大門,消費者也可以看到琳瑯滿目的產(chǎn)品出現(xiàn),而隨著其他技術(shù)的發(fā)展,比如近年來全面開花的眾多人工智能技術(shù)不斷獲得突破,語音技術(shù)的市場發(fā)展?jié)摿σ苍谶M一步擴大。
高級的智能呼喚高級的語音
不難看到,語音技術(shù)在人工智能的發(fā)展中占有絕對重要的地位,它既是機器輸出語言,也就是“說話”的前提,也是機器輸入,也就是“聽”的保證。簡單地說,前者設(shè)計語音合成后者涉及語音識別,這都是智能語音的關(guān)鍵技術(shù)。
舉例來說,在科技領(lǐng)域,聊天機器人時下是一個火熱的話題,國外很多科技媒體都預(yù)言,聊天機器人大有取代App乃至取代搜索成為互聯(lián)網(wǎng)入口之勢。至少亞馬遜的Echo發(fā)布一年多便占領(lǐng)了語音控制智能家居的入口。同時,F(xiàn)acebook力推Messenger,谷歌也要憑借其強大的人工智能技術(shù)推出一款結(jié)合搜索的智能助理,微軟有定位于專用商務(wù)助理的Cortana,IBM的Waston積蓄已久,在醫(yī)療、環(huán)境、能源等行業(yè)都有動作。
微軟聊天機器人Cortana
谷歌、Facebook、微軟、IBM等國外企業(yè)正在積極推進智能語音技術(shù)的研發(fā)及應(yīng)用,以智能語音為切入點積極布局整個人工智能領(lǐng)域。語音交互作為人機交互的重要演進方向,從感知智能到認知智能,基于深度神經(jīng)網(wǎng)絡(luò)等方法,以語音語言為切入的認知計算將是人工智能發(fā)展的必然路徑。因此,語音交互技術(shù)在服務(wù)機器人博弈中扮演著十分重要的角色。
毫不遜色的中國造智能語音
外科技巨頭在語音上一如既往的強勢,可以說,語音已經(jīng)成為必爭之地。而語音識別領(lǐng)域,中國并不落后于發(fā)達國家,不少技術(shù)處于國際領(lǐng)先地位。
評論