新聞中心

EEPW首頁 > 消費電子 > 業(yè)界動態(tài) > 智能音箱大戰(zhàn):中國會誕生亞馬遜Echo?

智能音箱大戰(zhàn):中國會誕生亞馬遜Echo?

作者: 時間:2017-07-12 來源:21世紀經(jīng)濟報道 收藏
編者按:從早期的京東叮咚音箱到近期的喜馬拉雅小雅AI音箱、阿里天貓精靈,中國市場已經(jīng)有著眾多搭載智能語音技術(shù)的硬件產(chǎn)品,但遺憾的是,并沒有一款像亞馬遜Echo這樣深入大眾后流行起來。

  7月5日,阿里推出了自己的首款消費級AI產(chǎn)品天貓精靈X1,同日百度也宣布了DuerOS開放平臺,可以支持基于語音和圖像識別的智能產(chǎn)品開發(fā)。

本文引用地址:http://www.butianyuan.cn/article/201707/361622.htm

  細數(shù)當前的領(lǐng)域的玩家,既匯集了亞馬遜、谷歌、蘋果、微軟、三星等國際巨頭,阿里、京東、小米、聯(lián)想等國內(nèi)企業(yè)也紛紛入局。

  Strategy Analytics今年6月下旬發(fā)布的研究報告顯示,全球基于Wi-Fi的無線音箱出貨量在2016年增長62%達到1400萬臺,其中,亞馬遜在增量中占有77%的份額。


智能音箱大戰(zhàn):中國會誕生亞馬遜Echo?


  一位不愿具名的行業(yè)人士向21世紀經(jīng)濟報道記者分析認為,亞馬遜以語音為入口接入家庭智能,整個處理在云端進行,背后是軟件、硬件以及開發(fā)者的完整生態(tài)。由于一些國外的云服務(wù)和內(nèi)容在國內(nèi)不能使用,未來中國肯定會有像亞馬遜一樣做平臺生態(tài)的公司出現(xiàn),開放硬件接口給廠商,這也給本土企業(yè)帶來新機遇。

  語音交互落地

  “從90年代末IBM推出了第一款商品化的語音識別系統(tǒng)ViaVoice,到比爾·蓋茨倡導(dǎo)下一代語音交互界面,做了十幾年還沒有成功案例。真正教育了用戶和市場,給行業(yè)樹立很好的標桿?!痹?月7日-7月9日舉辦的CCF-GAIR全球人工智能與機器人峰會上,元趣信息技術(shù)CEO吳義堅說。

  亞馬遜于2014年發(fā)布的能夠依靠語音助手Alexa實現(xiàn)音樂播放、新聞搜索、網(wǎng)購下單、Uber叫車、外賣預(yù)定等服務(wù),被認為打開了物聯(lián)網(wǎng)的一個重要入口,以此成為行業(yè)標桿。據(jù)不完全統(tǒng)計,截至目前,Echo在全球已經(jīng)賣出超過一千萬臺。

  “Echo的成功,讓更多人相信未來物聯(lián)網(wǎng)的入口應(yīng)該是智能語音識別器,這是Synaptics把語音納入人機界面的一個重要原因?!比藱C界面交互解決方案設(shè)計制造公司Synaptics于6月宣布收購了語音音頻處理方案商Conexant(科勝訊系統(tǒng)),其副總裁兼中國區(qū)總經(jīng)理盧兵此前向21世紀經(jīng)濟報道記者介紹,“我們一致認為,語音已經(jīng)到了一個時間點,會成為下一代人機界面的主要功能?!?/p>

  目前來看,近場語音的識別率已經(jīng)達到了相當高的程度,科大訊飛、搜狗等語音輸入可以達到95%以上的準確率,但實際的使用場景中還有很多障礙需要跨越。“從遠距離、噪音環(huán)境的處理,口音、方言的支持,智能化場景對聯(lián)動、控制、兼容性的要求等方面存在各種各樣的問題。我們覺得大規(guī)模商用過程中,目前我們的技術(shù)和產(chǎn)品還沒有那么成熟?!遍T羅機器人創(chuàng)始人楊興義認為,語音語義在用戶體驗的角度還處在比較早期的階段。

  超多維創(chuàng)始人兼董事長戈張日前向21世紀經(jīng)濟報道記者分析認為,未來的產(chǎn)品發(fā)展在外觀、硬件、服務(wù)、設(shè)計上會越來越綜合化,產(chǎn)品并不只是一款硬件,還包含軟件平臺、算法、內(nèi)容等,是個系統(tǒng)工程。Echo的優(yōu)勢一方面在于它的控制能力,另一方面是它的服務(wù)能力。要做成一款成功的智能語音產(chǎn)品,并商業(yè)落地,不是一件容易的事。

  中國會否出現(xiàn)Echo?

  從事語義理解的驀然認知CEO戴帥湘表示并不看好音箱品類?!耙蔀橐粋€爆款,需要有存量市場,產(chǎn)品有延續(xù)性。推一個新品類需要強大的說服用戶的能力,這是有難度的。”

  他解釋稱,中美客廳文化存在差異,音箱在國內(nèi)家庭并沒有足夠的使用習(xí)慣,市場沒那么大。但他也認為入局者眾至少可以教育民眾,對整個交互產(chǎn)業(yè)鏈都是好事。驀然認知目前主要打造的交互場景是家居和車載,這被戴帥湘認為“前景廣闊”。

  在吳義堅看來,中國已經(jīng)具備誕生Echo的土壤,其中阿里是有可能做成Echo生態(tài)的——在人工智能語音上,阿里最近幾年從全球范圍內(nèi)籠絡(luò)到很多資深人才加入,有很強的技術(shù)積累;它也有大量音樂、內(nèi)容、電商等方面的服務(wù),具備商業(yè)化的條件。

  據(jù)悉,一個語音產(chǎn)品方案由三部分組成,硬件前端包括麥克風(fēng)陣列、降噪算法、芯片、硬件平臺等,云端包括語音識別和語義理解、語音數(shù)據(jù),內(nèi)容合作有音樂、天氣、短信、通話等應(yīng)用工具。如果未來消費電子都支持語音交互,這也將帶來從元器件到內(nèi)容服務(wù)全產(chǎn)業(yè)鏈的重構(gòu)。

  從國內(nèi)的產(chǎn)業(yè)鏈上看,聲智科技CEO陳孝良指出,首先麥克風(fēng)要在性能、低功耗上做很大的改進,“整個全球市場上中國的麥克風(fēng)產(chǎn)業(yè)占的比重很小,核心技術(shù)不在國內(nèi)。而且我們現(xiàn)在做的麥克風(fēng)是標量麥克風(fēng),只能取一個物理量,下一步要解決很復(fù)雜的聲學(xué)問題,需要矢量麥克風(fēng)。我們國內(nèi)相對會落后一點?!贝送?,芯片、算法上的原創(chuàng)性技術(shù),以及商業(yè)化方面也都面臨挑戰(zhàn)?!皣鴥?nèi)的內(nèi)容和服務(wù)相對比較割裂,但亞馬遜就把很多優(yōu)勢集中在一起?!?/p>

  他同時指出,遠場語音交互開始是智能音響,但是將來絕對不僅僅是智能音響,技術(shù)還會擴展到很多其他的產(chǎn)品。



關(guān)鍵詞: 智能音箱 Echo

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉