語音交互領(lǐng)域 亞馬遜與京東必有一戰(zhàn)?
很多今年去了美國CES的人都有類似的感受,無人機(jī)和VR的熱度略減,智能設(shè)備的亮點(diǎn)乏善可陳。人工智能的應(yīng)用和產(chǎn)品并沒有超出去年初的期待值,而在熱點(diǎn)缺缺的CES2017上,一款“舊”應(yīng)用亞馬遜Alexa成為了為數(shù)不多的話題。
本文引用地址:http://butianyuan.cn/article/201702/343418.htm作為Amazon的AI語音助理系統(tǒng),Alexa+Echo的組合,在2014年11月,亞馬遜非常低調(diào)的推出了這套聲控兄弟組合。而在推出超過半年之后,智能揚(yáng)聲器Echo才得以在市場上進(jìn)行銷售。
有趣的是,與亞馬遜對(duì)Echo的低調(diào)不同,媒體和業(yè)界卻對(duì)這個(gè)產(chǎn)品給予了相當(dāng)大的關(guān)注。因?yàn)锳lexa與越來越多的應(yīng)用和設(shè)備互聯(lián),在人工智能火熱的大背景下,Echo搖身一變成為了智能家庭助手的新入口。
實(shí)際上,Echo并非在唱獨(dú)角戲,京東叮咚(DingDong)智能音箱和谷歌Google Home都在智能家庭助手的角度,先后對(duì)Echo造成了擠壓。那么,在三強(qiáng)鼎立的市場背景下,語音交互的格局要如何定義?Echo模式有沒有機(jī)會(huì)產(chǎn)生下一個(gè)巨頭?Echo在中國市場,有沒有走出來的可能?
語音交互注定是巨頭的游戲?
不談Echo這樣的智能入口模式,先來看看語音交互的商業(yè)模式。
其實(shí),科技巨頭們對(duì)語音交互早就有了明確的判斷。很早以前,比爾·蓋茨在美國卡內(nèi)基-梅隆大學(xué)發(fā)表演講時(shí)表示,語音技術(shù)等自然交互技術(shù)在不久的將來會(huì)成為智能硬件的重要功能。他認(rèn)為,未來幾年,互聯(lián)網(wǎng)搜索將更多通過語音命令來完成,而不僅僅是語音識(shí)別。從簡單的語音識(shí)別到智能化的人機(jī)語音交互,是語音技術(shù)未來發(fā)展的關(guān)鍵。這也許就是微軟之所以會(huì)投入“小冰”的最初背景。
同樣,喬布斯在世當(dāng)初也已經(jīng)認(rèn)識(shí)到了“觸控”這種人機(jī)交互方式的局限性。所在在2010年iPhone 4搭載Siri橫空出世,喬布斯希望以此開啟人工語音智能的人機(jī)交互革命。然而,當(dāng)時(shí)的Siri只能做到取悅用戶,發(fā)布僅僅數(shù)月后,絕大部分用戶對(duì)Siri功能失去新鮮感。
必須承認(rèn),在“解放雙手”這個(gè)層面上,人工語音智能在與人的交互上應(yīng)該做到無需上手,只需要簡潔的語音口令就實(shí)現(xiàn)絕大多數(shù)的手機(jī)使用場景,這是語音交互的迷人之處。
問題是,通過一個(gè)什么樣的設(shè)備作為語音交互的入口才是最合理的。是智能手機(jī)嗎?我認(rèn)為手機(jī)不失為一個(gè)好的入口,但智能手機(jī)與用戶的近距離,以及觸控的便利性,很難讓語音交互得到更好的應(yīng)用場景。所以,一個(gè)像“音箱”這樣的入口,開始顯示出它在家庭助手角度的光芒。
所以,Echo,京東叮咚(DingDong)智能音箱和谷歌Google Home來了。
前幾天看到一篇文章《中國Echo能以小米模式復(fù)制成功?》在分析Echo模式能不能誕生一個(gè)小米那樣的公司,得出的結(jié)論是很難。我認(rèn)為,這個(gè)分析的立足點(diǎn)本身就有存在很大的漏洞。第一,智能語音交互設(shè)備,絕不是手機(jī)一樣的通用產(chǎn)品,所以很難取得快速的市場效應(yīng),這對(duì)創(chuàng)業(yè)型公司是很大的壓力。第二,智能語音交互是一個(gè)成長中的生態(tài),而手機(jī)建立在安卓的體系下,并不需要對(duì)生態(tài)的成熟等太久。
所以,在我看來。智能語音交互的成功,一定是需要巨頭級(jí)的科技公司的。第一,這需要對(duì)技術(shù)的持續(xù)投入,語音交互技術(shù)本身是一個(gè)重要因素,而背后的人工智能技術(shù)、大數(shù)據(jù)分析和應(yīng)用場景的創(chuàng)新每一環(huán)都必不可少。第二,語音交互之后,則是各種設(shè)備和應(yīng)用的聯(lián)接,這種聯(lián)接的背后就是生態(tài)的成熟,從目前成功的模式看,能夠最終提供聯(lián)接的也會(huì)是一個(gè)大公司。
所以,我相信,智能語音交互的未來,始終離不開巨頭公司的身影,亞馬遜,谷歌,微軟和京東都會(huì)是其中有競爭力的玩家。
從場景看語音交互的未來格局
從市場上看,目前定位最接近的智能語音交互的產(chǎn)品應(yīng)該有三個(gè),分別是亞馬遜的Echo,谷歌的Google Home,和京東的叮咚(DingDong)智能音箱。
首先,從推出時(shí)間來看,Echo最早,是2014年底推出的。京東的叮咚(DingDong)智能音箱在2015年5月的CES上推出,時(shí)間上比Echo正式上市銷售的時(shí)間要早。最晚推出的是Google Home,在2016年5月的I/O開發(fā)者大會(huì)上推出。
但如果從應(yīng)用的場景擴(kuò)展來講,推出Echo的亞馬遜和推出叮咚(DingDong)智能音箱的京東,在企業(yè)基因和利用語音交互優(yōu)化電商的入口看,它們要比Google Home更有成功的機(jī)會(huì)。相比而言,面向智能家居聯(lián)接的Google Home,并沒有超出“家居”的概念本身。
所以說,Echo和叮咚(DingDong)智能音箱在未來必有一戰(zhàn),并不夸張。
去年的CES,叮咚(DingDong)智能音箱登陸拉斯維加斯,并與JBL簽署合作協(xié)議,利用JD+智能音頻解決方案,越來越多的音箱企業(yè)通過JD+智能音頻聯(lián)盟,步入到新的行業(yè)。。
今年1月的Alexa之所以在CES備受關(guān)注,是因?yàn)锳lexa與福特、華為、LG,以及多家創(chuàng)業(yè)公司均推出集成Alexa的家電、手機(jī)、汽車,以及其他數(shù)碼產(chǎn)品。讓業(yè)界看到了Alexa在未來生態(tài)的拓展初見規(guī)模。
實(shí)際上,叮咚(DingDong)智能音箱在生態(tài)拓展上也非常成功,在2016年6月,叮咚(DingDong)開放平臺(tái)的發(fā)布,已經(jīng)吸引了滴滴和e袋洗等企業(yè)加入叮咚(DingDong)音箱的智能生態(tài)。2016年10月,京東智能云語音服務(wù)開放平臺(tái)上線,用戶可通過叮咚呼叫第三方服務(wù),叮咚的家庭入口布局也真正完成了從交互到內(nèi)容到服務(wù)的全面布局,也迎來了美的和小天鵝等硬件廠家的加入。
目前看,無論是叮咚(DingDong)智能音箱還是Echo,都處于市場的培育階段。Echo從上市以來,500萬臺(tái)的銷量并不算驚艷,而叮咚(DingDong)智能音箱在中國市場的業(yè)績?cè)鲩L也足以媲美面向全球的Echo,在京東平臺(tái)上,目前叮咚智能音箱已經(jīng)成為wifi類音箱品類銷量第一。最后還有谷歌,當(dāng)初斥資32億美元收購了智能家居設(shè)備制造商N(yùn)est。盡管時(shí)至今日,Nest的發(fā)展不盡人意,但這對(duì)未來Google Home的發(fā)展也許會(huì)多了一些底氣。
中國市場,必有一戰(zhàn)的Echo和DingDong
首先從產(chǎn)品的對(duì)比而言,Echo的特點(diǎn)在于:圍繞語音交互設(shè)計(jì)的產(chǎn)品,定位于家庭的應(yīng)用場景,并通過開放系統(tǒng),為產(chǎn)品贏來源源不斷的第三方服務(wù)。
從技術(shù)上,亞馬遜設(shè)計(jì)了一個(gè)名為“ARS”的自動(dòng)語音識(shí)別處理系統(tǒng)。ARS由七個(gè)麥克風(fēng)和一個(gè)音頻信號(hào)過濾系統(tǒng)構(gòu)成。七個(gè)麥克風(fēng)組成的列陣能讓Echo捕捉到環(huán)境中的細(xì)微聲音,音頻信號(hào)過濾系統(tǒng)過濾掉環(huán)境噪音,從而辨別出人聲。使用ARS后,即使用戶在25英尺(7.62米)之外發(fā)出命令,Echo也能夠準(zhǔn)確識(shí)別。
而叮咚(DingDong)智能音箱,同樣是圍繞語音交互而設(shè)計(jì),但是應(yīng)用的場景要更廣闊。為什么呢?因?yàn)橹袊侨蚧ヂ?lián)網(wǎng)發(fā)展最快的地區(qū),例如O2O這種模式也僅有中國能夠走得通,這讓叮咚(DingDong)智能音箱的應(yīng)用場景變得更多。
技術(shù)上,負(fù)責(zé)設(shè)計(jì)叮咚(DingDong)智能音箱的靈隆科技,是京東和科大訊飛兩家公司合資而來。所以它不僅基于科大訊飛的語音識(shí)別技術(shù),比如遠(yuǎn)場識(shí)別技術(shù)和多輪對(duì)話能力。還包含了京東大數(shù)據(jù)對(duì)交互的分析能力。
其次,語音交互作為人工智能當(dāng)中最重要的組成部分,也是需要大量的數(shù)據(jù)來進(jìn)行學(xué)習(xí)。這也是為什么,我們發(fā)現(xiàn)很多的語音交互軟件很難識(shí)別方言。所以,Echo是英語世界目前最合適的語音交互設(shè)備,而叮咚(DingDong)智能音箱則對(duì)中文語境更有競爭力。
這對(duì)于快速發(fā)展中的中國市場而言,也許根本等不到Echo的到來,就會(huì)令它失去切入競爭的機(jī)會(huì)。如今,叮咚助手服務(wù)已經(jīng)接入百度音樂/喜馬拉雅、京東購物、互動(dòng)百科、E袋洗、有道筆記、JIMI、環(huán)境寶、中通快遞、中華萬年歷/中國天氣通等內(nèi)容端。這也從側(cè)面證明了叮咚(DingDong)智能音箱在中國市場目前所處的領(lǐng)先地位。
最后,無論是亞馬遜還是京東,他們的業(yè)務(wù)主體還是電商,所以他們最優(yōu)的應(yīng)用場景還在于購物的環(huán)節(jié)。換句話說,未來看Echo和叮咚(DingDong)智能音箱的競爭力,可以先從兩者對(duì)購物場景的接入能力開始。不久前,京東剛剛推出了基于叮咚(DingDong)音箱的語音購物,而亞馬遜則是在2015年5月推出了語音購物,所以在電商的真正戰(zhàn)場上,兩大智能語音交互平臺(tái)的對(duì)決,才剛剛開始。
評(píng)論