AIUI:開(kāi)啟人機(jī)交互新紀(jì)元
導(dǎo)語(yǔ):12月21日,科大訊飛2015年度發(fā)布會(huì)在北京圓滿落幕。會(huì)上,科大訊飛董事長(zhǎng)劉慶峰發(fā)布了建設(shè)在全新語(yǔ)音交互技術(shù)基礎(chǔ)上的人工智能時(shí)代的人機(jī)交互界面——AIUI
本文引用地址:http://butianyuan.cn/article/201602/286778.htmAIUI——重新定義人機(jī)交互
語(yǔ)音技術(shù)作為智能硬件的重要入口,可讓人機(jī)的交互內(nèi)容更豐富,體驗(yàn)更自然簡(jiǎn)潔。然而目前的語(yǔ)音交互在實(shí)際應(yīng)用中依然不盡如意。
l 交互需要按照雙方的發(fā)言順序來(lái)緩沖識(shí)別;
l 距離、環(huán)境噪音等因素嚴(yán)重影響了語(yǔ)音識(shí)別的正確率;
l 系統(tǒng)不能完全理解用戶的真實(shí)本意;
這些問(wèn)題使得交互的后續(xù)執(zhí)行和結(jié)果變得牛頭不對(duì)馬嘴。
在萬(wàn)物互聯(lián)時(shí)代,要真正實(shí)現(xiàn)流暢的人機(jī)交互,劉慶峰認(rèn)為必須滿足四點(diǎn):第一是遠(yuǎn)場(chǎng)降噪;第二是方言識(shí)別;第三是全雙工,隨時(shí)隨地在聽(tīng);第四個(gè)自動(dòng)糾錯(cuò),主動(dòng)糾錯(cuò),你可以打斷它,然后多輪對(duì)話,上下文相關(guān)。只有這些都具備,才是萬(wàn)物互聯(lián)時(shí)代真正的人機(jī)語(yǔ)音交互系統(tǒng)。
所以在這個(gè)基礎(chǔ)上我們以語(yǔ)音為主結(jié)合圖像視覺(jué)及手寫識(shí)別,把整個(gè)人工智能功能集成在一起,推出了業(yè)界首個(gè)人工智能的用戶交互界面——AIUI。
AIUI集成了包括雙全工技術(shù)、麥克風(fēng)陣列技術(shù)、聲紋識(shí)別技術(shù)、方言識(shí)別、語(yǔ)義理解技術(shù)和和內(nèi)容服務(wù)。通過(guò)統(tǒng)一的交互接口,可以讓訊飛各種人工智能能力,非常方便的被用戶使用。在線離線能力的靈活搭配,并具備很強(qiáng)的服務(wù)拓展的功能,使得未來(lái)最新的人工智能成果都可以放到AIUI的統(tǒng)一界面下。
AIUI標(biāo)準(zhǔn)-人機(jī)智能交互標(biāo)準(zhǔn)
我們是如何將個(gè)思路變成現(xiàn)實(shí)的?第一是軟硬件一體化,智能硬件可以直接采購(gòu)訊飛的各種類型的麥克風(fēng)陣列,使它360度使它五到八米之外都可以方便的來(lái)操控這個(gè)設(shè)備,所以首先是軟硬件一體化。
其次是云和端一體。有越來(lái)越多的家電設(shè)備智能家居它不聯(lián)網(wǎng),那么能聯(lián)網(wǎng)我們的能力在后臺(tái),如果不能聯(lián)網(wǎng)或者我們要節(jié)約后臺(tái)運(yùn)算資源可以直接有端的解決方案。就像我們?cè)谳斎敕ㄖ械谝淮芜@個(gè)提供了業(yè)界最好的輕量級(jí)的手機(jī)的輸入法,不需要聯(lián)網(wǎng)直接說(shuō)話就可以變成文字。
第三是技術(shù)服務(wù)一體化。通過(guò)這個(gè)AIUI的界面我們可以給各個(gè)開(kāi)發(fā)伙伴各種應(yīng)用差異化的定制,可以定制不同聲音。那么,當(dāng)然我們也可以各種語(yǔ)音識(shí)別的場(chǎng)景,包括后臺(tái)的語(yǔ)義定制可以實(shí)現(xiàn)技術(shù)服務(wù)一體化。
這3個(gè)基礎(chǔ)上,我們提供了統(tǒng)一的AIUI的標(biāo)準(zhǔn),就真正的定義人工智能時(shí)代的人機(jī)交互的標(biāo)準(zhǔn),有了這個(gè)統(tǒng)一的標(biāo)準(zhǔn)未來(lái)在我們平臺(tái)上的各種各樣的設(shè)備,各種各樣的服務(wù),都是可以互聯(lián)互通相互分享支持相互去碰撞去學(xué)習(xí)的。
如何使用AIUI?
AIUI具備非常強(qiáng)的普適性和非常方便的調(diào)動(dòng)性,可以支持穿戴式設(shè)備、智能家居、機(jī)器人等各種智能硬件設(shè)備。其實(shí)使用也是非常方便,只需就4個(gè)簡(jiǎn)單步驟:
第一步:登錄訊飛開(kāi)放平臺(tái)(www.xfyun.cn),一鍵獲取方案
第二步:安裝麥克風(fēng)陣列模塊
第三步:集成SDK
第四步:云端服務(wù)&差異化定制
作為中國(guó)最大的智能語(yǔ)音技術(shù)提供商,科大訊飛在智能語(yǔ)音技術(shù)領(lǐng)域有著長(zhǎng)期的研究積累。核心技術(shù)代表了世界最高水平,并在語(yǔ)音合成、語(yǔ)音識(shí)別、口語(yǔ)評(píng)測(cè)、自然語(yǔ)言處理等多項(xiàng)技術(shù)上擁有國(guó)際領(lǐng)先的成果,占有中文語(yǔ)音技術(shù)市場(chǎng)70%以上市場(chǎng)份額??拼笥嶏w整合了各技術(shù)領(lǐng)域多年的研究成果,構(gòu)建了全球首個(gè)智能人機(jī)交互平臺(tái)——“訊飛開(kāi)放平臺(tái)”:將以語(yǔ)音交互為核心的人工智能技術(shù)開(kāi)放給業(yè)界開(kāi)發(fā)者。目前AIUI已經(jīng)在訊飛開(kāi)放平臺(tái)開(kāi)放合作,隨著各產(chǎn)品領(lǐng)域的持續(xù)豐富和合作伙伴的不斷加入,“訊飛開(kāi)放平臺(tái)”將不斷為產(chǎn)業(yè)發(fā)展推波助瀾。
評(píng)論