新聞中心

EEPW首頁 > 消費電子 > 設(shè)計應(yīng)用 > 智能手機的超性能語音識別技術(shù)

智能手機的超性能語音識別技術(shù)

作者: 時間:2011-03-30 來源:網(wǎng)絡(luò) 收藏
未來的方向

本文引用地址:http://butianyuan.cn/article/166191.htm

  詢問參加開發(fā)的每一個人下一個巨大的步驟是什么。他們一般會給你一個答案:自然語言處理。

  Revis把它解釋為理解你的意思的系統(tǒng),它不僅僅知道你說什么。在會話式的互動模式中,用戶說自己要說的話,沒有限制用戶如何說這個話。他提供了指令或者要求得到信息的例子,如“我在什么地方能夠買到100美元以下的尼康照相機?”或者“給杰尼發(fā)個短信說我晚到20分鐘”或者“今天晚上在Morton's訂三個人的地方”。

  谷歌的Mane稱,在口語對話中提供自然的語言處理是一個雙重挑戰(zhàn)。首先,你必須這些單詞,然后,你必須理解這個意思。第一部分變得更加容易了。但是,第二部分仍然很難解決:意思是根據(jù)上下文確定的和難以應(yīng)付的,人類做的語法分析也不是總是成功的。

  微軟的Rele認(rèn)為,提供的額外的服務(wù)(如羅盤或者GPS)能夠增強自然語言處理的有用性。他說,你可以為兩個人安排吃飯和看電影,方法是利用不同來源的數(shù)據(jù)把這個任務(wù)分開,如使用日歷、飯店排名、電影評論和位置等數(shù)據(jù)。

  此外,的服務(wù)能夠用于提供講話的環(huán)境。Rele表示,用戶的輸入以及從其它有關(guān)用戶及用戶環(huán)境的傳感器和狀態(tài)獲得的信息可以提供更豐富的和更相關(guān)的結(jié)果。例如,如果你剛剛使用Foursquare網(wǎng)站查看有關(guān)飯店,一些含糊的指令就會傾向于外出吃飯、訂膳宿和要一輛出租車等事情。

  多平臺應(yīng)用程序Vlingo自稱是“虛擬助手”,已經(jīng)能夠提供這些方面的功能。這個軟件插入到OpenTable和Fandango等服務(wù)中以完成許多任務(wù):訂飯店、訂電影票等等。

  Nguyen認(rèn)為未來語音改善的另一個領(lǐng)域是游戲。他說,在游戲中可以使用語音以增加玩游戲的不同氛圍。例如,你可以把Kirk-style船長的命令傳遞給恒星飛船或者在在一個神秘的事情中審訊疑犯。

  是你嗎?

  已經(jīng)應(yīng)用的另一個功能是自動地把語音適用于單個用戶。這是臺式電腦語音識別所要求的免提版語音訓(xùn)練。

  例如,最新版本的谷歌語音搜索有一個選擇性加入功能,允許隨著時間的推移建立一個用戶的客戶化語音特征。Mane解釋說,當(dāng)用戶選擇使用客戶化語音識別的時候,我們在用戶和用戶的語調(diào)方面畫一個界限,這使我們能夠建立一個初步的、個性化的語音識別模式。

  然而,個性化識別并不是一個能夠解決一切問題的技術(shù),它只是實現(xiàn)語音識別更加無縫化的一個過渡步驟。Mane稱,我們沒有把個性化識別看作一個唯一的解決方案,因為還會有更多的一系列的技術(shù)創(chuàng)新。Mane認(rèn)為,這種技術(shù)未來的改進需要我們的用戶更積極的參與。

  結(jié)論

  一直是許多技術(shù)的孵化器和推動因素,這包括硬件和軟件技術(shù)。到目前為止,在這個組合中增加語音功能僅產(chǎn)生了逐步的改善,谷歌語音應(yīng)用程序的很好的功能。

  但是,這些改進正逐步地為更重要的進步鋪平道路。移動技術(shù)為如何聚集這些新技術(shù)提供了一個全新的舞臺。下一步也許不是一個理解你說的一切事情的手機,而是能夠充分理解你說的事情的一個更有用的手機。


上一頁 1 2 下一頁

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉