ADI:人工智能成主流,以語音識別作支撐
隨著人工智能被抄的如火如荼,作為人工智能行業(yè)重要研究領(lǐng)域之一的語音識別技術(shù)也獲得社會各界的矚目。所謂智能語音,其原理涉及聲學(xué)、語言學(xué)、數(shù)字信號處理、計算機科學(xué)等多個學(xué)科,研究周期長、投入成本大,技術(shù)壁壘高,全球和中國語音市場基本形成寡頭壟斷格局。隨著語音識別產(chǎn)業(yè)的快速發(fā)展,產(chǎn)業(yè)競爭進一步加劇,吸引眾多上游廠商特別是全球知名IC企業(yè)紛紛加入。
本文引用地址:http://butianyuan.cn/article/201609/310352.htm“就目前看來,語音識別技術(shù)尚不能完全替代傳統(tǒng)的‘人機界面’。但是存在著巨大的發(fā)展?jié)摿?,針對一些相對簡單的控制,比如控制家電的開關(guān)等,會被漸漸投入實際應(yīng)用。” 來自全球領(lǐng)先的半導(dǎo)體公司ADI的DSP亞洲業(yè)務(wù)區(qū)域經(jīng)理陸磊先生針對現(xiàn)今的語音識別技術(shù)發(fā)表看法。由此看出,語音識別技術(shù)在不久的將來將成為改變?nèi)藗兩畹目萍及l(fā)展的重要技術(shù)。
ADI公司DSP亞洲業(yè)務(wù)區(qū)域經(jīng)理 陸磊
若要將語音識別技術(shù)實現(xiàn)廣泛應(yīng)用,則需要跨越諸多技術(shù)瓶頸,在陸磊看來眾多企業(yè)最亟待解決的技術(shù)挑戰(zhàn),首先是對國內(nèi)各地方言的識別成功率,其次是較強背景音或噪音的基礎(chǔ)上進行目標語音識別,最后一點則是提升對于復(fù)雜句和長句的識別率。作為一家專注于DSP研發(fā)的企業(yè),ADI公司在語音識別領(lǐng)域具有強大的研發(fā)優(yōu)勢,陸磊認為:“DSP的一個傳統(tǒng)應(yīng)用就是語音處理,DSP的最大優(yōu)勢在于其運算量比同主頻的MCU運算性能高,可以在普通的語音識別算法上對聲音作更多的處理,比如,先行運用一定的運算消除背景噪音,再進行目標聲音的識別。”
在實現(xiàn)語音識別算法時,會常用到浮點運算,那定點和浮點DSP具體是如何在識別過程中相輔相成的呢?針對這一問題,陸磊表示:“定點和浮點DSP都是實現(xiàn)語音識別的必備元素。在識別過程中,浮點DSP的運算可以先進行定點化處理,隨后在定點DSP上運行。目前隨著浮點處理器的價格不斷降低,浮點處理器則逐漸成為廠商及工程師的首選。”
陸磊先生再采訪的最后還這樣表示道:“針對不同行業(yè)和應(yīng)用當(dāng)中的語音識別技術(shù),則需要按實際應(yīng)用場景采用不同的DSP。DSP作為運行語音識別算法的重要載體,需要提供最佳的綜合性能表現(xiàn),并將功耗,成本和功能三者達到最優(yōu)平衡。”
評論