君林科技：聲紋識別前景無限，重點(diǎn)問題亟需解決

作者：時(shí)間：2018-04-27 來源：電子產(chǎn)品世界

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

　　近年來，隨著AI的市場需求日益增加、技術(shù)革新以及重大政策利好，人工智能已逐漸普及。根據(jù)各方面的數(shù)據(jù)和報(bào)告顯示，智能家居產(chǎn)品銷量與日俱增，智能音箱產(chǎn)品的銷量更是驚人，僅某品牌的智能音箱月銷售量就有數(shù)百萬臺。而人工智能在金融和安防等領(lǐng)域的應(yīng)用同樣越來越廣泛，這些新興力量打破了傳統(tǒng)行業(yè)壁壘，不斷獲得發(fā)展。

本文引用地址：http://butianyuan.cn/article/201804/379170.htm

　　這些發(fā)展勢頭迅猛的人工智能有一個(gè)共通點(diǎn)，就是非常需要以聲紋識別作為技術(shù)補(bǔ)充。有了聲紋識別，能使彌補(bǔ)這些人工智能的固有缺陷;有了聲紋識別，能提高這些人工智能的性能，使之更為人性化，從而更好地為人類服務(wù)。

　　以智能家居為例，盡管通過語音控制，它可以為我們的生活提供很多幫助和便利。我們只要說出指令，就可以操縱智能音箱、智能多媒體、智能車載系統(tǒng)等家居生活的必需品。不過，在具體操縱的過程中，人們?nèi)匀粫?huì)碰到一些令人頭疼的問題。

　　如果聲音環(huán)境比較嘈雜或者混亂，語音識別系統(tǒng)就很難正確識別出用戶發(fā)出的命令。而當(dāng)多個(gè)人同時(shí)發(fā)出指令或同時(shí)發(fā)出類似指令的聲音的時(shí)候，也會(huì)給系統(tǒng)造成混亂，系統(tǒng)很難識別出應(yīng)該聽取誰的指令。

　　類似這種問題，最好的解決辦法就是加入聲紋識別技術(shù)。通過聲紋識別技術(shù)，可以對人聲進(jìn)行更準(zhǔn)確地定位和捕捉，同時(shí)進(jìn)行降噪處理，從而讓智能家居系統(tǒng)準(zhǔn)確地識別出發(fā)出指令的用戶。

　　而在銀行金融領(lǐng)域，現(xiàn)行的智能系統(tǒng)主要是運(yùn)用于進(jìn)行遠(yuǎn)程身份認(rèn)證。對于銀行借貸、社保資金領(lǐng)取等個(gè)人金融項(xiàng)目的操作來說，安全性和便利性都是十分重要的。因此，銀行等金融行業(yè)為民眾提供了一種遠(yuǎn)程身份認(rèn)證的操作，可以獨(dú)自在家完成認(rèn)證和資金領(lǐng)取。即便距離再遠(yuǎn)，也不會(huì)耽誤事。但目前主流的身份驗(yàn)證方式是通過手機(jī)短信驗(yàn)證碼驗(yàn)證，這種驗(yàn)證方式的安全性極低，手機(jī)一旦丟失或被盜，金融賬戶的損失隨時(shí)會(huì)很嚴(yán)重。

　　因此，出于對安全性和便捷性的雙重需求，將聲紋識別作為金融行業(yè)身份驗(yàn)證的補(bǔ)充手段是十分有必要的。在遠(yuǎn)程場合下的金融驗(yàn)證，有了聲音來防偽，大大提升了安全性。而用戶只需說出指定話語即可完成驗(yàn)證，操作方式也并不復(fù)雜。

　　聲紋識別在安防領(lǐng)域的作用就更為突出。沒有聲紋識別的安防系統(tǒng)，智能程度越高，其實(shí)就越危險(xiǎn)。試想一下，當(dāng)說話人的身份不受限制的時(shí)候，大到我們的住宅、公司，小到我們的房間、電腦、私人空間，都可以輕易被入侵。入侵者只要像我們一樣，對系統(tǒng)發(fā)出指令，就可以突破安防。

　　當(dāng)然，有了聲紋識別的安防系統(tǒng)，就不必?fù)?dān)心這些問題。因?yàn)槊總€(gè)人的聲音本質(zhì)上都是不同的，是很難被模仿或復(fù)制的。即便別有用心的人想通過模仿我們的聲音來入侵安防系統(tǒng)，也不能得逞。

　　所以說，借助聲紋識別，各個(gè)行業(yè)的智能系統(tǒng)都可以進(jìn)一步提升性能，并且，更好地為用戶服務(wù)。不管是從眾多人聲中準(zhǔn)確辨認(rèn)用戶，還是確認(rèn)說話人的身份，聲紋識別對這些智能系統(tǒng)來說都是不可或缺的。

　　雖然聲紋識別在各行各業(yè)當(dāng)中體現(xiàn)出巨大的價(jià)值，但在實(shí)操階段，聲紋識別仍面臨著很多困難。其中最顯著的就是聲紋采集的困難和方言、情緒化對聲紋識別的影響問題。

　　聲紋識別的首要步驟和關(guān)鍵前提就是進(jìn)行聲紋采集，只有收集到足夠豐富的聲紋信息，建立起完善的數(shù)據(jù)庫，聲紋識別才能夠具備準(zhǔn)確性和可操作性。而且，采集到豐富而多樣化的聲紋信息還有利于機(jī)器和系統(tǒng)進(jìn)行深度學(xué)習(xí)，畢竟智能識別系統(tǒng)是通過大量的數(shù)據(jù)來進(jìn)行訓(xùn)練和學(xué)習(xí)的。但目前聲紋信息的把控權(quán)牢牢掌握在公安和政府部門手中，這就給企業(yè)的聲紋采集工作帶來極大的困難。他們需要通過多個(gè)渠道進(jìn)行大量的前期工作，采集到足夠的聲紋信息，才能建立恰當(dāng)?shù)穆暭y識別系統(tǒng)。

　　另外，人類的方言、口音差異，以及不同狀態(tài)下的聲音狀況不同，都會(huì)對聲紋識別造成一定的影響。如果聲紋識別系統(tǒng)只能夠識別標(biāo)準(zhǔn)的普通話，那說方言和口音重的人的身份可能就很難被識別出來。同樣的道理，說話人的情緒有高漲或低落的時(shí)候，在不同的狀態(tài)下，聲音也會(huì)有微小的差異，這些差異同樣會(huì)導(dǎo)致聲紋識別發(fā)生錯(cuò)誤。因此，如何在動(dòng)態(tài)識別中準(zhǔn)確判斷出聲音的本質(zhì)特征對于聲紋識別來說是非常重要，也是非常困難的。

　　盡管，聲紋識別在各個(gè)領(lǐng)域都占有舉足輕重的地位，應(yīng)用也日益廣泛，但具體應(yīng)用仍然存在著很多困難。這些困難和問題是聲紋識別發(fā)展道路上絕對不能夠忽視的，需要我們用多種技術(shù)手段去盡快調(diào)整和解決。

　　北京君林科技股份有限公司，專業(yè)的電聲企業(yè)，打造人工智能時(shí)代的金耳朵。面向全球，提供最領(lǐng)先的音頻領(lǐng)域解決方案和專業(yè)服務(wù)，基于聲學(xué)推動(dòng)人工智能技術(shù)產(chǎn)品落地。

　　公司以打造人工智能領(lǐng)域的音頻硬件平臺及系統(tǒng)平臺，使君林技術(shù)成為人工智能音頻領(lǐng)域不可或缺的環(huán)節(jié)為發(fā)展目標(biāo)。并以此為基礎(chǔ)，全面覆蓋聲學(xué)技術(shù)-固件算法-智能硬件-系統(tǒng)驅(qū)動(dòng)-云服務(wù)-大數(shù)據(jù)-Ai技術(shù)等技術(shù)鏈。

　　君林科技擁有一整套完整的聲音處理系統(tǒng)解決方案。用戶可以使用已有或者定制的音頻數(shù)據(jù)采集方案，通過君林科技聲紋REST API上傳至云端，由人工智能算法進(jìn)行建模，識別與認(rèn)證，有效得為企業(yè)創(chuàng)造最大價(jià)值。

新聞中心

君林科技：聲紋識別前景無限，重點(diǎn)問題亟需解決

評論

相關(guān)推薦

技術(shù)專區(qū)

新聞中心

君林科技：聲紋識別前景無限，重點(diǎn)問題亟需解決

評論

相關(guān)推薦

技術(shù)專區(qū)

君林科技：聲紋識別前景無限，重點(diǎn)問題亟需解決