聲紋鑒定新技術(shù)自動識別判斷說話人特征
說話人識別的研究始于20世紀30年代。隨著研究手段和工具的不斷改進,說話人識別的研究逐漸擺脫了早期單純的人耳聽辨模式。Bell實驗室的L?G?Kesta用目視觀察語譜圖的方法進行識別,并提出了“聲紋”的概念。我國的聲紋鑒定技術(shù)起步較晚,上世紀80年代末,公安部二所(現(xiàn)為公安部物證鑒定中心)引進了美國的DSP5500聲譜儀,開展聲紋鑒定的科研和檢案實踐。1992年公安部物證鑒定中心完成了部級重點課題《5500語圖儀在聲紋鑒定中應(yīng)用的研究》,2001年,該中心承擔的國家九五科技攻關(guān)項目《聲紋鑒定關(guān)鍵技術(shù)及話者識別系統(tǒng)研究》通過驗收,研制出具有自主知識產(chǎn)權(quán)的VS99語音工作站,標志著我國聲紋鑒定技術(shù)日趨成熟。
“聲紋鑒定與自動識別技術(shù)研究”項目由公安部物證鑒定中心等單位完成,其主要研究成果是將聲紋自動識別功能植入VS99語音工作站,該系統(tǒng)能對說話人特征進行自動分析、判斷和語圖顯示及測量,并可結(jié)合專家鑒定以確定說話人身份,適合于法庭科學實際應(yīng)用。本項目研制出當前聲紋鑒定工作中非常實用的集聲譜儀和說話人自動識別系統(tǒng)為一體的語音工作站,大大提高了結(jié)論的準確率,為聲紋鑒定提供了一個實用系統(tǒng)。
創(chuàng)新技術(shù):
1.抗噪聲處理
噪聲對檢驗結(jié)果的影響是一個不可忽視的問題。在本系統(tǒng)中對于非平穩(wěn)噪聲,研究人員提出了利用偶數(shù)幀段主分量特征輸入隱馬爾可夫模型(HMM)結(jié)合時間方向平滑處理的SS方法來提高噪聲環(huán)境下漢語連續(xù)語音識別系統(tǒng)魯棒性的方法,取得較好的識別結(jié)果。
2.語音端點檢測
端點檢測可以避免由噪音引起的誤動作以及由噪音引起的誤識別,對于準確檢測語音信號的起始、提高識別系統(tǒng)精度等有重要意義。采用傳統(tǒng)的語音端點檢測器SAD很容易造成語音激活的漏檢。另外,較大的干擾信號,又有可能被當成是語音的激活,造成語音激活的虛檢。為克服這一缺點,研究人員采用一種基于相關(guān)性的語音激活檢測器,定義了一種有效的相關(guān)函數(shù),找到了判別門限設(shè)定方法以及防止漏檢和虛檢的方法。
3.識別算法
本系統(tǒng)采用的是基于GMM模型的優(yōu)化算法。
(1)改進的GMM的模型訓練方法
實驗中發(fā)現(xiàn)EM算法存在出現(xiàn)奇異陣的重大缺陷,而最大似然估計(ML),雖然識別率比較低,但不會出現(xiàn)奇異陣。因此研究人員采用最大似然估計(ML)所得模型為初始模型,然后用EM算法中的每步的模型通過α值控制修正比例對其進行修正,稱為改進EM算法。
(2)基于遺傳算法的GMM的模型優(yōu)化算法
研究人員對傳統(tǒng)的遺傳算法進行了改進,用于GMM的參數(shù)優(yōu)化中,大大提高了模型的優(yōu)化程度。
(3)GMM的說話人識別方法的優(yōu)化
研究人員提出了一種新的優(yōu)化的基于GMM的說話人識別方案,該方案通過先對一次發(fā)音對應(yīng)一個模型的各幀似然度做一種特定變化然后再計算該音節(jié)總的似然度,也就是該音節(jié)對應(yīng)該模型的總的評分,記作Sc,與最大Sc所屬模型相對應(yīng)的說話人即為目標說話人。
社會效益:
目前,公安部物證鑒定中心完成的國家“九五”攻關(guān)成果VS99語音工作站已經(jīng)在國內(nèi)普及,在實際辦案中發(fā)揮了重要作用。該項目是在VS99的基礎(chǔ)上增加自動判別功能,從而進一步提高辦案效率和鑒定的準確率。
該項目研制的聲紋鑒定自動識別系統(tǒng)具有完全自主知識產(chǎn)權(quán),實用性強,非常適合公安工作的實際需要,可在偵查中對大量嫌疑人進行排查,可以有效地提供偵查方向,縮小偵查范圍,提高工作效率。同時該系統(tǒng)具有語圖實時顯示功能,適用于行動技術(shù)中語音信號的采集。自2002年以來,實際檢驗鑒定案件200起,案件類型包括刑事、經(jīng)濟、民事、治安案件。從結(jié)案反饋及法庭審判結(jié)果看,正判率為100%。
評論