基于多網(wǎng)絡(luò)系統(tǒng)的MOS測試解決方案
1引言
隨著無線網(wǎng)絡(luò)技術(shù)的不斷發(fā)展和網(wǎng)絡(luò)的逐漸普及,客戶對網(wǎng)絡(luò)的整體語音服務(wù)質(zhì)量要求不斷提高,語音質(zhì)量的好壞直接影響著用戶對于運(yùn)營商的選擇。因此,根據(jù)移動通信網(wǎng)絡(luò)服務(wù)質(zhì)量的要求,建立一套語音質(zhì)量客觀評價標(biāo)準(zhǔn)來更好地對網(wǎng)絡(luò)語音服務(wù)質(zhì)量進(jìn)行定量分析和評估,逐步成為移動網(wǎng)絡(luò)運(yùn)營商在網(wǎng)絡(luò)建設(shè)過程中必須考慮的關(guān)鍵問題。
最早的語音質(zhì)量評測標(biāo)準(zhǔn)僅是基于無線質(zhì)量指標(biāo)(RxQual,C/I,F(xiàn)FER等),但實際語音在傳輸中會經(jīng)過無線、傳輸、交換、路由等多個節(jié)點(diǎn),任一環(huán)節(jié)出現(xiàn)問題都會導(dǎo)致用戶語音感知差,僅僅考慮無線指標(biāo)是無法發(fā)現(xiàn)和定位語音質(zhì)量問題的,于是基于用戶感知的語音質(zhì)量評價方法逐漸成為用戶語音服務(wù)質(zhì)量評測的最主要標(biāo)準(zhǔn)。
2MOS語音質(zhì)量評價方法
常用的語音質(zhì)量評價方法分為主觀評價和客觀評價。早期語音質(zhì)量的評價方式是主觀評價,人們在打通電話之后通過人耳來感知語音質(zhì)量的好環(huán)。1996年,國際ITU組織在ITU-TP.800和P.830建議書開始制訂相關(guān)的評測標(biāo)準(zhǔn),即MOS(MeanOpinionScore)測試。它是一種主觀測試方法,將用戶接聽和感知語音質(zhì)量的行為進(jìn)行調(diào)研和量化,由不同的調(diào)查用戶分別對原始標(biāo)準(zhǔn)語音和經(jīng)過無線網(wǎng)傳播后的衰退聲音進(jìn)行主觀感受對比,評出MOS分值(見表1)。顯而易見,在現(xiàn)實中讓一組人接聽語音和評價語音質(zhì)量是非常困難和昂貴的。
因此,ITU組織推行了大量的端到端語音質(zhì)量客觀測試技術(shù)的標(biāo)準(zhǔn)化工作,發(fā)布了幾種語音評估算法標(biāo)準(zhǔn)(PAMS,PSQM,PSQM+,MNB,PESQ)。MOS評測開始擺脫原始的主觀評估方式,使用量化算法計算相對應(yīng)的級別及語音質(zhì)量好壞程度。其中,P.862-PESQ(PerceptualEvaluationof Speech Quality)算法是ITU組織在2001年2月發(fā)布的目前最新的語音傳輸質(zhì)量測量標(biāo)準(zhǔn),由于其強(qiáng)大的功能和良好的相關(guān)性,它迅速成為目前最主流的語音評估算法。PESQ算法適用于評價各類端到端網(wǎng)絡(luò)的語音質(zhì)量,它綜合考慮了感知中的各項影響因素(如編解碼失真、錯誤、丟包、延時、抖動和過濾等),客觀地評價語音信號的質(zhì)量,從而提供可以完全量化的語音質(zhì)量衡量方法。
表1MOS分值對照表
3PESQ算法原理
從PESQ算法模型的結(jié)構(gòu)圖中可以看到整個算法的處理流程(見圖1)。參考信號和通過無線網(wǎng)絡(luò)傳輸后的退化信號通過電平調(diào)整,再用輸入濾波器模擬標(biāo)準(zhǔn)電話聽筒進(jìn)行濾波(FFT)。這兩個信號在時間上對準(zhǔn),并通過聽覺變換和認(rèn)知模型,映射到對主觀平均意見分的預(yù)測。一般情況下,輸出信號和參照信號的差異性越大,計算出的MOS分值就越低。
圖1PESQ算法模型
PESQ作為ITU-P.862中推薦的語音評估最新算法,相對于PSQM和MNB只能用于窄帶編解碼測量,并且對某些類型的編解碼、背景噪聲和端到端的影響,比如濾波和時延變化只能給出不精確的預(yù)測值,它的算法模型能提供更好的相關(guān)性(見表2),能在更廣泛的條件下對主觀質(zhì)量給出精確地預(yù)測,包括背景噪聲、模擬濾波、時延變化等。
評論