中文語音處理技術(shù)在數(shù)字助聽器中的開發(fā)和應(yīng)用
目前國外對助聽器研究發(fā)展的一個熱點則是集中在中國,確切地講是基于對漢語語言和語音研究,開發(fā)相關(guān)的語音識別技術(shù)和產(chǎn)品。為中心的中文聽力學(xué)也不例外。我們已經(jīng)知道聽覺科學(xué)是一門發(fā)展迅速、知識更新很快的一門學(xué)科,它所研究的對象以人的聽覺為中心,現(xiàn)在我們將介紹和討論科學(xué)家和聽力學(xué)家更關(guān)心的是怎樣將聽覺科學(xué)運用到中國人的聽覺和言語實際中去。
本文引用地址:http://butianyuan.cn/article/199180.htm漢語是具有特征化的音調(diào)性語言,與其他以拼音字母為主的語系,如斯拉夫語系等具有很明顯的語音學(xué)差別。這種差別不僅僅在語言特征上非常明確,在具體使用時,區(qū)別也很大。是否不同語系的不同語音特征會影響聽覺受損患者對言語的理解,尤其是在使用基于不同語系研究成果制作成的助聽器時,這種語音的差異是否起到重要作用,最近已成為學(xué)術(shù)和科研的一個熱門課題。比如國內(nèi)研制的人工耳蝸的一個特點便是在設(shè)計其算法時考慮到中文語音特點。國外助聽器廠商將在近期推出以中文語音為特征算法的助聽器。加拿大在中國的一語音實驗室通過多年的研究和實驗,早在 2000 年運用領(lǐng)先的數(shù)字信號處理 (DSP) 技術(shù),在其數(shù)字助聽器中加入中文語音算法,并同時申請了相關(guān)專利。目前他們率先推出的以中文語音處理技術(shù)為核心的全新數(shù)字助聽器 —Intelligia ,在臨床試驗中得到受試者的認可,初步證明這種新型助聽器對說以中文為母語的患者有益處。
目前研究的結(jié)果表明,不同的語系,如漢語和英語有各自特點,在聽覺感知過程中有很大差別。英文和漢語在語音和口語上有重要區(qū)別, Ming-Xi Tsai el al ( 2000 )認為漢語和英文語音在結(jié)構(gòu)上特征區(qū)別很大。漢語的詞、字、音節(jié)和聲、韻母分節(jié)含有不同層次的信息,并保持復(fù)雜的關(guān)系。在口語中,漢語發(fā)音差異也很大,在不同會話條件下,受到這些結(jié)構(gòu)中不同層次信息的影響。
對中文語音識別和中文語音音調(diào)的研究表現(xiàn)在人工耳蝸的算法上面。言語處理策略是人工耳蝸幫助患者理解語言核心技術(shù),已有大量研究。但對于言語聲尤其是聲調(diào)、語調(diào)的研究,比如對以語調(diào)為基礎(chǔ)的漢語研究還是很少。在最近的一個試驗中,他們用澳大利亞人工耳蝸來觀察對漢語語音理解的影響。結(jié)果表明在某些言語處理策略中漢語的使用的理解度要高于其他時間策略。如果能提高刺激率,加強對語音和音調(diào)的理解,他們也認為不同的言語處理策略對漢語說法也有理解。研究再次證明,漢語應(yīng)該有一定的語音系統(tǒng)處理自己的語言,尤其是對聽障人士尤為重要。
美國麻省理工學(xué)院研究者 Michael Qin 在其《在噪音背景發(fā)音和音調(diào)的辨認》的試驗中,對漢語普通話音調(diào)的辨認和噪音的關(guān)系進行了研究。他認為不同的語言利用不同類型的聲調(diào)使我們口語富于不同的意義,在噪音環(huán)境下這些有意義的聲調(diào)會受到影響,因此他需要發(fā)現(xiàn)說普通話的中國人怎樣在噪音環(huán)境里辨認不同的聲調(diào)。在試驗中他使用 6 個輔元音的音位,同時使用 4 個聲調(diào):陰陽上去。其結(jié)果表明在信噪比降低的情況下,對漢語聲調(diào)和元音的識別受到很大影響,從而影響降低言語的理解能力。因此信噪比影響理解中文很重要的因素。這個試驗對聽覺康復(fù)和設(shè)計有針對性的助聽器具有重要意義。
同時,最近美國成立了一個綜合性專家研究小組,開始研制適合中文語音的助聽器。該小組成員包括世界聞名的豪斯耳研究院、香港中文大學(xué)耳鼻喉科等。與上述研究類似。他們認為在聆聽以聲調(diào)作為識別語音和語義的語言時,如普通話、廣東話和泰國語等,可能聽覺更重要的是依靠基頻相關(guān)的信息來理解語言,這是與別的語言不同的。因此,在研制助聽器時,我們應(yīng)該考慮到這些患者的語言特點。
當然,筆者最感興趣的是最近由威耳康研究基金 (Wellcome Trust) 贊助的一項題為《中文普通話會話者在理解語言時比英文會話者用腦更多》的試驗,其目的是使用影像技術(shù)來觀察和研究中文母語和英文母語說話者大腦出現(xiàn)的不同活動。主持該項研究的心理學(xué)家索菲斯高特博士發(fā)現(xiàn),當英語的受試者聽到英文時,其左顳葉變得異?;钴S,研究者認為這個區(qū)是把言語聲組合在一起形成獨立的字詞。但是當中文受試者聽到普通話時,其左右顳葉同時活躍起來。顯然,由于說不同語言的受試者用他們大腦的不同區(qū)域?qū)Σ煌Z言的刺激進行解碼。這對我們理解這些理論產(chǎn)生了很大的影響。他們進一步認為中文受試者的左顳葉處理語音信號,而他們的右顳葉則處理聲調(diào),同時產(chǎn)生意義。言語聲是非常復(fù)雜的聲音,而正確理解言語傳遞的意思,在這種情況下,大腦會充分利用說話者抑揚頓挫的聲調(diào)來對其言語進行解碼,從而將口語變成有意義的信號。
大腦聽覺區(qū)域很容易受外部影響,而改變對聲音的分辯能力。一旦聽覺受到損傷,必需進行康復(fù),大腦需要重新連接和編碼。大腦的可塑性是很強的。了解大腦對不同語言的反應(yīng),可以有效地幫助聽覺患者重新恢復(fù)對語言的理解。重要的是基于這些研究,我們可以清楚地看到研制出具有中文語音特征的聽力康復(fù)設(shè)備。記得在 2002 年北京大學(xué)和中國殘聯(lián)成立言語聽覺中心的開幕式上,鄧樸方先生在發(fā)言中專門談到:他第一次聽說中文語音處理特征對助聽器使用者的影響,他認為這是一個重要課題,需做大量工作,而研制出以中文語音為特征的聽覺康復(fù)設(shè)備將會有重要的意義。根據(jù)國際確認的聽損發(fā)病率,中國有 10 %的人口,即一億三千萬人有不同程度聽力損失,因此,利用中文語音處理技術(shù)更有效地幫助聽殘患者具有非常重要的作用。
更多醫(yī)療電子信息請關(guān)注:21ic醫(yī)療電子
評論