沖電氣推出語音合成軟件 真實(shí)再現(xiàn)自己原音
沖電氣工業(yè)株式會(huì)社(OKI)日前宣布,推出連語氣、語調(diào)等特征也非常接近自然嗓音進(jìn)行發(fā)聲朗讀,能再現(xiàn)自己聲音的軟件“Polluxstar®”。通過個(gè)人電腦等使用“Polluxstar”,可以避免用無個(gè)性的機(jī)械合成音發(fā)聲,實(shí)現(xiàn)用具有本人講話氣氛、個(gè)性的“自己的聲音”進(jìn)行交流溝通。
本文引用地址:http://butianyuan.cn/article/86201.htm沖電氣長期以來積極研究開發(fā)為語音通信提供后盾的技術(shù),在VoIP、CTI市場(chǎng)占據(jù)相當(dāng)高的份額,擁有驕人業(yè)績(jī)。在將文本數(shù)據(jù)轉(zhuǎn)換成語音數(shù)據(jù)的語音合成技術(shù)(TTS:Text-To-Speech)領(lǐng)域也進(jìn)一步超越了以往技術(shù),積極進(jìn)行既實(shí)現(xiàn)清晰易聽,同時(shí)還能體現(xiàn)本人個(gè)性的語音技術(shù)開發(fā)。
語音是最基本的交流溝通手段之一,不單純是用語言表達(dá)意思,還承擔(dān)著傳遞“非此人莫屬”(本人性)的重要責(zé)任。沖電氣以一般人按普通發(fā)聲規(guī)律不一定完全正確的語音數(shù)據(jù),在不勉為其難的收錄量下也能再現(xiàn)“自己的聲音”為目標(biāo)積極推進(jìn)研究開發(fā)工作。該項(xiàng)研究成果表明,可以構(gòu)筑高效穩(wěn)定的語音數(shù)據(jù)庫,成功實(shí)用化了再現(xiàn)“自己的聲音”的技術(shù)。
大阪藝術(shù)大學(xué)執(zhí)教于信息工學(xué)的牧泉教授因病必須摘除聲帶,沖電氣在牧教授手術(shù)前,收錄了他的語音數(shù)據(jù),并將這些語音數(shù)據(jù)編入自己的聲音軟件“Polluxstar”提供牧教授使用。牧教授從2008年4月開始使用本軟件上的“自己的聲音”,在大學(xué)里重新開始授課。結(jié)果證明“Polluxstar”軟件已經(jīng)達(dá)到了在普通人的日常生活中也能有效使用的水平。而且,在向普通人提供該軟件之前進(jìn)一步完善了功能。
沖電氣對(duì)于因疾病等原因失聲的人士,作為代替這些人發(fā)聲,支援其本人及家庭成員生活的工具,開始銷售“Polluxstar”軟件。本公司認(rèn)準(zhǔn)運(yùn)用個(gè)人特性的聲音必將發(fā)揮重要作用,準(zhǔn)備通過在各個(gè)領(lǐng)域擴(kuò)大該軟件的應(yīng)用范圍,積極推進(jìn)不斷豐富語音交流的語音合成技術(shù)的開發(fā)。
【主要特點(diǎn)】
以合理的成本制作能再現(xiàn)自己聲音的語音數(shù)據(jù)庫
為了完美再現(xiàn)本人的語調(diào)?氣氛,必須高效收集充足的語音數(shù)據(jù),并且將之?dāng)?shù)據(jù)庫化。用于語音合成的語料庫TTS技術(shù),是在國際電氣通信基礎(chǔ)技術(shù)研究所(ATR)開發(fā)的面向大規(guī)模語料庫的語音合成技術(shù)中,結(jié)合了沖電氣自主開發(fā)的面向小規(guī)模語料庫的數(shù)據(jù)庫技術(shù)的技術(shù),既能保持非常逼真的自然嗓音感,又能以合理的成本提供再現(xiàn)“自己的聲音”的Polluxstar軟件。包括收錄語音在內(nèi),構(gòu)筑語音數(shù)據(jù)庫所需時(shí)間約為1個(gè)月。
廣泛支持日常生活用語
日常生活中使用的言詞、語調(diào)因人而異。在預(yù)先準(zhǔn)備的講稿中加入客戶固有的原稿,可以加強(qiáng)該客戶特有的語調(diào)氣氛。而且,可以事先登錄客套話、對(duì)親朋好友的稱呼等最能表現(xiàn)此人特點(diǎn)的特定詞組語音數(shù)據(jù)。從輸入的文字串中識(shí)別已登錄的詞組,原樣輸出此語音數(shù)據(jù)。通過這些方法,可以消除與合成音的音質(zhì)差距,再現(xiàn)能體現(xiàn)本人個(gè)性的自然而微妙的語氣。
在日常生活中方便實(shí)用的用戶界面
以大量驗(yàn)證試驗(yàn)等獲得的經(jīng)驗(yàn)為基礎(chǔ),實(shí)現(xiàn)了在日常生活中切實(shí)可用的語音合成用戶界面。加上以聊天軟件為特點(diǎn)的能實(shí)時(shí)從鍵盤輸入文章的功能,只要預(yù)先登錄經(jīng)常使用的語言技巧、事先決定了內(nèi)容的文章,根據(jù)文本列表(Text Feeder),只需單擊就能實(shí)現(xiàn)語音輸出。還能支持一對(duì)一的對(duì)話、眾人前的演講等不同使用情況。
評(píng)論