新聞中心

EEPW首頁(yè) > 物聯(lián)網(wǎng)與傳感器 > 設(shè)計(jì)應(yīng)用 > 嬰兒啼哭監(jiān)測(cè)及安撫系統(tǒng)*

嬰兒啼哭監(jiān)測(cè)及安撫系統(tǒng)*

作者:朱江燦,王新懷,徐茵,米月琴(西安電子科技大學(xué),西安 710126) 時(shí)間:2023-03-25 來(lái)源:電子產(chǎn)品世界 收藏
編者按:系統(tǒng)由采集與信號(hào)調(diào)理模塊的聲音拾取裝置(MEMS麥克風(fēng))收集環(huán)境聲音,經(jīng)自動(dòng)增益控制(AGC)模塊處理后被采集,處理器模塊將采集到的音頻數(shù)據(jù)首先通過(guò)獲取環(huán)境信號(hào)特征完成環(huán)境噪聲與端點(diǎn)檢測(cè)特征值自適應(yīng),對(duì)音頻信號(hào)預(yù)處理后,通過(guò)端點(diǎn)檢測(cè)算法提取出有音信號(hào)段,將有音信號(hào)段導(dǎo)入MFCC算法提取信號(hào)倒譜,然后根據(jù)信號(hào)倒譜獲取基音頻率,最后通過(guò)基音頻率各類統(tǒng)計(jì)值做最后判斷,若判斷結(jié)果為有效嬰兒啼哭聲,則觸發(fā)執(zhí)行安撫與信息通知,包括驅(qū)動(dòng)語(yǔ)音安撫模塊播放安撫音樂(lè)或父母安撫聲,驅(qū)動(dòng)無(wú)線通信模塊通知父母嬰兒發(fā)生啼哭。

*本文受陜西省重點(diǎn)研發(fā)計(jì)劃項(xiàng)目(2020ZDXM5-01)和中央高校業(yè)務(wù)費(fèi)項(xiàng)目(XJS220209)支持

本文引用地址:http://butianyuan.cn/article/202303/444887.htm

照顧嬰兒是一項(xiàng)辛苦的工作,嬰兒往往會(huì)因?yàn)榄h(huán)境的輕微的變化而產(chǎn)生啼哭行為,需要父母去安撫,這耗費(fèi)了父母的大量精力,影響了父母正常的工作和生活。隨著語(yǔ)音識(shí)別技術(shù)的迅速發(fā)展,語(yǔ)音識(shí)別已經(jīng)成為各類邊緣嵌入式電子系統(tǒng)的重要感知手段。針對(duì)嬰兒領(lǐng)域的產(chǎn)品也是層出不窮,其中包括針對(duì)嬰兒啼哭聲識(shí)別的產(chǎn)品。

隨著人機(jī)交互、語(yǔ)音識(shí)別、嵌入式等技術(shù)在智能家居領(lǐng)域的快速應(yīng)用,出現(xiàn)了一系列高度智能化、便捷化的商業(yè)產(chǎn)品,諸如掃地機(jī)器人、小米音箱、智能門(mén)鎖和智能監(jiān)控?cái)z像頭等。同時(shí)智能化的嬰兒看護(hù)產(chǎn)品也逐漸興起并推廣開(kāi)來(lái),為母嬰用戶帶來(lái)了巨大的便利,用戶不用時(shí)刻陪伴在嬰兒身邊。本文就嬰兒啼哭識(shí)別系統(tǒng)進(jìn)行設(shè)計(jì),力圖以簡(jiǎn)易的方式和方法搭建一個(gè)嬰兒啼哭聲識(shí)別系統(tǒng)。

1 系統(tǒng)設(shè)計(jì)

1.1 系統(tǒng)組成部分

如圖1 所示,該系統(tǒng)主要分為4 個(gè)組成部分,首先是聲音拾取與信號(hào)調(diào)理模塊,模塊使用集成硅麥克風(fēng)芯片拾取環(huán)境聲音,經(jīng)自動(dòng)增益電路調(diào)理后接入處理器AD采集端口。然后是處理器主控模塊,MCU以pingpong工作機(jī)制同時(shí)完成采集操作與信號(hào)處理操作,其中信號(hào)處理程序包括預(yù)處理、提取3個(gè)部分。最后是語(yǔ)音安撫模塊與無(wú)線通信模塊,當(dāng)識(shí)別到有效嬰兒啼哭聲時(shí),語(yǔ)音安撫模塊將播放音樂(lè),無(wú)線通信模塊將通知監(jiān)護(hù)人。

1679686027292959.png

1.2 系統(tǒng)工作過(guò)程

嬰兒及安撫系統(tǒng)的工作過(guò)程如下:首先,由聲音拾取與信號(hào)調(diào)理模塊的聲音拾取芯片(MEMS 硅麥克風(fēng))收集環(huán)境聲音,經(jīng)信號(hào)調(diào)理電路完成自動(dòng)增益后由處理器主控模塊采集,處理器主控模塊采集到音頻數(shù)據(jù)后,將首先通過(guò)獲取環(huán)境信號(hào)特征完成環(huán)境噪聲與特征值自適應(yīng),然后對(duì)音頻信號(hào)預(yù)處理,最后通過(guò)算法提取出有音信號(hào)段,如處理器主控模塊檢測(cè)到有效的音頻信號(hào)段,則通過(guò)MFCC 算法提取此段信號(hào)的頻率特征,然后根據(jù)音頻信號(hào)頻率倒譜提取出,最后通過(guò)各類統(tǒng)計(jì)值做最后判斷,若識(shí)別結(jié)果為有效嬰兒啼哭聲,則觸發(fā)安撫行為,包括驅(qū)動(dòng)語(yǔ)音安撫模塊播放安撫音樂(lè)與父母安撫聲,驅(qū)動(dòng)無(wú)線通信模塊通知父母嬰兒發(fā)生啼哭。

2 系統(tǒng)功能實(shí)現(xiàn)與工作原理

2.1 硬件部分

2.1.1 采集與信號(hào)調(diào)理模塊

麥克風(fēng)采用MEMS微型硅麥克風(fēng),MEMS 麥克風(fēng)將電容器集成在微硅晶片上,可以采用表貼工藝進(jìn)行制造,直徑不到1 mm 的小型薄膜的重量非常輕巧,且與ECM相比,會(huì)對(duì)由安裝在同一PCB上的揚(yáng)聲器引起的PCB噪聲產(chǎn)生更低的振動(dòng)耦合;另外,它也具有改進(jìn)的噪聲消除性能與良好的RF 及EMI 抑制。

2.1.2 語(yǔ)音安撫及無(wú)線通信模塊

語(yǔ)音安撫模塊采用YX5200-24SS作為主芯片,YX5200-24SS是一個(gè)支持串口的語(yǔ)音芯片,集成了MP3、WAV、WMA的硬解碼;預(yù)先將安撫音樂(lè)與父母的安撫音頻存入,安撫事件觸發(fā)信號(hào)到來(lái)時(shí),將通過(guò)串口驅(qū)動(dòng)語(yǔ)音安撫模塊播放某一安撫音頻。而無(wú)線通信模塊采樣集成藍(lán)牙芯片,安撫事件觸發(fā)信號(hào)到來(lái)時(shí)將通知父母監(jiān)測(cè)到嬰兒啼哭。

2.2 軟件部分

2.2.1 預(yù)處理

預(yù)處理程序流程圖如圖2所示,所述的信號(hào)預(yù)處理程序的流程為:當(dāng)預(yù)處理程序接收到采集的信號(hào)后,首先求取此段信號(hào)均值,然后利用均值完成噪聲自適應(yīng)與端點(diǎn)檢測(cè)特征值自適應(yīng),完成自適應(yīng)之后,對(duì)原信號(hào)完成預(yù)加重操作,增強(qiáng)高頻成分,最后將此段信號(hào)按設(shè)定的幀長(zhǎng)與幀移完成分幀操作即可傳入端點(diǎn)檢測(cè)程序。

預(yù)加重的目的是提升高頻部分,使信號(hào)的頻譜變得平坦,使得全頻帶盡可能的均衡,以此來(lái)補(bǔ)償語(yǔ)音信號(hào)受到發(fā)音系統(tǒng)所抑制的高頻部分,突出高頻的共振峰;然后是信號(hào)分幀處理,由于傅里葉變換要求輸入信號(hào)是平穩(wěn)的,非平穩(wěn)信號(hào)的傅里葉變換是沒(méi)有意義的,而短時(shí)傅里葉變換可對(duì)其完成分析;語(yǔ)音信號(hào)就是非平穩(wěn)信號(hào),但其在短時(shí)上是有一定的周期性的,即在1 個(gè)較短的時(shí)間片里它可被認(rèn)定為接近平穩(wěn)信號(hào),因此要進(jìn)行分幀的操作,即截取短時(shí)的語(yǔ)音片段;而語(yǔ)音的基頻在(100~250)Hz,即基音周期在(4~10)ms,而每幀含有2~3 個(gè)周期主頻能量表現(xiàn)才較佳,這里采用8 kHz采樣率,幀長(zhǎng)256,即32 ms;此外,分幀時(shí)的幀移取128,即相鄰兩幀將有部分重疊,可使此段信號(hào)計(jì)算得到的基音頻率更加平滑,也可減弱后續(xù)加窗操作的副作用。

1679686164969827.png

2.2.2 端點(diǎn)檢測(cè)

端點(diǎn)檢測(cè)程序流程圖如圖3 所示,所述的端點(diǎn)檢測(cè)程序流程為:完成預(yù)處理的音頻信號(hào)傳入后,首先根據(jù)噪聲自適應(yīng)值設(shè)定短時(shí)幅度累計(jì)閾值,然后設(shè)定短時(shí)過(guò)零閾值,其中短時(shí)幅度累計(jì)值通過(guò)預(yù)處理過(guò)程得到的幅度累積閾值乘系數(shù)得到,而短時(shí)過(guò)零率的“0 點(diǎn)”則為預(yù)處理過(guò)程得到的噪聲閾值計(jì)算出的以0 點(diǎn)為中心的1個(gè)窗口,窗口內(nèi)的值都被認(rèn)為是0 值,輸入信號(hào)相鄰兩個(gè)值分別大于窗口與小于窗口,則視為一次過(guò)0。然后遍歷所有幀,根據(jù)兩個(gè)閾值獲得有音聲段,然后將有音聲段幀序號(hào)傳入基音頻率提取程序。

1679686226947739.png

2.2.3 基音頻率提取

基音頻率提取程序流程圖如圖4 所示,所述的基音頻率求取程序的流程為:有音聲段傳入后,此程序?qū)⒁来翁幚砻總€(gè)有音聲段幀,首先對(duì)幀數(shù)據(jù)進(jìn)行窗函數(shù)濾波操作,然后輸入FFT 算法輸入端,再對(duì)FFT 算法輸出的復(fù)數(shù)數(shù)組求取幅值,再對(duì)幅值取對(duì)數(shù),最后再帶入IFFT算法求得倒譜,然后求得基音頻率及其統(tǒng)計(jì)特征,如果基音頻率超過(guò)設(shè)定的頻率閾值,則判定為識(shí)別到有效嬰兒啼哭,最后將會(huì)觸發(fā)安撫模塊。

image.png

3 項(xiàng)目測(cè)試

嬰兒及安撫系統(tǒng)于3 個(gè)場(chǎng)景下完成了12 h長(zhǎng)時(shí)間測(cè)試,分別是睡覺(jué)環(huán)境、人聲環(huán)境、客廳環(huán)境,分別代表僅含環(huán)境白噪聲、除環(huán)境白噪聲外還包含說(shuō)話聲與家具移動(dòng)聲、除環(huán)境白噪聲還包含電視機(jī)聲音與音樂(lè)聲音;經(jīng)測(cè)試,在睡覺(jué)環(huán)境中,識(shí)別準(zhǔn)確率高于99.9%;在人聲環(huán)境中,識(shí)別準(zhǔn)確率大約為97.73%;在客廳環(huán)境中,識(shí)別準(zhǔn)確率大約為94.97%。此外嬰兒及安撫系統(tǒng)還有一參數(shù)可按情況調(diào)整,此參數(shù)為單位時(shí)間內(nèi)有效輸出驗(yàn)證次數(shù),即在1 s 時(shí)間內(nèi),識(shí)別到幾次嬰兒啼哭聲則視為有效嬰兒啼哭,此參數(shù)越大則誤判率越低,對(duì)應(yīng)的實(shí)時(shí)性越差,以上測(cè)試此參數(shù)皆設(shè)為2,輸出延遲約0.3 s,通過(guò)設(shè)置此參數(shù)可在實(shí)時(shí)性和準(zhǔn)確性之間尋求一個(gè)平衡。

1679686332856006.png

圖5 玩偶嵌入智能識(shí)別系統(tǒng)

4 結(jié)束語(yǔ)

本系統(tǒng)采用基于音頻特征的語(yǔ)音識(shí)別方案,通過(guò)提取嬰兒啼哭聲的倒譜特征,進(jìn)而得到嬰兒啼哭聲的基音頻率及其統(tǒng)計(jì)特征來(lái)判定嬰兒啼哭聲的存在,降低了對(duì)處理器存儲(chǔ)器容量以及對(duì)處理器算力的要求,降低了成本,此外系統(tǒng)采用ping-pong 工作機(jī)制,實(shí)時(shí)性強(qiáng),經(jīng)測(cè)試平均延遲為200 ms,本系統(tǒng)可廣泛應(yīng)用于智能玩偶及智能童車等。

參考文獻(xiàn):

[1] 梁海珍.語(yǔ)音識(shí)別技術(shù)在智能家居領(lǐng)域應(yīng)用[J].電子技術(shù)與軟件工程, 2021,2(4):100- 101.

[2] 趙春昊,莫重驥,矯欣航,等.聲紋識(shí)別技術(shù)發(fā)展與應(yīng)用淺談[J].中國(guó)安全防范技術(shù)與應(yīng)用, 2020,10(5):17-20.

[3] 魚(yú)昆,張紹陽(yáng),侯佳正,等.語(yǔ)音識(shí)別及端到端技術(shù)現(xiàn)狀及展望[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2021,3 (3):14-23.

(本文來(lái)源于《電子產(chǎn)品世界》雜志2023年3月期)



評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉