基于MSP430的語音與音頻壓縮/解壓縮技術(shù)
引言
本文引用地址:http://butianyuan.cn/article/81571.htm采用微控制器 (MCU) 來實(shí)施語音記錄器比較簡單。許多 MCU 均采用集成模數(shù) (A/D) 轉(zhuǎn)換器。擴(kuò)音器將捕獲到的聲音提供給放大器,然后再饋送給 A/D 轉(zhuǎn)換器的模擬輸入??蓪浿频穆曇舸鎯υ陂W存或 RAM 等存儲器中,按下按鈕就能觸發(fā) MCU 以播放錄制到的聲音,其原理是將存儲的數(shù)據(jù)先提供給數(shù)模 (D/A) 轉(zhuǎn)換器,然后再提供給音頻功率放大器。
利用 MSP430 很容易實(shí)現(xiàn)這種語音記錄器。MSP430 微控制器利用集成外設(shè)來實(shí)現(xiàn)片上模擬信號鏈。此外,MSP430 的 CPU 處理能力非常強(qiáng)大,足以執(zhí)行錄制聲音的壓縮。
壓縮與解壓縮算法
舉例來說,實(shí)現(xiàn)語音記錄器的最簡單辦法就是將 A/D 轉(zhuǎn)換器轉(zhuǎn)換結(jié)果(如 12 位采樣)直接存儲在閃存中。音頻數(shù)據(jù)大多數(shù)時間都不使用整個 A/D 轉(zhuǎn)換器范圍,也就是說,冗余數(shù)據(jù)也存儲在閃存中。壓縮算法可去除這些冗余信息,從而減小所存儲數(shù)據(jù)的容量。
自適應(yīng)差分脈沖代碼調(diào)制 (ADPCM) 就是此種類型的壓縮算法。ADPCM 算法存在各種類型,但都使用量化器差分編碼與量化器中自適應(yīng)量化階步長方案。在進(jìn)一步討論 IMA ADPCM 算法用于相關(guān)代碼之前,我們首要來簡單介紹一下差分 PCM 編碼。
差分脈沖代碼調(diào)制 (DPCM)
DPCM 通過使用當(dāng)前采樣與前一個采樣的差值來對模擬音頻輸入信號進(jìn)行編碼。圖 1 顯示了DPCM 編碼器與解碼器的結(jié)構(gòu)圖。在本例中,我們用信號估算 Se(n) 而非前一個輸入來決定信號差值 d(n),從而確保了編碼器使用的信息與解碼器相同。如果編碼器使用的是上一個輸入采樣的話,那么就會造成量化的累積錯誤,從而使重建信號與原始輸入信號不同。通過采用如圖 1 所示的信號估算,我們能避免重建信號 Sr(n) 與原始輸入信號出現(xiàn)差異。重建信號 Sr(n) 是預(yù)測器 (predictor) 的輸入,其決定了下一個信號估算 Se(n+1)。
圖 2 顯示了一小段錄制音頻流,并通過兩個示意圖給出了模擬音頻輸入采樣(PCM 值)與連續(xù)采樣(DPCM 值)間差值的比較。
PCM 值的范圍在 26 到 203 之間,總共 177 個步長。編碼的 DPCM 值范圍在-44 至 46之間,總共 90 個步長。盡管量化器步長僅為 1,但這種 DPCM 編碼已經(jīng)實(shí)現(xiàn)了輸入數(shù)據(jù)的壓縮功能。只需選擇較大的量化器步長即可將編碼 DPCM 值的范圍進(jìn)一步縮小。
適應(yīng)差分脈沖編碼調(diào)制 (ADPCM)
ADPCM 是 DPCM 的一個變體,編碼器步長會有差異。語音輸入信號的強(qiáng)度差異體現(xiàn)在不同的揚(yáng)聲器器上,也體現(xiàn)在語音輸入信號的語音和非語音部分上。量化器步長對每個采樣都進(jìn)行適應(yīng)調(diào)節(jié),確保高低輸入信號強(qiáng)度都能實(shí)現(xiàn)同樣的編碼效率。圖 3 顯示了采用步長調(diào)節(jié)技術(shù)的修訂版 DPCM結(jié)構(gòu)圖。
ADPCM 編碼器通過解碼 ADPCM 代碼進(jìn)行信號估算 (Se),這就是說,解碼器是 ADPCM 編碼器的一部分,因此已經(jīng)編碼的音頻數(shù)據(jù)流只能用解碼器進(jìn)行重放,這樣解碼器就必須對編碼器加以跟蹤。
最初的編碼器和解碼器信號估算等級以及步長大小調(diào)節(jié)等級必須在開始編碼或解碼前就加以定義,否則,編碼或解碼的值就會超過范圍。
MSP430 片上信號鏈
MSP430 系列微控制器支持多種片上外設(shè)。為了實(shí)現(xiàn)完整的片上信號鏈解決方案,MSP430 至少必須提供 1 個 A/D 轉(zhuǎn)換器模擬輸入和 1 個 D/A 轉(zhuǎn)換器。下面我們將介紹兩種 MSP430 解決方案。
MSP430F169 片上信號鏈解決方案
MSP430F169 包括 1 個集成 12 位 SAR A/D 轉(zhuǎn)換器,作為一種硬件乘法器模塊,它能高效支持?jǐn)?shù)字濾波器,此外 MSP430F169 還包括 1 個集成 12 位 D/A 轉(zhuǎn)換器模塊。圖4給出了 MSP430F169 信號鏈電路圖。
上述配置也適合采用外部串行閃存的情況,從而可以滿足音頻數(shù)據(jù)的存儲需求。外部閃存可通過 MSP430 的 I2C 或 SPI 接口來連接。MSP430F169 DMA 模塊可自動將接收到的數(shù)據(jù)傳輸給 RAM,從而大幅降低了 CPU 的負(fù)載。
MSP430FG4618 片上信號鏈解決方案
我們用 MSP430FG4618 可以實(shí)現(xiàn)另一種片上信號鏈解決方案。MSP430F169 可支持 60 KB 的集成閃存,而 MSP430FG4618 則可支持 116 KB 的閃存。MSP430FG4618 的另一優(yōu)勢在于,它還集成了運(yùn)算放大器模塊。運(yùn)算放大器可用于放大擴(kuò)音器的輸入及數(shù)模轉(zhuǎn)換器的模擬輸出。圖 5 顯示了 MSP430FG4618 信號鏈電路圖。具體配置采用的是TI推出的 MSP430FG4618/F2013 試驗(yàn)板。該評估板可與相關(guān)代碼示例配合使用。
擴(kuò)音器的輸出信號非常小,必須放大。MSP430 的運(yùn)算放大器可用于不同的運(yùn)算模式。如果用于 PGA 模式,那么最大只能放大到 15 倍,對擴(kuò)音器放大器來說還不夠。因此,需要通過外部組件來加大增益。圖 5 中的運(yùn)算放大器 OA0 即用于通用放大器模式。放大器共有 8 種設(shè)置方式,可以使增益-帶寬乘積和轉(zhuǎn)換率等性能與電流消耗達(dá)到最佳平衡。圖中的所有放大器 OA0、OA1 及 OA2 均采用了高性能模式(快速模式)。
如欲了解有關(guān)運(yùn)算放大器使用的更多詳情,敬請參見 MSP430FG4618/F2013 試驗(yàn)板用戶指南。
利用通用串行通信接口 (USCI) 可將音頻數(shù)據(jù)存儲到外部閃存中。我們也可通過 I2C 總線或 SPI 總線與外部存儲器相連。
MSP430 性能
相關(guān)代碼文件中有一些 *.wav 文件示例,可表明解碼 ADPCM 數(shù)據(jù)的質(zhì)量。我們可在 PC 上用媒體播放器等軟件來比較這些文件,這樣就能體驗(yàn) ADPCM 壓縮算法的實(shí)際質(zhì)量了。請注意,通過提高音頻采樣率和音頻采樣大小(解析度),我們可以進(jìn)一步提高音頻質(zhì)量。
使用相關(guān)代碼
相關(guān)代碼中包含了兩個軟件項(xiàng)目,這兩個版本都基于第三部分中所介紹的內(nèi)容,也都采用 IMA ADPCM 算法。
ADPCM函數(shù)的使用非常簡單。首先,必須在應(yīng)用代碼中包含ADPCM.h首標(biāo)文件。該首標(biāo)文件定義了ADPCM.c文件的ADPCM函數(shù)。在每次音頻數(shù)據(jù)的錄制或重放工作之前,必須調(diào)用 ADPCM_Init() 函數(shù)。該函數(shù)定義了信號估算(Se)的起始值以及用作量化器步長調(diào)節(jié)的步長指針。編碼器和解碼器通過設(shè)置可實(shí)現(xiàn)同步。調(diào)用ADPCM_Encoder(int value)函數(shù)就能進(jìn)行編碼,每個音頻采樣調(diào)用 ADPCM_Decoder() 函數(shù)就能進(jìn)行回放。以下代碼段顯示了如何完成上述工作。
#include "ADPCM.h"
void main(void)
{ // 應(yīng)用軟件初始化
while(1) // 主循環(huán)
{ // 應(yīng)用軟件
if (P1IN & 0x01)
record();
if (P1IN & 0x02)
play();
}
}
void record(void)
{ // 初始化后,以便 A/D 轉(zhuǎn)換器、定時器、放大器等的錄制
ADPCM_Init(); // 須在開始錄制之前完成
// 開始錄制
}
void play(void)
{ //初始化后,以便 A/D 轉(zhuǎn)換器、定時器、放大器等的錄制
ADPCM_Init(); //須在開始錄制之前完成
// 開始回放
}
接下來,我們用 IAR Embedded Workbench KickStart version 3.42A 來測量 ADPCM 函數(shù)執(zhí)行的次數(shù)。測量時,采用的是默認(rèn)優(yōu)化設(shè)置。
ADPCM_Encoder() 函數(shù)調(diào)用需要114~126個循環(huán)。
ADPCM_Decoder() 函數(shù)調(diào)用需要99~109個循環(huán)。
請注意,這只包含壓縮/解壓縮算法。要實(shí)現(xiàn)錄制和回放功能,還需要更多代碼。
參考文獻(xiàn):
1. MSP430x4xx 系列用戶指南 (SLAU056)
2. MSP430F169 產(chǎn)品說明書 (SLAS368)
3. MSP430FG4618 產(chǎn)品說明書 (SLAS508)
4. 基于 TMS32010 的 32kbps ADPCM (SPRA131)
5. 基于 MSP430F13x 的低成本 12 位語音編解碼器設(shè)計(jì) (SLAA131)
6. MSP430FG4618/F2013試驗(yàn)板用戶指南(SLAU213)
評論