MELP語音編碼的FPGA實現(xiàn)的系統(tǒng)框架
由硬件實現(xiàn)復雜的算法通常比軟件實現(xiàn)更高效。利用Altera公司的Nios II嵌入式處理器的定制指令,可以把用戶自定義的功能直接添加到Nios II CPU的算術邏輯單元(ALU)中,以加快專項任務的執(zhí)行速度。自定義指令的優(yōu)勢就在于可以將程序代碼中的瓶頸部分改用硬件指令支持,用自定義的指令使程序得到加速。
1 MELP的構成
MELP聲碼器的采樣率為8 kHz,每個樣點值用16 bit量化,每180個樣點為1幀,幀長22.5 ms,每幀量化bit數(shù)為54 bit,總的速率為2.4 Kb/s。
MELP聲碼器是建立在傳統(tǒng)的二元激勵LPC模型基礎上,采用了混合激勵、非周期脈沖、自適應譜增強、脈沖整形濾波和傅氏級數(shù)幅度值等5項新技術,使得合成語音能更好地擬合自然語音。圖1所示為MELP編解碼原理框圖[2]。
2 Nios II可嵌入軟核的特點
Nios嵌入式處理器是用戶可配置的通用RISC嵌入式處理器,是一個非常靈活、強大的處理器,因此已成為世界上最流行的嵌入式處理器[3];采用改進的哈佛存儲器結構,CPU帶有分離的數(shù)據(jù)和程序存儲器總線控制。SOPC Builder系統(tǒng)開發(fā)工具允許用戶容易地指定系統(tǒng)中Avalon控制器和從屬設備之間的連接,這些從屬設備可以是存儲器或外圍設備。
Nios指令總線為16位,用于從存儲器中讀取指令。Nios數(shù)據(jù)總線寬度為16位或32位,分別用于Nios CPU的16位或32位配置。
2.1 指令系統(tǒng)
Nios指令系統(tǒng)支持C和C++程序編譯,包括算術和邏輯運算、位操作、字節(jié)讀、數(shù)據(jù)傳送、流程控制和條件轉移等指令。指令系統(tǒng)包含豐富的尋址方式以減少代碼長度和提高處理器性能。
2.2 寄存器組
Nios CPU有1個大容量的窗口化的通用寄存器組、8個控制寄存器、1個程序計數(shù)器和1個用于指令前綴的K寄存器。通用寄存器在16位Nios CPU中是16位,在32位Nios CPU中是32位。寄存器組可配置為包含128、256或512個寄存器。軟件可以通過包含32個寄存器的滑動窗口存取這些寄存器,滑動窗口的移動間隔是16個寄存器,且允許快速地進行寄存器切換,加速子程序的調用和返回。
2.3 高速緩存
可配置的Nios CPU可以有選擇地包含指令和數(shù)據(jù)高速緩存。高速緩存通常通過提供局部存儲系統(tǒng)提高CPU的性能,這個局部存儲系統(tǒng)可以快速地響應CPU產(chǎn)生的總線事件。Nios高速緩存的實現(xiàn)是采用簡單的直接映射的連續(xù)寫入結構,這種結構設計能夠用最少的器件資源獲得最大的性能[4]。
2.4 中斷處理
Nios處理器允許多達64個矢量中斷。中斷源有三類:外部硬件中斷、內(nèi)部中斷和軟件中斷。Nios中斷處理模式能夠準確地處理所有內(nèi)部中斷。
用戶可以有選擇地禁止TRAP指令軟件中斷、硬件中斷和內(nèi)部中斷。這項選擇能夠減少Nios系統(tǒng)的大小,但只用于處理器不運行復雜軟件的系統(tǒng)。
2.5 硬件加速
Nios指令系統(tǒng)可以利用硬件提高系統(tǒng)性能。特殊的周期密集型軟件操作可以用硬件顯著地提高系統(tǒng)性能,這種特性通過修改指令系統(tǒng)提供[5]。
Nios處理器有2種指令系統(tǒng)修改方法:自定義指令和標準CPU選項[6]。
2.5.1 自定義指令
開發(fā)者可以通過向Nios處理器指令系統(tǒng)中添加自定義指令加快時間要求嚴格的軟件算法,也可以用自定義指令在單周期和多周期操作中執(zhí)行復雜的處理任務。另外,用戶添加的自定義指令邏輯電路可以訪問Nios系統(tǒng)外的存儲器和邏輯電路。
復雜的操作序列可以在硬件中簡化為單指令的執(zhí)行。這種特性允許開發(fā)者為數(shù)字信號處理(DSP)、分組標題處理和計算密集操作優(yōu)化自己的軟件。
Altera公司的SOPC Builder軟件提供了一個圖形用戶界面(GUI),開發(fā)者利用GUI可以向Nios嵌入式處理器中添加多達5個自定義指令。
2.5.2 標準CPU選項
Altera公司提供單獨的預定義指令來提高軟件性能。MUL和MSTEP指令就是與其他硬件一起實現(xiàn)的預定義指令。當用戶在SOPC Builder中選擇這些CPU選項時,相關邏輯被增加到算術邏輯運算單元(ALU)。例如,如果用戶選擇執(zhí)行MUL指令,整數(shù)乘法器被自動地添加到CPU的ALU中,并在2個時鐘周期內(nèi)完成16位與16位的乘法操作(相同的操作若用循環(huán)的軟件程序實現(xiàn)需要80個時鐘周期)。
評論