基于FPGA的高速卷積的硬件設(shè)計實現(xiàn)
為了在整個轉(zhuǎn)換計算過程中保持高信噪比,F(xiàn)FTIP核在定點結(jié)構(gòu)與全浮點結(jié)構(gòu)之間折中,使用塊浮點結(jié)構(gòu)來表示轉(zhuǎn)換結(jié)果。在定點結(jié)構(gòu)中,數(shù)據(jù)精度需要足夠大,才能充分表示整個計算過程中的所有的中間計算結(jié)果。在執(zhí)行定點FFT過程中,經(jīng)常出現(xiàn)數(shù)據(jù)的位數(shù)過大或精度損失的現(xiàn)象。而在浮點結(jié)構(gòu)中,每個數(shù)用單獨的指數(shù)和尾數(shù)來表示,雖然這樣可以大大提高數(shù)據(jù)精度,但是浮點運算需要占用更多的器件資源。塊浮點結(jié)構(gòu)保證了FFT整個轉(zhuǎn)換過程中數(shù)據(jù)位數(shù)的有效使用,每次通過基4-FFT運算以后,數(shù)據(jù)位數(shù)最大可能增加倍,根據(jù)前面輸出數(shù)據(jù)模塊動態(tài)范圍的測量進行比例換算,換算過程中累計的移位次數(shù)被作為整個模塊的指數(shù)輸出。這種移位方法保證了最低位(LSB)的最小值在乘法運算后的輸出進行舍入操作之前就被舍棄。實際上,塊浮點表示法起到了數(shù)字自動增益(AGC)的作用,為了在連續(xù)輸出模塊中產(chǎn)生統(tǒng)一的比例,必須用最終的指數(shù)對FFT函數(shù)輸出進行比例換算。
4 實際工程中的卷積的實現(xiàn)
如圖2所示,給出了一個實際應(yīng)用的例子。為了保證I,Q兩路的相位同一性,使用雙通道A/D,選擇Linear公司的LTC2280,LTC2280支持10 bit,105 Ms/s的最大采樣率,并擁有61.6 dB的信噪比(SNR),85 dB的無雜散動態(tài)范圍(SFDR),滿足系統(tǒng)需要。雙通道D/A使用Analog公司的AD9763,AD9763支持10 bit、125 Ms/s的最大采樣率。
首先,需要在PC機上準備好h(n)對應(yīng)的DFT變換結(jié)果H(k),H(k)的處理實際上有兩種方法,一個是將h(n)下載到下位機中,使用下位機硬件實現(xiàn)H(k),還有就是將H(k)在上位機就計算好,直接將計算結(jié)果下到下位機中。由于h(n)在系統(tǒng)工作中是不變的,在PC機端事先計算好H(k)更合適,不僅可以減少FPGA的資源占用,而且也方便數(shù)據(jù)的處理。基于以上的考慮,本系統(tǒng)將在PC機端求出的H(k)通過422接口下載到下位機的RAM中,方便使用。
下位機系統(tǒng)工作之前,上位機需要通過PCI控制板卡將計算好的數(shù)據(jù)下載到下位機的RAM中,方便工作過程中的數(shù)據(jù)使用。在收到外部控制信號后,下位機開始啟動,LTC2280開始采集I、Q通道數(shù)據(jù)并送入到FPGA中。
AD輸出的I,Q數(shù)據(jù)直接作為一個復數(shù)的實部和虛部進入FFT核進行FFT變換。為了加速處理速度,使用基-4四引擎輸出結(jié)構(gòu)。FFT核輸出的結(jié)果X(k)過指數(shù)調(diào)整以后直接進入到一個硬件復數(shù)乘法器,與存儲于RAM中計算好的H(k)對應(yīng)相乘,同時乘法器輸出可以直接輸入到IFFT模塊進行逆FFT運算,IFFT計算結(jié)果再經(jīng)過指數(shù)調(diào)整以后即可以直接通過D/A輸出。
5 性能分析與改進
FPGA的流水線結(jié)構(gòu)決定了速度的瓶頸取決于整個流程中處理速度最慢的部分。在FFT核速度可以保證的前提下(EP2S60的理論速度可以達到293.06 MHz),而處理過程中全部使用FPGA內(nèi)部RAM來存儲中間數(shù)據(jù),所以在本系統(tǒng)中,F(xiàn)PGA內(nèi)部的理論處理速度達到200 MHz以上。本系統(tǒng)的處理速度主要局限于A/D和D/A的數(shù)據(jù)轉(zhuǎn)換率,根據(jù)實際測試,在100 MHz系統(tǒng)時鐘下,數(shù)據(jù)吞吐率可達100 Ms/s,滿足了設(shè)計技術(shù)指標。圖4給出了FPGA的資源占用。為了較好地檢測整個使用FFT_IFFT實現(xiàn)卷積的系統(tǒng)性能,設(shè)計了一個初略性能分析測試結(jié)構(gòu),如圖5所示。
評論