基于FPGA IP核的FFT實(shí)現(xiàn)與改進(jìn)
摘要 利用FPGA IP核設(shè)計(jì)了一種快速、高效的傅里葉變換系統(tǒng)。針對(duì)非整數(shù)倍信號(hào)周期截?cái)嗨鶎?dǎo)致的頻譜泄露問題,提出了一種通過時(shí)輸入信號(hào)加窗處理來抑制頻譜泄露的方法。利用Modelsim和Matlab對(duì)設(shè)計(jì)方案進(jìn)行了仿真,同時(shí)在Altera公司的CycloneⅡ硬件平臺(tái)上進(jìn)行了驗(yàn)證。驗(yàn)證結(jié)果表明,系統(tǒng)性能良好,改進(jìn)效果明顯。
本文引用地址:http://butianyuan.cn/article/201610/306475.htmFFT是離散傅里葉變換(DFT)的一種快速算法,被廣泛應(yīng)用于頻譜分析、音頻編碼、圖像處理等數(shù)字信號(hào)處理領(lǐng)域。FFT運(yùn)算復(fù)雜,需要大量的存儲(chǔ)器和運(yùn)算單元,其硬件實(shí)現(xiàn)平臺(tái)多種多樣。DSP需要外置存儲(chǔ)器和特定接口,限制了運(yùn)算速度。ASIC雖能滿足速度要求,但其硬件電路復(fù)雜、可擴(kuò)展性差、且價(jià)格昂貴。FPGA具有陜速并行運(yùn)算、高集成度、低功耗等特點(diǎn),且具有豐富的IP核資源,方便調(diào)用,適合FFT算法的實(shí)現(xiàn)。
對(duì)于512點(diǎn)FFT處理器,如果該512個(gè)輸入數(shù)據(jù)不是信號(hào)周期的整數(shù)倍,即非整數(shù)倍周期截?cái)?,則會(huì)出現(xiàn)頻譜泄露現(xiàn)象。窗函數(shù)處理的宗旨是減小頻譜泄露。常規(guī)的FFT硬件實(shí)現(xiàn)方法均不考慮由于非整數(shù)倍截?cái)鄬?dǎo)致的頻譜泄露問題。針對(duì)以上問題,本文設(shè)計(jì)了一種基于Altera IP核的512點(diǎn)FFT系統(tǒng),同時(shí)通過對(duì)輸入信號(hào)的加窗處理,抑制了非整數(shù)倍信號(hào)周期截?cái)嗨a(chǎn)生的頻譜泄露。
1 原理概述
1.1 FFT原理
離散傅里葉變換(DFT)算法為
FFT為DFT的快速算法,其方法多種多樣,基本可以分為按時(shí)間抽取法和按頻率抽取法兩類。此處介紹基-4頻率抽取法。令N=4M,對(duì)式(1)N點(diǎn)的DFT可按如下方法作按頻率出抽取
4個(gè)等式可定義為一個(gè)蝶形運(yùn)算,蝶形運(yùn)算可看作基-4FFT基本運(yùn)算單元。參與蝶形運(yùn)算的4個(gè)節(jié)點(diǎn)是有規(guī)律的,分別為(n)、(n+N/4)、(n+2N/4)和(n+3N/4)。接著再將X(4r)、X(4r+1)、X(4r+2)和X(4r+3)分別分解為4個(gè)長(zhǎng)度為N/16的序列,基本結(jié)構(gòu)是每一級(jí)的運(yùn)算由N/4個(gè)蝶形運(yùn)算構(gòu)成,經(jīng)過迭代log4N次后完成計(jì)算。FFT算法的本質(zhì)是利用系數(shù)
的共軛對(duì)稱性和周期性,將長(zhǎng)序列DFT分解成短序列DFT,避免了大量的重復(fù)運(yùn)算,從而提高運(yùn)算效率。
1.2 窗函數(shù)原理
當(dāng)對(duì)輸入信號(hào)非整數(shù)倍周期截?cái)啵?12個(gè)輸入數(shù)據(jù)不是輸入信號(hào)周期的整數(shù)倍時(shí),會(huì)出現(xiàn)頻譜泄露現(xiàn)象。對(duì)輸入信號(hào)進(jìn)行加窗處理,可以有效地抑制頻譜泄露。常用的窗函數(shù)有矩形窗(Rectangle Window)、漢寧窗(Hanning Window)、海明窗(Hamming Window)、布拉克曼窗(Blackman Window)等,不同的窗函數(shù)具有不同的特點(diǎn),表現(xiàn)在主瓣旁瓣寬度,頻率識(shí)別精度及幅度識(shí)別精度等方面。圖1為Matlab仿真圖,分別為原始信號(hào),原始信號(hào)加窗(海明窗)結(jié)果,原始信號(hào)做512點(diǎn)FFT結(jié)果,原始信號(hào)加窗后再做512點(diǎn)FFT結(jié)果,這4幅圖直觀形象地描述了時(shí)域信號(hào)做FFT后的頻域結(jié)果,以及原始信號(hào)是否加窗對(duì)FFT結(jié)果的影響。
2 FFT IP核
FFT IP核是高速執(zhí)行的,參數(shù)可配置的FFT處理器,可以實(shí)現(xiàn)復(fù)數(shù)形式的FFT變換和IFFT變換。想要正確地使用FFT IP核,首先需要了解其引擎結(jié)構(gòu)、數(shù)據(jù)流結(jié)構(gòu)和關(guān)鍵管腳信號(hào)。
2.1 引擎結(jié)構(gòu)
FFI IP核有兩種不同的引擎結(jié)構(gòu):四輸出和單輸出,結(jié)構(gòu)如圖2(a)和圖2(b)所示。核心區(qū)別在于FFT蝶形處理器的吞吐量。一個(gè)時(shí)鐘周期內(nèi),四輸出結(jié)構(gòu)可以計(jì)算出所有4個(gè)蝶形輸出,單輸出結(jié)構(gòu)可以計(jì)算出一個(gè)蝶形輸出。
2.2 數(shù)據(jù)流結(jié)構(gòu)
FFI IP核支持流、變量流、緩沖突發(fā)、突發(fā)4種數(shù)據(jù)流結(jié)構(gòu)。流結(jié)構(gòu)允許連續(xù)輸入數(shù)據(jù),同時(shí)輸出連續(xù)的復(fù)數(shù)數(shù)據(jù)流。變量流產(chǎn)生一個(gè)與流結(jié)構(gòu)類似的連續(xù)輸出數(shù)據(jù)流。緩沖突發(fā)結(jié)構(gòu)需要存儲(chǔ)資源相對(duì)較少,但平均吞吐量也相應(yīng)降低。突發(fā)結(jié)構(gòu)的執(zhí)行過程與緩沖突發(fā)結(jié)構(gòu)類似,對(duì)于給定的參數(shù)設(shè)置,突發(fā)結(jié)構(gòu)需要更少的存儲(chǔ)資源。
其中,clk為時(shí)鐘信號(hào);reset_n為復(fù)位信號(hào);inverse為FFT處理器變換模式選擇信號(hào),選擇FFT或IFFF;sink_valid為輸入數(shù)據(jù)有效信號(hào);sink_sop為輸入第一個(gè)數(shù)據(jù)標(biāo)志信號(hào);sink_eop為輸入最后一個(gè)數(shù)據(jù)標(biāo)志信號(hào);sink_real為輸入實(shí)部數(shù)據(jù);sink_imag為輸入虛部數(shù)據(jù);sink_error為輸入錯(cuò)誤標(biāo)志;source_ready為輸出等待狀態(tài)標(biāo)志;sink_ready為輸入等待狀態(tài)標(biāo)志;source_error為輸出錯(cuò)誤標(biāo)志;source_real為結(jié)果實(shí)部數(shù)據(jù);source_imag為結(jié)果虛部數(shù)據(jù);source_exp為結(jié)果補(bǔ)償系數(shù);source_valid為結(jié)果有效信號(hào);source_sop為
輸出第一個(gè)數(shù)據(jù)標(biāo)志信號(hào);source_eop為輸出最后一個(gè)數(shù)據(jù)標(biāo)志信號(hào)。
3 方案設(shè)計(jì)
系統(tǒng)主要由三部分組成:A/D采集模塊、FPGA處理模塊及MCU運(yùn)算顯示模塊,系統(tǒng)框圖如圖4所示。A/D采集外部信號(hào)數(shù)據(jù),將其存入FPGA內(nèi)部緩存RAM。當(dāng)FFT輸入有效時(shí),讀取緩存中的數(shù)據(jù),同時(shí)與窗函數(shù)表中的對(duì)應(yīng)系數(shù)做乘法運(yùn)算,結(jié)果輸入FFT核中,F(xiàn)FT核處理結(jié)束后將數(shù)據(jù)存入緩存RAM中。單片機(jī)讀取緩存RAM中的結(jié)果數(shù)據(jù),進(jìn)行相應(yīng)的模值計(jì)算,并通過LCD顯示結(jié)果頻譜圖形。該方案的核心在于窗函數(shù)與FFT運(yùn)算核的設(shè)計(jì)與實(shí)現(xiàn)。
3.1 窗函數(shù)設(shè)計(jì)
前端數(shù)據(jù)緩存采用雙口RAM核,深度512,位寬8 bit,存放A/D采集到的信號(hào)數(shù)據(jù)。窗函數(shù)表采用ROM核,深度512,位寬8 bit,存放窗函數(shù)數(shù)據(jù)。通過Matlab生成512點(diǎn)Hamming窗函數(shù)系數(shù)表,由于該數(shù)據(jù)為浮點(diǎn)數(shù),而本設(shè)計(jì)中全部采用定點(diǎn)運(yùn)算,故對(duì)窗函數(shù)系數(shù)進(jìn)行256倍放大,將其變?yōu)槎c(diǎn)整數(shù),數(shù)據(jù)范圍為0~255。將系數(shù)表生成mif文件,作為ROM的初始化文件。該RAM和ROM采用同一套讀出地址,保證相應(yīng)數(shù)據(jù)同步讀出,做乘法運(yùn)算,得到16 bit結(jié)果數(shù)據(jù)。由于Hamming窗數(shù)據(jù)是實(shí)際數(shù)據(jù)的256倍,所以需要對(duì)乘法結(jié)果進(jìn)行右移8位操作,得到8bit FFT輸入數(shù)據(jù)。設(shè)計(jì)模塊如圖5所示,該模塊實(shí)現(xiàn)了輸入信號(hào)數(shù)據(jù)的加窗處理。
3.2 FFT核設(shè)計(jì)
FFT核采用MegaWizard FFT v11.1,變換點(diǎn)數(shù)選擇512,數(shù)據(jù)精度8 bit,引擎結(jié)構(gòu)選擇單輸出結(jié)構(gòu),引擎數(shù)為1,I/O數(shù)據(jù)流結(jié)構(gòu)選擇突發(fā)(Burst)結(jié)構(gòu)。FFT輸出數(shù)據(jù)有3種:實(shí)部數(shù)據(jù)、虛部數(shù)據(jù)和補(bǔ)償指數(shù)數(shù)據(jù)。采用兩個(gè)雙口RAM核,深度均為512,寬度均為8 bit,分別存放
FFT核的實(shí)部結(jié)果數(shù)據(jù)和虛部結(jié)果數(shù)據(jù)。由于每512個(gè)FFT輸出數(shù)據(jù),補(bǔ)償指數(shù)均相同,所以設(shè)置一個(gè)8 bit的寄存器存放補(bǔ)償指數(shù)即可。設(shè)計(jì)模塊如圖6所示,該模塊實(shí)現(xiàn)了加窗處理后的信號(hào)數(shù)據(jù)的快速傅里葉變換。
4 仿真與硬件驗(yàn)證
4.1 系統(tǒng)仿真
FPGA開發(fā)環(huán)境為QuartusII 11.1,仿真環(huán)境為Modelsiml0.0。仿真時(shí),由Matlab生成波形數(shù)據(jù)mif文件,作為仿真測(cè)試數(shù)據(jù)文件存入波形緩存RAM中。通過Quartus II調(diào)用Modesim對(duì)測(cè)試工程進(jìn)行仿真,仿真時(shí)序如圖7所示。經(jīng)時(shí)序分析可知,工作時(shí)鐘頻率為100 MHz(period= 10 ns),每進(jìn)行一次512點(diǎn)處理到全部輸出處理結(jié)果共耗時(shí)36.9μs。
將仿真結(jié)果數(shù)據(jù)導(dǎo)入Matlab,得到結(jié)果由圖8(a)知,對(duì)信號(hào)周期整數(shù)倍截?cái)郌FT處理后,得到單一的正確的頻譜圖;如圖8(b)知,對(duì)信號(hào)周期非整數(shù)倍截?cái)郌FT處理后,頻譜出現(xiàn)嚴(yán)重泄露,且幅度值下降;如圖8(c)知,對(duì)信號(hào)周期非整數(shù)倍截?cái)?,加窗后做FFT處理,頻譜泄露現(xiàn)象有明顯的改進(jìn),但幅度值因?yàn)榧哟疤幚矶鄳?yīng)下降。仿真結(jié)果表明,F(xiàn)FT系統(tǒng)設(shè)計(jì)正確,且加窗處理對(duì)信號(hào)周期非整數(shù)倍截?cái)鄬?dǎo)致的頻譜泄露問題有良好的改進(jìn)效果。
4.2 硬件驗(yàn)證
ADC選用ADS9238,它是一款高速高動(dòng)態(tài)范圍A/D轉(zhuǎn)換器,12 bit,最高采樣時(shí)鐘達(dá)65 MSample·s-1。MCU選用c8051F120單片機(jī),LCD選用ZLG320240K-FFSSWE-YBC,分辨率為320×240,可以滿足字符、漢字及圖形等各種顯示需求。FPGA選用Altera公司的Cyclone II EP2C8Q208 C8N,該芯片資源豐富,包含8256個(gè)LEs,36個(gè)4 kbit Block RAM,18個(gè)內(nèi)部乘法器和208個(gè)I/O資源,并支持FFT IP核。
FFT處理時(shí)鐘為100 MHz,A/D采樣率為10 MHz,采樣點(diǎn)數(shù)為512,故頻譜分辨率f=10 MHz/512=19.531 kHz。當(dāng)輸入信號(hào)為390.625 kHz時(shí),512個(gè)采樣點(diǎn)表示20個(gè)信號(hào)周期;當(dāng)輸入信號(hào)為400.390 kHz時(shí),512個(gè)采樣點(diǎn)表示20.5個(gè)信號(hào)周期。在加窗和不加窗兩種情況下分別對(duì)頻率為390.625 kHz和400.390 kHz的正弦信號(hào)進(jìn)行采樣,得到如圖9的結(jié)果。
圖9中(a)為不加窗的情況下對(duì)390.625 kHz的輸入信號(hào)進(jìn)行采樣,由于512個(gè)點(diǎn)正好是20倍截?cái)?,所以只在頻譜的第20個(gè)點(diǎn)有單一幅值,說明FFT系統(tǒng)工作正常。而且由于是整數(shù)倍截?cái)?,結(jié)果沒有頻譜泄露;圖9(b)為不加窗的情況下對(duì)400.390 kHz的輸入信號(hào)進(jìn)行采樣,由于512個(gè)點(diǎn)正好為20.5倍截?cái)?,非整?shù)倍截?cái)?,所以結(jié)果中存在嚴(yán)重的頻譜泄露;圖9(c)為加窗的情況下對(duì)400.390 kHz的輸入信號(hào)進(jìn)行采樣,可以看到,頻譜泄露現(xiàn)象得到較好的改善。硬件測(cè)試結(jié)果表明,F(xiàn)FT系統(tǒng)設(shè)計(jì)正確,且加窗處理對(duì)信號(hào)周期非整數(shù)倍截?cái)鄬?dǎo)致的頻譜泄露問題有良好的改進(jìn)效果。
5 結(jié)束語
本文利用Altera公司的IP核設(shè)計(jì)了一種FFT系統(tǒng),該方法設(shè)計(jì)簡(jiǎn)單、資源利用率高、運(yùn)算速度快,試驗(yàn)證明具有良好性能。同時(shí)針對(duì)非整數(shù)倍周期截?cái)鄬?dǎo)致的頻譜泄露問題,提出了一種通過加窗改進(jìn)的方法,經(jīng)硬件平臺(tái)驗(yàn)證,其改進(jìn)效果明顯。由于加窗導(dǎo)致的幅值變化問題,本文尚未作詳細(xì)論證,有待進(jìn)一步的研究。
評(píng)論