基于FPGA IP核的FFT實(shí)現(xiàn)與改進(jìn)

作者：時(shí)間：2016-10-10 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

摘要利用FPGA IP核設(shè)計(jì)了一種快速、高效的傅里葉變換系統(tǒng)。針對(duì)非整數(shù)倍信號(hào)周期截?cái)嗨鶎?dǎo)致的頻譜泄露問題，提出了一種通過時(shí)輸入信號(hào)加窗處理來抑制頻譜泄露的方法。利用Modelsim和Matlab對(duì)設(shè)計(jì)方案進(jìn)行了仿真，同時(shí)在Altera公司的CycloneⅡ硬件平臺(tái)上進(jìn)行了驗(yàn)證。驗(yàn)證結(jié)果表明，系統(tǒng)性能良好，改進(jìn)效果明顯。

本文引用地址：http://butianyuan.cn/article/201610/306475.htm

FFT是離散傅里葉變換(DFT)的一種快速算法，被廣泛應(yīng)用于頻譜分析、音頻編碼、圖像處理等數(shù)字信號(hào)處理領(lǐng)域。FFT運(yùn)算復(fù)雜，需要大量的存儲(chǔ)器和運(yùn)算單元，其硬件實(shí)現(xiàn)平臺(tái)多種多樣。DSP需要外置存儲(chǔ)器和特定接口，限制了運(yùn)算速度。ASIC雖能滿足速度要求，但其硬件電路復(fù)雜、可擴(kuò)展性差、且價(jià)格昂貴。FPGA具有陜速并行運(yùn)算、高集成度、低功耗等特點(diǎn)，且具有豐富的IP核資源，方便調(diào)用，適合FFT算法的實(shí)現(xiàn)。

對(duì)于512點(diǎn)FFT處理器，如果該512個(gè)輸入數(shù)據(jù)不是信號(hào)周期的整數(shù)倍，即非整數(shù)倍周期截?cái)?，則會(huì)出現(xiàn)頻譜泄露現(xiàn)象。窗函數(shù)處理的宗旨是減小頻譜泄露。常規(guī)的FFT硬件實(shí)現(xiàn)方法均不考慮由于非整數(shù)倍截?cái)鄬?dǎo)致的頻譜泄露問題。針對(duì)以上問題，本文設(shè)計(jì)了一種基于Altera IP核的512點(diǎn)FFT系統(tǒng)，同時(shí)通過對(duì)輸入信號(hào)的加窗處理，抑制了非整數(shù)倍信號(hào)周期截?cái)嗨a(chǎn)生的頻譜泄露。

1 原理概述

1.1 FFT原理

離散傅里葉變換(DFT)算法為

FFT為DFT的快速算法，其方法多種多樣，基本可以分為按時(shí)間抽取法和按頻率抽取法兩類。此處介紹基-4頻率抽取法。令N=4M，對(duì)式(1)N點(diǎn)的DFT可按如下方法作按頻率出抽取

4個(gè)等式可定義為一個(gè)蝶形運(yùn)算，蝶形運(yùn)算可看作基-4FFT基本運(yùn)算單元。參與蝶形運(yùn)算的4個(gè)節(jié)點(diǎn)是有規(guī)律的，分別為(n)、(n+N/4)、(n+2N/4)和(n+3N/4)。接著再將X(4r)、X(4r+1)、X(4r+2)和X(4r+3)分別分解為4個(gè)長(zhǎng)度為N/16的序列，基本結(jié)構(gòu)是每一級(jí)的運(yùn)算由N/4個(gè)蝶形運(yùn)算構(gòu)成，經(jīng)過迭代log4N次后完成計(jì)算。FFT算法的本質(zhì)是利用系數(shù)

的共軛對(duì)稱性和周期性，將長(zhǎng)序列DFT分解成短序列DFT，避免了大量的重復(fù)運(yùn)算，從而提高運(yùn)算效率。

1.2 窗函數(shù)原理

當(dāng)對(duì)輸入信號(hào)非整數(shù)倍周期截?cái)啵?12個(gè)輸入數(shù)據(jù)不是輸入信號(hào)周期的整數(shù)倍時(shí)，會(huì)出現(xiàn)頻譜泄露現(xiàn)象。對(duì)輸入信號(hào)進(jìn)行加窗處理，可以有效地抑制頻譜泄露。常用的窗函數(shù)有矩形窗(Rectangle Window)、漢寧窗(Hanning Window)、海明窗(Hamming Window)、布拉克曼窗(Blackman Window)等，不同的窗函數(shù)具有不同的特點(diǎn)，表現(xiàn)在主瓣旁瓣寬度，頻率識(shí)別精度及幅度識(shí)別精度等方面。圖1為Matlab仿真圖，分別為原始信號(hào)，原始信號(hào)加窗(海明窗)結(jié)果，原始信號(hào)做512點(diǎn)FFT結(jié)果，原始信號(hào)加窗后再做512點(diǎn)FFT結(jié)果，這4幅圖直觀形象地描述了時(shí)域信號(hào)做FFT后的頻域結(jié)果，以及原始信號(hào)是否加窗對(duì)FFT結(jié)果的影響。

2 FFT IP核

FFT IP核是高速執(zhí)行的，參數(shù)可配置的FFT處理器，可以實(shí)現(xiàn)復(fù)數(shù)形式的FFT變換和IFFT變換。想要正確地使用FFT IP核，首先需要了解其引擎結(jié)構(gòu)、數(shù)據(jù)流結(jié)構(gòu)和關(guān)鍵管腳信號(hào)。

2.1 引擎結(jié)構(gòu)

FFI IP核有兩種不同的引擎結(jié)構(gòu)：四輸出和單輸出，結(jié)構(gòu)如圖2(a)和圖2(b)所示。核心區(qū)別在于FFT蝶形處理器的吞吐量。一個(gè)時(shí)鐘周期內(nèi)，四輸出結(jié)構(gòu)可以計(jì)算出所有4個(gè)蝶形輸出，單輸出結(jié)構(gòu)可以計(jì)算出一個(gè)蝶形輸出。

2.2 數(shù)據(jù)流結(jié)構(gòu)

FFI IP核支持流、變量流、緩沖突發(fā)、突發(fā)4種數(shù)據(jù)流結(jié)構(gòu)。流結(jié)構(gòu)允許連續(xù)輸入數(shù)據(jù)，同時(shí)輸出連續(xù)的復(fù)數(shù)數(shù)據(jù)流。變量流產(chǎn)生一個(gè)與流結(jié)構(gòu)類似的連續(xù)輸出數(shù)據(jù)流。緩沖突發(fā)結(jié)構(gòu)需要存儲(chǔ)資源相對(duì)較少，但平均吞吐量也相應(yīng)降低。突發(fā)結(jié)構(gòu)的執(zhí)行過程與緩沖突發(fā)結(jié)構(gòu)類似，對(duì)于給定的參數(shù)設(shè)置，突發(fā)結(jié)構(gòu)需要更少的存儲(chǔ)資源。

其中，clk為時(shí)鐘信號(hào);reset_n為復(fù)位信號(hào);inverse為FFT處理器變換模式選擇信號(hào)，選擇FFT或IFFF;sink_valid為輸入數(shù)據(jù)有效信號(hào);sink_sop為輸入第一個(gè)數(shù)據(jù)標(biāo)志信號(hào);sink_eop為輸入最后一個(gè)數(shù)據(jù)標(biāo)志信號(hào);sink_real為輸入實(shí)部數(shù)據(jù);sink_imag為輸入虛部數(shù)據(jù);sink_error為輸入錯(cuò)誤標(biāo)志;source_ready為輸出等待狀態(tài)標(biāo)志;sink_ready為輸入等待狀態(tài)標(biāo)志;source_error為輸出錯(cuò)誤標(biāo)志;source_real為結(jié)果實(shí)部數(shù)據(jù);source_imag為結(jié)果虛部數(shù)據(jù);source_exp為結(jié)果補(bǔ)償系數(shù);source_valid為結(jié)果有效信號(hào);source_sop為

輸出第一個(gè)數(shù)據(jù)標(biāo)志信號(hào);source_eop為輸出最后一個(gè)數(shù)據(jù)標(biāo)志信號(hào)。

3 方案設(shè)計(jì)

系統(tǒng)主要由三部分組成：A/D采集模塊、FPGA處理模塊及MCU運(yùn)算顯示模塊，系統(tǒng)框圖如圖4所示。A/D采集外部信號(hào)數(shù)據(jù)，將其存入FPGA內(nèi)部緩存RAM。當(dāng)FFT輸入有效時(shí)，讀取緩存中的數(shù)據(jù)，同時(shí)與窗函數(shù)表中的對(duì)應(yīng)系數(shù)做乘法運(yùn)算，結(jié)果輸入FFT核中，F(xiàn)FT核處理結(jié)束后將數(shù)據(jù)存入緩存RAM中。單片機(jī)讀取緩存RAM中的結(jié)果數(shù)據(jù)，進(jìn)行相應(yīng)的模值計(jì)算，并通過LCD顯示結(jié)果頻譜圖形。該方案的核心在于窗函數(shù)與FFT運(yùn)算核的設(shè)計(jì)與實(shí)現(xiàn)。

3.1 窗函數(shù)設(shè)計(jì)

前端數(shù)據(jù)緩存采用雙口RAM核，深度512，位寬8 bit，存放A/D采集到的信號(hào)數(shù)據(jù)。窗函數(shù)表采用ROM核，深度512，位寬8 bit，存放窗函數(shù)數(shù)據(jù)。通過Matlab生成512點(diǎn)Hamming窗函數(shù)系數(shù)表，由于該數(shù)據(jù)為浮點(diǎn)數(shù)，而本設(shè)計(jì)中全部采用定點(diǎn)運(yùn)算，故對(duì)窗函數(shù)系數(shù)進(jìn)行256倍放大，將其變?yōu)槎c(diǎn)整數(shù)，數(shù)據(jù)范圍為0～255。將系數(shù)表生成mif文件，作為ROM的初始化文件。該RAM和ROM采用同一套讀出地址，保證相應(yīng)數(shù)據(jù)同步讀出，做乘法運(yùn)算，得到16 bit結(jié)果數(shù)據(jù)。由于Hamming窗數(shù)據(jù)是實(shí)際數(shù)據(jù)的256倍，所以需要對(duì)乘法結(jié)果進(jìn)行右移8位操作，得到8bit FFT輸入數(shù)據(jù)。設(shè)計(jì)模塊如圖5所示，該模塊實(shí)現(xiàn)了輸入信號(hào)數(shù)據(jù)的加窗處理。

3.2 FFT核設(shè)計(jì)

FFT核采用MegaWizard FFT v11.1，變換點(diǎn)數(shù)選擇512，數(shù)據(jù)精度8 bit，引擎結(jié)構(gòu)選擇單輸出結(jié)構(gòu)，引擎數(shù)為1，I/O數(shù)據(jù)流結(jié)構(gòu)選擇突發(fā)(Burst)結(jié)構(gòu)。FFT輸出數(shù)據(jù)有3種：實(shí)部數(shù)據(jù)、虛部數(shù)據(jù)和補(bǔ)償指數(shù)數(shù)據(jù)。采用兩個(gè)雙口RAM核，深度均為512，寬度均為8 bit，分別存放

FFT核的實(shí)部結(jié)果數(shù)據(jù)和虛部結(jié)果數(shù)據(jù)。由于每512個(gè)FFT輸出數(shù)據(jù)，補(bǔ)償指數(shù)均相同，所以設(shè)置一個(gè)8 bit的寄存器存放補(bǔ)償指數(shù)即可。設(shè)計(jì)模塊如圖6所示，該模塊實(shí)現(xiàn)了加窗處理后的信號(hào)數(shù)據(jù)的快速傅里葉變換。

4 仿真與硬件驗(yàn)證

4.1 系統(tǒng)仿真

FPGA開發(fā)環(huán)境為QuartusII 11.1，仿真環(huán)境為Modelsiml0.0。仿真時(shí)，由Matlab生成波形數(shù)據(jù)mif文件，作為仿真測(cè)試數(shù)據(jù)文件存入波形緩存RAM中。通過Quartus II調(diào)用Modesim對(duì)測(cè)試工程進(jìn)行仿真，仿真時(shí)序如圖7所示。經(jīng)時(shí)序分析可知，工作時(shí)鐘頻率為100 MHz(period= 10 ns)，每進(jìn)行一次512點(diǎn)處理到全部輸出處理結(jié)果共耗時(shí)36.9μs。

將仿真結(jié)果數(shù)據(jù)導(dǎo)入Matlab，得到結(jié)果由圖8(a)知，對(duì)信號(hào)周期整數(shù)倍截?cái)郌FT處理后，得到單一的正確的頻譜圖;如圖8(b)知，對(duì)信號(hào)周期非整數(shù)倍截?cái)郌FT處理后，頻譜出現(xiàn)嚴(yán)重泄露，且幅度值下降;如圖8(c)知，對(duì)信號(hào)周期非整數(shù)倍截?cái)?，加窗后做FFT處理，頻譜泄露現(xiàn)象有明顯的改進(jìn)，但幅度值因?yàn)榧哟疤幚矶鄳?yīng)下降。仿真結(jié)果表明，F(xiàn)FT系統(tǒng)設(shè)計(jì)正確，且加窗處理對(duì)信號(hào)周期非整數(shù)倍截?cái)鄬?dǎo)致的頻譜泄露問題有良好的改進(jìn)效果。

4.2 硬件驗(yàn)證

ADC選用ADS9238，它是一款高速高動(dòng)態(tài)范圍A/D轉(zhuǎn)換器，12 bit，最高采樣時(shí)鐘達(dá)65 MSample·s-1。MCU選用c8051F120單片機(jī)，LCD選用ZLG320240K-FFSSWE-YBC，分辨率為320×240，可以滿足字符、漢字及圖形等各種顯示需求。FPGA選用Altera公司的Cyclone II EP2C8Q208 C8N，該芯片資源豐富，包含8256個(gè)LEs，36個(gè)4 kbit Block RAM，18個(gè)內(nèi)部乘法器和208個(gè)I/O資源，并支持FFT IP核。

FFT處理時(shí)鐘為100 MHz，A/D采樣率為10 MHz，采樣點(diǎn)數(shù)為512，故頻譜分辨率f=10 MHz/512=19.531 kHz。當(dāng)輸入信號(hào)為390.625 kHz時(shí)，512個(gè)采樣點(diǎn)表示20個(gè)信號(hào)周期;當(dāng)輸入信號(hào)為400.390 kHz時(shí)，512個(gè)采樣點(diǎn)表示20.5個(gè)信號(hào)周期。在加窗和不加窗兩種情況下分別對(duì)頻率為390.625 kHz和400.390 kHz的正弦信號(hào)進(jìn)行采樣，得到如圖9的結(jié)果。

圖9中(a)為不加窗的情況下對(duì)390.625 kHz的輸入信號(hào)進(jìn)行采樣，由于512個(gè)點(diǎn)正好是20倍截?cái)?，所以只在頻譜的第20個(gè)點(diǎn)有單一幅值，說明FFT系統(tǒng)工作正常。而且由于是整數(shù)倍截?cái)?，結(jié)果沒有頻譜泄露;圖9(b)為不加窗的情況下對(duì)400.390 kHz的輸入信號(hào)進(jìn)行采樣，由于512個(gè)點(diǎn)正好為20.5倍截?cái)?，非整?shù)倍截?cái)?，所以結(jié)果中存在嚴(yán)重的頻譜泄露;圖9(c)為加窗的情況下對(duì)400.390 kHz的輸入信號(hào)進(jìn)行采樣，可以看到，頻譜泄露現(xiàn)象得到較好的改善。硬件測(cè)試結(jié)果表明，F(xiàn)FT系統(tǒng)設(shè)計(jì)正確，且加窗處理對(duì)信號(hào)周期非整數(shù)倍截?cái)鄬?dǎo)致的頻譜泄露問題有良好的改進(jìn)效果。

5 結(jié)束語

本文利用Altera公司的IP核設(shè)計(jì)了一種FFT系統(tǒng)，該方法設(shè)計(jì)簡(jiǎn)單、資源利用率高、運(yùn)算速度快，試驗(yàn)證明具有良好性能。同時(shí)針對(duì)非整數(shù)倍周期截?cái)鄬?dǎo)致的頻譜泄露問題，提出了一種通過加窗改進(jìn)的方法，經(jīng)硬件平臺(tái)驗(yàn)證，其改進(jìn)效果明顯。由于加窗導(dǎo)致的幅值變化問題，本文尚未作詳細(xì)論證，有待進(jìn)一步的研究。

新聞中心

基于FPGA IP核的FFT實(shí)現(xiàn)與改進(jìn)

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)