新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > FPGA系統(tǒng)設(shè)計(jì)原則和技巧之:FPGA系統(tǒng)設(shè)計(jì)的3個(gè)基本原則

FPGA系統(tǒng)設(shè)計(jì)原則和技巧之:FPGA系統(tǒng)設(shè)計(jì)的3個(gè)基本原則

作者: 時(shí)間:2017-06-05 來源:網(wǎng)絡(luò) 收藏

本文引用地址:http://www.butianyuan.cn/article/201706/348811.htm

9.1的3個(gè)基本原則

9.1.1面積與速度的平衡互換原則

在FPGA設(shè)計(jì)領(lǐng)域,面積通常指的是FPGA的芯片資源,包括邏輯資源和I/O資源等。速度一般指的是FPGA工作的最高頻率。和DSP或者ARM芯片不同,F(xiàn)PGA設(shè)計(jì)的工作頻率不是固定的,而是和設(shè)計(jì)本身的延遲緊密相聯(lián)。

在實(shí)際設(shè)計(jì)中,使用最小的面積設(shè)計(jì)出最高的速度當(dāng)然是每一個(gè)開發(fā)者追求的目標(biāo)。但往往面積和速度是不可兼得的。想使用最低的成本設(shè)計(jì)出最高性能的產(chǎn)品是不現(xiàn)實(shí)的,只有兼顧面積和速度,在成本和性能之間有所取舍,才能夠達(dá)到設(shè)計(jì)者的產(chǎn)品需求。

1.速度換面積

速度優(yōu)勢(shì)可以換取面積的節(jié)約。面積越小,就意味可以用更低的成本來實(shí)現(xiàn)產(chǎn)品的功能。

所謂的速度優(yōu)勢(shì)指的是在整個(gè)FPGA設(shè)計(jì)中,有一部分模塊的算法運(yùn)行周期較其他部分快很多,這部分模塊就相對(duì)與其他的部分具有速度優(yōu)勢(shì)。利用這部分模塊的速度優(yōu)勢(shì)來降低整個(gè)FPGA設(shè)計(jì)的使用資源就是速度換面積原則的體現(xiàn)。

速度換面積原則在一些較復(fù)雜的算法設(shè)計(jì)中常常會(huì)用到。在這些算法設(shè)計(jì)中,流水線設(shè)計(jì)常常是必須用到的技術(shù)。在流水線的每一級(jí),常常有同一個(gè)算法被重復(fù)的使用,但是使用的次數(shù)不一樣的現(xiàn)象。在正常的設(shè)計(jì)中,這些被重復(fù)使用但是使用次數(shù)不同的模塊將會(huì)占用大量的FPGA資源。

隨著FPGA技術(shù)的不斷發(fā)展,F(xiàn)PGA內(nèi)部越來越多的內(nèi)嵌了DSP乘法模塊,為一些常用算法的實(shí)現(xiàn)提供了很大的方便,也大大提高了運(yùn)算的速度和能力。因此,在以往設(shè)計(jì)中那些被重復(fù)使用的算法模塊的速度可以很高,即相對(duì)其他部分具有速度優(yōu)勢(shì)。

利用這個(gè)特點(diǎn),重新對(duì)FPGA的設(shè)計(jì)進(jìn)行改造。將被重復(fù)使用的算法模塊提煉出最小的復(fù)用單元,并利用這個(gè)最小的高速單元代替原設(shè)計(jì)中被重復(fù)使用但次數(shù)不同的模塊。當(dāng)然在改造的時(shí)候必然會(huì)增加一些其他的資源來實(shí)現(xiàn)這個(gè)代替的過程。但是只要速度具有優(yōu)勢(shì),那么增加的這部分邏輯依然能夠?qū)崿F(xiàn)降低面積、提高速度的目的。

如圖9.1所示,是一個(gè)流水線的n個(gè)步驟,每個(gè)步驟都相應(yīng)地運(yùn)算一定次數(shù)的算法,每個(gè)步驟的算法都占用獨(dú)立的資源實(shí)現(xiàn)。其中運(yùn)算次數(shù)方框的大小表示占用的設(shè)計(jì)資源。

圖9.1未使用速度換面積的流水線算法

假設(shè)這些算法中有可以復(fù)用的基本單元,并且具有速度優(yōu)勢(shì),那么就可以使用如圖9.2所示的方式實(shí)現(xiàn)面積的節(jié)省。在這種方法中,通過將算法提取出最小單元,配合算法次數(shù)計(jì)數(shù)器及流水線的輸入輸出選擇開關(guān),即可實(shí)現(xiàn)將原設(shè)計(jì)中復(fù)雜的算法結(jié)構(gòu)簡化的目的。

圖9.2使用速度換面積的流水線算法

可以看到,速度換面積的關(guān)鍵是的復(fù)用。

2.面積換速度

面積換速度正好和速度換面積相反。在這種方法中,面積的復(fù)制可以換取速度的提高。支持的速度越高,就意味著可以實(shí)現(xiàn)更高的產(chǎn)品性能。在某些應(yīng)用領(lǐng)域,比如軍事、航天等,往往關(guān)注的是產(chǎn)品的性能,而不是成本。這些產(chǎn)品中,可以采用并行處理技術(shù),實(shí)現(xiàn)面積換速度。

如圖9.3所示是利用并行技術(shù)、面積(資源)復(fù)制的方法實(shí)現(xiàn)了高速的處理能力。

在進(jìn)行FPGA進(jìn)行設(shè)計(jì)時(shí),我們必須注意到,F(xiàn)PGA的工作頻率是有限的。因?yàn)镕PGA是工作在TTL電平下,該電平結(jié)構(gòu)(晶體管-晶體管)所能支持的切換頻率是有限的。但是在實(shí)際的產(chǎn)品設(shè)計(jì)中,高頻的處理需求越來越多,如何解決這個(gè)矛盾?

首先使用簡單的串/并轉(zhuǎn)換實(shí)現(xiàn)多路的速度降頻,如圖9.3所示,450Mbit/s的頻率分為3路,每路150Mbit/s;其次在每一路上使用相同算法但各占設(shè)計(jì)資源的處理模塊進(jìn)行低頻(相對(duì))的處理;最后再將每一路的處理結(jié)果進(jìn)行并/串轉(zhuǎn)換成為高頻的輸出數(shù)據(jù)。

圖9.3面積換速度實(shí)現(xiàn)并行高速處理

串/并和并/串轉(zhuǎn)換能夠支持那么高的頻率嗎?這個(gè)問題的解決得益于FPGA技術(shù)的發(fā)展。如今主流的FPGA器件中,都帶有高速的I/O資源及內(nèi)部RAM供用戶使用。這些高速I/O資源及內(nèi)部RAM能夠?qū)崿F(xiàn)I/O接口的穩(wěn)定高速切換和數(shù)據(jù)總線寬度的轉(zhuǎn)換。這部分的詳細(xì)介紹參見9.3節(jié)。

9.1.2硬件可實(shí)現(xiàn)原則

FPGA設(shè)計(jì)通常會(huì)采用HDL語言,比如或者VHDL。當(dāng)采用HDL語言來描述一個(gè)硬件電路功能的時(shí)候,一定要保證代碼描述的電路是硬件可實(shí)現(xiàn)的。語言的語法與C語言很相似,但是它們之間有本質(zhì)的區(qū)別。

C語言是基于過程的高級(jí)語言,編譯后可以在CPU上運(yùn)行。而語言描述的本身就是硬件結(jié)構(gòu),編譯后是硬件電路。因此,有些語句在C語言的環(huán)境中應(yīng)用沒有問題,但是在HDL語言環(huán)境下就會(huì)導(dǎo)致結(jié)果不正確或者不理想。

比如for語句,以下代碼在C語言下是一段普通代碼:

for(i=0;i16;i++)

DoSomething(); //實(shí)現(xiàn)函數(shù)的重復(fù)調(diào)用

在C語言下運(yùn)行沒有任何問題,但是在VerilogHDL的環(huán)境下編譯就會(huì)導(dǎo)致綜合后的資源嚴(yán)重浪費(fèi)。所以for語句在VerilogHDL環(huán)境下一般只用來做仿真或者行為級(jí)的描述。那么for語句在HDL語言中如何實(shí)現(xiàn)呢?有幾種不同的模式,其中最常見的是以下方式。

reg[3:0]counter; //調(diào)用次數(shù)計(jì)數(shù)器

always@(posedgeclk) //計(jì)數(shù)器計(jì)數(shù)模塊

if(syn_rst)

counter=4’b0;

else

counter=counter+1;

always@(posedgeclk) begin //使用case語句實(shí)現(xiàn)分支調(diào)用,

case(counter) //配合計(jì)數(shù)器計(jì)數(shù),各分支可使用同樣的執(zhí)行語句

4’b000: DoSomething; //實(shí)現(xiàn)該語句的重復(fù)調(diào)用

4’b0001:DoSomething; //等同于高級(jí)語言中的for語句

……

default:DoSomething;

endcase

end

在counter計(jì)數(shù)器的不同狀態(tài)可以設(shè)計(jì)不同的動(dòng)作。如果都是完成一樣的操作,就是循環(huán)for語句了。

9.1.3原則

同步電路和異步電路是FPGA設(shè)計(jì)的兩種基本電路結(jié)構(gòu)形式。

的核心電路是由組合邏輯電路構(gòu)成的,比如異步的SRAM、FIFO的讀寫控制信號(hào),地址譯碼電路等。這類電路的輸出信號(hào)不依賴于任何時(shí)鐘信號(hào)。異步電路最大缺陷就是會(huì)產(chǎn)生毛刺。

的核心電路是由各種觸發(fā)器構(gòu)成的。這類電路的任何輸出都是在某個(gè)時(shí)鐘的邊沿驅(qū)動(dòng)觸發(fā)器產(chǎn)生的。所以,可以很好地避免毛刺的產(chǎn)生。

在專用芯片(ASIC)的設(shè)計(jì)過程中,同步設(shè)計(jì)一般會(huì)比占用更多的資源。但是在FPGA設(shè)計(jì)過程中并不是這樣。FPGA內(nèi)部的最小單元是LE,每個(gè)LE里面既包括了實(shí)現(xiàn)異步電路需要的查找表資源,也包括了實(shí)現(xiàn)同步電路需要的寄存器資源。

如圖9.4所示是Altera公司的Cyclone系列FPGA的LE結(jié)構(gòu)圖。從圖中可以看出,這個(gè)LE中包含了輸入輸出的MUX,同步和異步的控制邏輯,LUT以及可編程寄存器。如果使用這個(gè)系列的FPGA(其他的FPGA類似)進(jìn)行同步電路或異步電路的設(shè)計(jì),那么不管使用的是LE中的LUT還是寄存器,綜合工具綜合的結(jié)果都是消耗一個(gè)LE。

圖9.4CycloneLE結(jié)構(gòu)圖

因此,單純的使用異步電路也并不會(huì)節(jié)省觸發(fā)器的資源。或者說,使用同步設(shè)計(jì)電路,并不會(huì)帶來FPGA資源的浪費(fèi)。但是全同步的設(shè)計(jì)對(duì)于FPGA的仿真驗(yàn)證是有好處的。因?yàn)殡娐返乃袆?dòng)作都是在相同的時(shí)鐘邊沿來觸發(fā),可以減少整個(gè)設(shè)計(jì)的延遲,提高系統(tǒng)的工作頻率。



評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉