FPGA系統(tǒng)設(shè)計(jì)原則和技巧之：FPGA系統(tǒng)設(shè)計(jì)的3個(gè)基本原則

作者：時(shí)間：2017-06-05 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

本文引用地址：http://www.butianyuan.cn/article/201706/348811.htm

9.1FPGA系統(tǒng)設(shè)計(jì)的3個(gè)基本原則

9.1.1面積與速度的平衡互換原則

在FPGA設(shè)計(jì)領(lǐng)域，面積通常指的是FPGA的芯片資源，包括邏輯資源和I/O資源等。速度一般指的是FPGA工作的最高頻率。和DSP或者ARM芯片不同，F(xiàn)PGA設(shè)計(jì)的工作頻率不是固定的，而是和設(shè)計(jì)本身的延遲緊密相聯(lián)。

在實(shí)際設(shè)計(jì)中，使用最小的面積設(shè)計(jì)出最高的速度當(dāng)然是每一個(gè)開發(fā)者追求的目標(biāo)。但往往面積和速度是不可兼得的。想使用最低的成本設(shè)計(jì)出最高性能的產(chǎn)品是不現(xiàn)實(shí)的，只有兼顧面積和速度，在成本和性能之間有所取舍，才能夠達(dá)到設(shè)計(jì)者的產(chǎn)品需求。

1．速度換面積

速度優(yōu)勢(shì)可以換取面積的節(jié)約。面積越小，就意味可以用更低的成本來實(shí)現(xiàn)產(chǎn)品的功能。

所謂的速度優(yōu)勢(shì)指的是在整個(gè)FPGA設(shè)計(jì)中，有一部分模塊的算法運(yùn)行周期較其他部分快很多，這部分模塊就相對(duì)與其他的部分具有速度優(yōu)勢(shì)。利用這部分模塊的速度優(yōu)勢(shì)來降低整個(gè)FPGA設(shè)計(jì)的使用資源就是速度換面積原則的體現(xiàn)。

速度換面積原則在一些較復(fù)雜的算法設(shè)計(jì)中常常會(huì)用到。在這些算法設(shè)計(jì)中，流水線設(shè)計(jì)常常是必須用到的技術(shù)。在流水線的每一級(jí)，常常有同一個(gè)算法被重復(fù)的使用，但是使用的次數(shù)不一樣的現(xiàn)象。在正常的設(shè)計(jì)中，這些被重復(fù)使用但是使用次數(shù)不同的模塊將會(huì)占用大量的FPGA資源。

隨著FPGA技術(shù)的不斷發(fā)展，F(xiàn)PGA內(nèi)部越來越多的內(nèi)嵌了DSP乘法模塊，為一些常用算法的實(shí)現(xiàn)提供了很大的方便，也大大提高了運(yùn)算的速度和能力。因此，在以往設(shè)計(jì)中那些被重復(fù)使用的算法模塊的速度可以很高，即相對(duì)其他部分具有速度優(yōu)勢(shì)。

利用這個(gè)特點(diǎn)，重新對(duì)FPGA的設(shè)計(jì)進(jìn)行改造。將被重復(fù)使用的算法模塊提煉出最小的復(fù)用單元，并利用這個(gè)最小的高速單元代替原設(shè)計(jì)中被重復(fù)使用但次數(shù)不同的模塊。當(dāng)然在改造的時(shí)候必然會(huì)增加一些其他的資源來實(shí)現(xiàn)這個(gè)代替的過程。但是只要速度具有優(yōu)勢(shì)，那么增加的這部分邏輯依然能夠?qū)崿F(xiàn)降低面積、提高速度的目的。

如圖9.1所示，是一個(gè)流水線的n個(gè)步驟，每個(gè)步驟都相應(yīng)地運(yùn)算一定次數(shù)的算法，每個(gè)步驟的算法都占用獨(dú)立的資源實(shí)現(xiàn)。其中運(yùn)算次數(shù)方框的大小表示占用的設(shè)計(jì)資源。

圖9.1未使用速度換面積的流水線算法

假設(shè)這些算法中有可以復(fù)用的基本單元，并且具有速度優(yōu)勢(shì)，那么就可以使用如圖9.2所示的方式實(shí)現(xiàn)面積的節(jié)省。在這種方法中，通過將算法提取出最小單元，配合算法次數(shù)計(jì)數(shù)器及流水線的輸入輸出選擇開關(guān)，即可實(shí)現(xiàn)將原設(shè)計(jì)中復(fù)雜的算法結(jié)構(gòu)簡化的目的。

圖9.2使用速度換面積的流水線算法

可以看到，速度換面積的關(guān)鍵是高速基本單元的復(fù)用。

2．面積換速度

面積換速度正好和速度換面積相反。在這種方法中，面積的復(fù)制可以換取速度的提高。支持的速度越高，就意味著可以實(shí)現(xiàn)更高的產(chǎn)品性能。在某些應(yīng)用領(lǐng)域，比如軍事、航天等，往往關(guān)注的是產(chǎn)品的性能，而不是成本。這些產(chǎn)品中，可以采用并行處理技術(shù)，實(shí)現(xiàn)面積換速度。

如圖9.3所示是利用并行技術(shù)、面積（資源）復(fù)制的方法實(shí)現(xiàn)了高速的處理能力。

在進(jìn)行FPGA進(jìn)行設(shè)計(jì)時(shí)，我們必須注意到，F(xiàn)PGA的工作頻率是有限的。因?yàn)镕PGA是工作在TTL電平下，該電平結(jié)構(gòu)（晶體管-晶體管）所能支持的切換頻率是有限的。但是在實(shí)際的產(chǎn)品設(shè)計(jì)中，高頻的處理需求越來越多，如何解決這個(gè)矛盾？

首先使用簡單的串/并轉(zhuǎn)換實(shí)現(xiàn)多路的速度降頻，如圖9.3所示，450Mbit/s的頻率分為3路，每路150Mbit/s；其次在每一路上使用相同算法但各占設(shè)計(jì)資源的處理模塊進(jìn)行低頻（相對(duì)）的處理；最后再將每一路的處理結(jié)果進(jìn)行并/串轉(zhuǎn)換成為高頻的輸出數(shù)據(jù)。

圖9.3面積換速度實(shí)現(xiàn)并行高速處理

串/并和并/串轉(zhuǎn)換能夠支持那么高的頻率嗎？這個(gè)問題的解決得益于FPGA技術(shù)的發(fā)展。如今主流的FPGA器件中，都帶有高速的I/O資源及內(nèi)部RAM供用戶使用。這些高速I/O資源及內(nèi)部RAM能夠?qū)崿F(xiàn)I/O接口的穩(wěn)定高速切換和數(shù)據(jù)總線寬度的轉(zhuǎn)換。這部分的詳細(xì)介紹參見9.3節(jié)。

9.1.2硬件可實(shí)現(xiàn)原則

FPGA設(shè)計(jì)通常會(huì)采用HDL語言，比如VerilogHDL或者VHDL。當(dāng)采用HDL語言來描述一個(gè)硬件電路功能的時(shí)候，一定要保證代碼描述的電路是硬件可實(shí)現(xiàn)的。VerilogHDL語言的語法與C語言很相似，但是它們之間有本質(zhì)的區(qū)別。

C語言是基于過程的高級(jí)語言，編譯后可以在CPU上運(yùn)行。而VerilogHDL語言描述的本身就是硬件結(jié)構(gòu)，編譯后是硬件電路。因此，有些語句在C語言的環(huán)境中應(yīng)用沒有問題，但是在HDL語言環(huán)境下就會(huì)導(dǎo)致結(jié)果不正確或者不理想。

比如for語句，以下代碼在C語言下是一段普通代碼：

for（i=0;i16;i++）

DoSomething(); //實(shí)現(xiàn)函數(shù)的重復(fù)調(diào)用

在C語言下運(yùn)行沒有任何問題，但是在VerilogHDL的環(huán)境下編譯就會(huì)導(dǎo)致綜合后的資源嚴(yán)重浪費(fèi)。所以for語句在VerilogHDL環(huán)境下一般只用來做仿真或者行為級(jí)的描述。那么for語句在HDL語言中如何實(shí)現(xiàn)呢？有幾種不同的模式，其中最常見的是以下方式。

reg[3:0]counter; //調(diào)用次數(shù)計(jì)數(shù)器

always@(posedgeclk) //計(jì)數(shù)器計(jì)數(shù)模塊

if(syn_rst)

counter=4’b0;

else

counter=counter+1;

always@(posedgeclk) begin //使用case語句實(shí)現(xiàn)分支調(diào)用，

case(counter) //配合計(jì)數(shù)器計(jì)數(shù)，各分支可使用同樣的執(zhí)行語句

4’b000: DoSomething; //實(shí)現(xiàn)該語句的重復(fù)調(diào)用

4’b0001:DoSomething; //等同于高級(jí)語言中的for語句

……

default:DoSomething;

endcase

end

在counter計(jì)數(shù)器的不同狀態(tài)可以設(shè)計(jì)不同的動(dòng)作。如果都是完成一樣的操作，就是循環(huán)for語句了。

9.1.3同步設(shè)計(jì)原則

同步電路和異步電路是FPGA設(shè)計(jì)的兩種基本電路結(jié)構(gòu)形式。

異步設(shè)計(jì)的核心電路是由組合邏輯電路構(gòu)成的，比如異步的SRAM、FIFO的讀寫控制信號(hào)，地址譯碼電路等。這類電路的輸出信號(hào)不依賴于任何時(shí)鐘信號(hào)。異步電路最大缺陷就是會(huì)產(chǎn)生毛刺。

同步設(shè)計(jì)的核心電路是由各種觸發(fā)器構(gòu)成的。這類電路的任何輸出都是在某個(gè)時(shí)鐘的邊沿驅(qū)動(dòng)觸發(fā)器產(chǎn)生的。所以，同步設(shè)計(jì)可以很好地避免毛刺的產(chǎn)生。

在專用芯片（ASIC）的設(shè)計(jì)過程中，同步設(shè)計(jì)一般會(huì)比異步設(shè)計(jì)占用更多的資源。但是在FPGA設(shè)計(jì)過程中并不是這樣。FPGA內(nèi)部的最小單元是LE，每個(gè)LE里面既包括了實(shí)現(xiàn)異步電路需要的查找表資源，也包括了實(shí)現(xiàn)同步電路需要的寄存器資源。

如圖9.4所示是Altera公司的Cyclone系列FPGA的LE結(jié)構(gòu)圖。從圖中可以看出，這個(gè)LE中包含了輸入輸出的MUX，同步和異步的控制邏輯，LUT以及可編程寄存器。如果使用這個(gè)系列的FPGA（其他的FPGA類似）進(jìn)行同步電路或異步電路的設(shè)計(jì)，那么不管使用的是LE中的LUT還是寄存器，綜合工具綜合的結(jié)果都是消耗一個(gè)LE。

圖9.4CycloneLE結(jié)構(gòu)圖

因此，單純的使用異步電路也并不會(huì)節(jié)省觸發(fā)器的資源。或者說，使用同步設(shè)計(jì)電路，并不會(huì)帶來FPGA資源的浪費(fèi)。但是全同步的設(shè)計(jì)對(duì)于FPGA的仿真驗(yàn)證是有好處的。因?yàn)殡娐返乃袆?dòng)作都是在相同的時(shí)鐘邊沿來觸發(fā)，可以減少整個(gè)設(shè)計(jì)的延遲，提高系統(tǒng)的工作頻率。

新聞中心