高速數(shù)字串行加法器及其應用

——

作者：時間：2007-02-06 來源：電子技術(shù)應用

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

高速數(shù)字串行加法器及其應用
深圳南山區(qū)科技園中興通訊IC開發(fā)一部(518057)　鐘信潮
上海盛立亞光網(wǎng)絡系統(tǒng)有限公司　薛小剛
深圳南山區(qū)科技園中興通訊3G開發(fā)(518057)　王誠

　　摘　要：與傳統(tǒng)加法器相比，數(shù)字串行加法器具有工作頻率高、占用資源少、設計靈活等優(yōu)點。介紹了數(shù)字串行加法器的原理，說明了該加法器在FPGA上的實現(xiàn)要點及其在匹配濾波器設計中的應用。
　　關鍵詞：加法器　位并行　數(shù)字串行　FPGA　匹配濾波器

　　與傳統(tǒng)DSP相比，定制DSP具有速度更高、設計靈活、易于更改等優(yōu)點，常常應用于設計方案和關鍵算法的驗證。

　　在DSP運算中，加法是最常用的。常見的加法器是位并行的(Bit-parallel)，在一個時鐘周期內(nèi)完成加法運算。其速度較高，占用的資源較多。但是，在很多應用中，并不需要這么高的速度，而且希望減小資源消耗。這時可以采用數(shù)字串行(Digit-serial)加法器，利用多個時鐘周期完成一個完整的加法運算，從而使占用的資源大幅度減少。為了使數(shù)字串行加法器具有更廣泛的應用范圍，設計的關鍵是要使電路達到盡可能高的工作頻率，以取得高的數(shù)據(jù)吞吐量(Throughput)，從而滿足系統(tǒng)其它部分的速度要求。

　　1 數(shù)字串行加法器

　　　在數(shù)字串行加法器中，字長為W的操作數(shù)被分為P個位寬為N(N能被W整除，P=W/N)的數(shù)字，然后從低位開始相加，在P個時鐘內(nèi)完成加法操作。P個時鐘周期稱為一個采樣周期(Sample Period)。

圖1 N=2的數(shù)字串行加法器

　　　 N=2的數(shù)字串行加法器結(jié)構(gòu)如圖1所示。如果輸入操作數(shù)的字長為8，那么串行加法器可以在4個時鐘周期內(nèi)完成加法運算。這個加法器只用了兩個全加器的資源，比一般的8bit行波進位加法器小。

　　　數(shù)字串行加法器的控制也比較簡單，輸入移位寄存器完成并行-串行轉(zhuǎn)換功能，通過移位操作不斷為加法器提供位寬為N的操作數(shù)；Control信號指示了新采樣周期的開始，此時carry清零；輸出移位寄存器完成串行-并行轉(zhuǎn)換，輸出計算結(jié)果。

　　　對于特定的輸入字長，通過選擇不同的N，可以實現(xiàn)速度、面積不同的數(shù)字串行加法器。這樣，設計者可以根據(jù)實際情況加以選擇，提高了設計的靈活性。

　　2 高速數(shù)字串行加法器在FPGA上的實現(xiàn)

　　　由于數(shù)字串行加法器要用P個時鐘周期才能完成整個加法操作，因此其工作頻率必須足夠高。這樣，在FPGA上實現(xiàn)時，如何使串行加法器具有盡量高的工作頻率就將成為關鍵問題。下面以Xilinx公司的VirtexE系列FPGA為例，說明如何設計高速數(shù)字串行加法器。

圖2 2bit全加器連接示意圖

　　　 VirtexE的一個CLB(Configurable Logic Block)包含兩個slice，圖2為在一個slice上實現(xiàn)2bit全加器的連接示意圖(不相關的邏輯已略去)。

　　　數(shù)字串行加法器的結(jié)構(gòu)是行波進位加法器，因此必須盡量減小進位邏輯上的延遲。VirtexE的slice中提供了專用的進位邏輯和布線，充分利用這些資源可以提高加法器的性能。

　　　對VirtexE系列，數(shù)字串行加法器應選用奇數(shù)位寬，這是因為在VirtexE中一個slice包括兩個LUT(查找表)、兩個觸發(fā)器和一些其它的組合邏輯，因此使用一個slice剛好可以實現(xiàn)一個1bit的全加器，使用兩個slice可以實現(xiàn)一個3bit的全加器。如果要實現(xiàn)2bit的全加，則需要一個slice完成2bit的相加和保存，另外還需要一個slice中的一個寄存器用來存儲進位，這樣兩個slice整體的利用率就降低很多。數(shù)據(jù)位寬為2、4、6、8等偶數(shù)時都存在這樣的問題。圖3為N=3時加法器的布局布線示意圖。由于專用的進位鏈布線資源僅存在于縱向的兩個slice之間，所以在實現(xiàn)3bit加法器時，使用縱向相鄰的兩個slice。

圖3 N=3時數(shù)字串行加法器布局布線圖

　　　加法器的關鍵路徑在進位鏈上，其延時為：

　　　式中，TCKO為DFF的CLK到XQ/YQ的延時，TBXCY為BX到COUT的延時，TCKCY為CIN到DFF的建立時間。這些延時的數(shù)值可以從手冊[1]演獲得。連線延時包括＄Net_Carry_reg和＄Net_Carry_out的延時。前者是進位鏈，延時為0；后者為普通連線，延時約為0.47ns。因此，總延時約為3.31ns，即工作頻率約為 300MHz。

　　　為了減小延時、提高工作頻率，使用FPGA Editor對布局布線進行精確控制，并把加法器做成硬宏，有利于保證多次實例化時的性能?，F(xiàn)將使用宏完成的設計和使用HDL語言完成的設計在工作頻率上做一個比較。使用Virtex50E-6pq240器件、xst綜合器時，用宏完成的3bit數(shù)字串行加法器的最高工作頻率為300MHz，而用HDL完成的相同設計的最高工作頻率只有186MHz。這是由于設計用HDL輸入時，布局布線工具用了3個slice，第一個slice完成2bit全加器，第二個slice完成1bit全加器，第三個slice只用了內(nèi)部的一個觸發(fā)器來存儲進位，第一、二個slice之間用進位鏈連接，延時為0，但是第二、三個slice之間只能使用普通連線，而且第三個slice的輸入CIN到觸發(fā)器的建立時間較大，因而影響了串行加法器的運行速度。

　　3 數(shù)字串行加法器的應用

　　　數(shù)字串行加法器可以代替?zhèn)鹘y(tǒng)加法器用在濾波器、乘法器、累加器等電路的設計中，能大大減小資源占用。下面以在CDMA/WCDMA系統(tǒng)中廣泛應用的匹配濾波器為例說明數(shù)字串行加法器的應用。

　　　匹配濾波器是一種無源相關技術(shù)，它可以快速實現(xiàn)相關器的功能。匹配濾波器的沖激響應為：

　　　可知濾波輸出R(t-T)是輸入信號的自相關函數(shù)。

　　　在CDMA、WCDMA等系統(tǒng)中，匹配濾波使用本地碼系列來匹配輸入到接收機的采樣數(shù)據(jù)。在濾波器中，本地碼序列與接收數(shù)據(jù)進行相乘、求和操作，得到相關值，相關值越大說明相關程度越高。其工作過程如圖4所示。匹配濾波器可以使用移位寄存器和加法器來實現(xiàn)，結(jié)構(gòu)如圖5所示，其中，濾波器的系數(shù)因子h(n)為本地碼序列，輸入x(n)為接收數(shù)據(jù)，數(shù)據(jù)每移位一次，濾波器計算一次輸出結(jié)果。當移動到兩個序列相位對齊時，就產(chǎn)生一個相關峰值輸出。

　　　系統(tǒng)對匹配濾波的設計要求是：匹配長度為256，輸入四路數(shù)據(jù)，每一路經(jīng)過7bit量化、速率為7.68MHz，即濾波器的處理速度為4

新聞中心

高速數(shù)字串行加法器及其應用

評論

相關推薦

技術(shù)專區(qū)