新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計應(yīng)用 > 一種高性能32位移位寄存器單元的設(shè)計

一種高性能32位移位寄存器單元的設(shè)計

作者: 時間:2016-12-02 來源:網(wǎng)絡(luò) 收藏


3.1.2 樹狀結(jié)構(gòu)(Tree Style)移位器

這種結(jié)構(gòu)M位移位器所需的級數(shù)是log 2M每一級都由兩根信號線(shn和sh n#)控制數(shù)據(jù)的傳輸,數(shù)據(jù)在第i級要么移動2 i位或者不移動。 樹狀移位器如圖3所示。

本文引用地址:http://butianyuan.cn/article/201612/324813.htm

這種結(jié)構(gòu)的優(yōu)點是:(1)晶體管數(shù)目少, n位移器所需晶體管數(shù)目為2×n×log n(傳輸門部分采用CMOS實現(xiàn)),版圖面積小于矩陣移位器;(2)控制信號shN~sh0本身就是二進(jìn)制表示,不需要額外的譯碼單元。缺點是:數(shù)據(jù)通路所需經(jīng)過的開關(guān)管數(shù)目太多,M位移位器所需的級數(shù)是log 2M,因此導(dǎo)致延時太大。

3.2 矩陣-樹狀結(jié)構(gòu)移位器

由上面的分析我們可以看出,如果所設(shè)計的處理器為16位以下CPU,那其移位器不管采用上述哪種方案都能達(dá)到要求,但當(dāng)數(shù)據(jù)寬度到32位以上,從功耗,速度及版圖面積考慮以上方案的固有缺點就會顯得非常突出。在本設(shè)計中,移位寄存器的實際輸入為64位,為結(jié)合矩陣結(jié)構(gòu)的優(yōu)點(速度快、版圖規(guī)整)和樹狀結(jié)構(gòu)的優(yōu)點(晶體管數(shù)目少、譯碼簡單),我們在設(shè)計中采用矩陣-樹狀結(jié)構(gòu)整個移位寄存器的是由雙總線輸入,即輸入64位,表1中列舉了不同級別比例的矩陣-樹狀結(jié)構(gòu)所需晶體管數(shù)目(n1為tree的級數(shù),n2為matrix的控制線,n3為matrix中用的晶體管數(shù)目)。經(jīng)過綜合考慮,我們采用第2行的矩陣-樹狀級別比例,即矩陣部分最大能實現(xiàn)8位移位,樹狀部分最大能實現(xiàn)4位移位。


經(jīng)過各方面綜合考慮,我們所設(shè)計的移位寄存器的前級為矩陣結(jié)構(gòu)部分(輸入數(shù)據(jù)為64位,控制信號8位),由這一部分形成一36位的數(shù)據(jù)送入下一級樹狀結(jié)構(gòu)(輸入數(shù)據(jù)為36位,控制信號2位)部分再完成剩余的4位移位,形成32位輸出數(shù)據(jù)。結(jié)構(gòu)簡圖如圖4所示。


在這個結(jié)構(gòu)中,后級的樹狀移位器最高實現(xiàn)3 位移位。輸入的2bit信號為2進(jìn)制碼,這兩位由移位計數(shù)器sh4~sh0直接將最低兩位送入(在后一節(jié)將介紹)。前級的矩陣結(jié)構(gòu)完成64位輸入36位輸出,我們設(shè)64位數(shù)據(jù)輸入由Abus,Bbus提供,如圖5所示。每一小格代表4位數(shù)據(jù)。這64位數(shù)據(jù)送入矩陣移位器后,根據(jù)計數(shù)器的高三位sh4~sh2 進(jìn)行譯碼對其進(jìn)行4,8,12,16,20,24,28,32中的一種移位(對應(yīng)8bits中的一位為高)。形成36位的數(shù)據(jù)輸出送入下級樹狀移位器以完成剩余位數(shù)的移位。36位數(shù)據(jù)輸出格式如圖6所示。其中COUNT表示總共移位數(shù)。


4 指令的預(yù)處理及移位類指令的實現(xiàn)

在我們設(shè)計的這片CPU中,需要對INTEL的 X86系列移位類指令進(jìn)行兼容。因此移位寄存器單元需要在周圍譯碼和鎖存單元的配合下,要能在一個指令節(jié)拍內(nèi)實現(xiàn)ROL,ROR,RCL,RCR, SHL,SHR,SAR,其中RCL,RCR實現(xiàn)了帶標(biāo)志位C的移位(指令說明見文獻(xiàn)[4])。因此需由處理器的控制單元在每類移位指令移位之前進(jìn)行指令的預(yù)處理。


關(guān)鍵詞: 32位高性能移位寄存

評論


技術(shù)專區(qū)

關(guān)閉