新一代數(shù)字信號處理器TMS320C55X

作者：時間：2006-05-07 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

摘要：TMS320C55X是美國德州儀器公司生產(chǎn)的一種低功耗高性能數(shù)字信號處理器，它的每個MIPS功耗只需0.05mW，因而可使網(wǎng)絡(luò)音頻播放器在兩節(jié)AA電池作電源時工作200小時。文中介紹了TMS320C55X的主要特性，并詳細(xì)分析了TMS320C55X的CPU結(jié)構(gòu)。

本文引用地址：http://butianyuan.cn/article/242284.htm

關(guān)鍵詞：數(shù)字信號處理器低功耗 CPU結(jié)構(gòu) TMS320C55X

1 概述

TMS320C55X是德州儀器公司（TI）數(shù)字信號處理器產(chǎn)品TMS320CC5000系列中最新的一種。它極大地降低了功耗，每個MIPS只需要0.05mW，與目前市場上的主流產(chǎn)品TMS320C54X相比，TMS320C55X的功耗降低了6倍。由于TMS320C5000系列具有可編程、低功耗特性，全世界有70%的移動電話使用了這個系列的元件，而TMS320C55X則通過其強(qiáng)大的電源管理功能使省電特性進(jìn)一步增強(qiáng)。例如，TMS320C55X可使網(wǎng)絡(luò)音頻播放器用兩節(jié)AA電池工作200個小時，是目前播放器的10倍；而且它還可以支持所有的INTERNET音頻標(biāo)準(zhǔn)。芯片中的可編程內(nèi)核與現(xiàn)行主流TMS320C54X軟件相兼容。

TMS320C55X可廣泛應(yīng)用個人無線通信系統(tǒng)，個人醫(yī)療設(shè)備（助聽器、內(nèi)耳植入器等）、數(shù)字相機(jī)、INTERNET音頻系統(tǒng)以及數(shù)字音樂隨射播放器等。

一般來說，TMS320C55X主要針對個人消費(fèi)及通信市場，對執(zhí)行諸如語音解碼和碥碼調(diào)制解調(diào)、圖像壓縮及解壓、語音識別及語音合成等方面所用到的數(shù)字信號處理算法是十分有效的。

2 主要特性

TMS320C55X具有以下特性：

●1個32×16位的指令緩沖隊列；

●2個17×17位的乘積并累加單元（multiply-and-accumulate unit,MAC）；

●1個40位的算術(shù)邏輯單元（ALU）；

●1個40位的移位器（Shifter）；

●1個16位算術(shù)邏輯單元（ALU）；

●4個40位的累加器（accumulate）；

●12組獨(dú)立總線。其中包括：3組數(shù)據(jù)讀總線、2組數(shù)據(jù)寫總線、5組數(shù)據(jù)地總線、1組等程序讀總線和1組程序?qū)懣偩€。

3 TMS320C55X的CPU結(jié)構(gòu)

TMS320C55X的中央處理單元（CPU）內(nèi)部結(jié)構(gòu)由四部分組成（如圖1）。它們分別是：指令緩沖單元，程序流程單元，地址數(shù)據(jù)流程單元，數(shù)據(jù)處理單元。下面對各個單元進(jìn)行簡要地介紹。

3.1 TMS320C55X的總線結(jié)構(gòu)

TMS320C55X采用增強(qiáng)型哈佛結(jié)構(gòu)，程序存儲器和數(shù)據(jù)存儲器具有各自的總線結(jié)構(gòu)，在CPU內(nèi)部共有12組總線。下面對這12組總線分別進(jìn)行介紹：

●數(shù)據(jù)讀數(shù)據(jù)總線：

該總線共3組，分別是BB、CB和DB，每組均為16位。數(shù)據(jù)讀數(shù)據(jù)總線的功能是將16位的數(shù)據(jù)從數(shù)據(jù)空間或I/O空間送入CPU的功能單元（如MAC單元）。其中，BB總線只能把數(shù)據(jù)送入數(shù)據(jù)處理單元（D單元），它的主要功能是聯(lián)結(jié)存儲器和數(shù)據(jù)處理單元中的兩個乘積并累加單元（MAC）。TMS320C55X指令集中有一些專門的指令使編程人員能夠使用BB，CB和DB在同一時刻讀取3個操作數(shù)。CB和DB總線上的數(shù)據(jù)可以送入程序流程單元（P單元）、數(shù)據(jù)處理單元（D單元）和地址數(shù)據(jù)流程單元（A單元）。指令如果同時讀取兩個操作數(shù)，則CB和DB同時被使用，而在只讀取一個操作數(shù)時僅使用DB總線。

●數(shù)據(jù)讀地址總線：

數(shù)據(jù)讀地睛總線亦有3組，分別是BAB、CAB和DAB，每組均為24位。這三組數(shù)據(jù)總線將24位地址送入存儲器接口單元（Memory Interface Unit），由存儲器接口單元先中CPU所需的數(shù)據(jù)。三組數(shù)據(jù)讀地址總線上的地址信息是由CPU中的地址數(shù)據(jù)流程單元（A單元）產(chǎn)生的。BAB總線上的數(shù)據(jù)為數(shù)據(jù)讀數(shù)據(jù)總線中的BB總線送入CPU的數(shù)據(jù)的地址。CAB總線上的數(shù)據(jù)數(shù)據(jù)讀數(shù)據(jù)總線CB總線送入CPU的數(shù)據(jù)的地址。而DAB總線上的數(shù)據(jù)是由數(shù)據(jù)讀數(shù)據(jù)總線DB總線或者是由DB和CB總線送入CPU的數(shù)據(jù)的地址。

●程序讀數(shù)據(jù)總線：

該總線是一組32位總線，功能是將4字節(jié)的程序代碼送入指令緩沖單元（I單元），并在指令緩沖單元中對指令進(jìn)行解碼。

●程序讀地址總線：

程序讀地址總線是一組24位總線。該總線上的數(shù)據(jù)是由PB總線傳磅到CPU的程序代碼的地址。

●數(shù)據(jù)寫數(shù)據(jù)總線：

該總線有兩組，分別為EB和FB，每一組總線為16位。數(shù)據(jù)寫數(shù)據(jù)總線的功能是將CPU內(nèi)部器件（如MAC單元）的數(shù)據(jù)寫入存儲器空間或I/O空間。

●數(shù)據(jù)寫地址總線：

該總線共兩組，分別是EAB和FAB，每組總線均為24位。數(shù)據(jù)寫地址總線上的數(shù)據(jù)是由數(shù)據(jù)寫數(shù)據(jù)總線送入CPU的數(shù)據(jù)的地址。

可以看出，TMS320C55X不僅程序空間和數(shù)據(jù)空間是不分開的，而且數(shù)據(jù)的讀和寫都有各自分開的地址總線，這種并行結(jié)構(gòu)允許CPU在一個周期內(nèi)進(jìn)行讀和寫，因而提高了CPU的處理速度。

3.2 指令緩沖單元

指令緩沖單元（I單元）的主要功能是將指令流從存儲器中取出并送入CPU。在每一個CPU周期，指令緩沖單元從32位的程序讀數(shù)據(jù)總線取出4個字節(jié)的程序代碼，同時將已經(jīng)接收并存入在指令緩沖隊列前端的最多6個字節(jié)程序代碼送入指令解碼控制器中進(jìn)行解碼（見圖2）。指令解碼控制器將解碼信息送入P單元（程序流程單元）、A單元（地址數(shù)據(jù)流程單元）和D單元（數(shù)據(jù)處理單元）。

在每一個流水線的預(yù)取階段，TMS320C55X的CPU從程序存儲器中取出32位的程序代碼并將其存放在指令緩沖隊列中。當(dāng)CPU準(zhǔn)備好對指令進(jìn)行解碼時，從指令緩沖隊列中取出最多可有6個字節(jié)的代碼送入指令解碼控制器。指令緩沖隊列中最多可以存放64字節(jié)的代碼，這可以使CPU保持連續(xù)的程序流程，提高處理速度。在執(zhí)行位于指令緩沖隊列中的重復(fù)指令或循環(huán)指令代碼時，CPU不僅處理速度快，而且功耗低，因?yàn)楸粓?zhí)行的代碼存放在指令緩沖隊列中時，CPU執(zhí)行諸如loop的循環(huán)指令無需訪問存儲器，而訪問存儲器是需要消耗時間和能量的。在流水線的解碼階段，指令解碼器一次從指令緩沖隊列接受最多6個字節(jié)的程序代碼并對其進(jìn)行解碼。指令緩沖單元的操作并不是動態(tài)的，也就是說：指令緩沖單元中的指令代碼是按其進(jìn)入指令緩沖隊列的順序依次被解碼。其優(yōu)點(diǎn)是程序執(zhí)行時間可以預(yù)先知道，這對實(shí)時嵌入式系統(tǒng)的設(shè)計是十分重要的。

TMS320C55X的指令組的編碼是可變長的，指令長度可從1個字節(jié)到6個字節(jié)。與所有指令的編碼長度都相同的編碼方式不同，TMS320C55X指令中的一些簡單指令編碼后的長度要小于復(fù)雜指令編碼后的長度。指令編碼后的長度有8位、16位、24位、32位、40位和48位6種。這種編碼方式可以產(chǎn)生高密度的程序代碼，同時可以充分利用程序存儲空間。

3.3 程序流程單元

程序流程單元（P單元）用于控制指令執(zhí)行的次序、它內(nèi)部的程序地址發(fā)生器能產(chǎn)生從程序存儲器中取指令的地址。該單元還包括管理程序流水線的邏輯，4個狀態(tài)寄存器可以控制和監(jiān)視CPU的各個特性。圖3所示為程序流程單元的框圖。

在程序流程單元中，程序地址發(fā)生器可以產(chǎn)生24位的地址。因?yàn)槌绦蛄鞒虇卧С肿止?jié)尋址方式，所以代碼存放在存儲器中無需進(jìn)行對齊操作。24位的地址總線使TMS320C55X的尋址空間達(dá)到16M字節(jié)。程序流程單元還控制著分支、調(diào)用、重復(fù)和中斷等。

程序流程單元為提高指令執(zhí)行效率進(jìn)行了優(yōu)化。舉例來說：其內(nèi)部的程序地址發(fā)生器完全獨(dú)立于CPU中的其它任何部分，這樣，條件分支的條件就能在流水線的早期進(jìn)行測試并計算出分支的目標(biāo)地址以減小分支延遲；這種并行性也使在流水線中執(zhí)行數(shù)據(jù)處理的同時處理程序控制指令。程序流程單元的另一個特點(diǎn)是具有一個分開的程序計數(shù)器，該程序計數(shù)器可以使子程序或中斷服務(wù)程序快速返回。

程序流程單元提供的循環(huán)（loop）功能包括重復(fù)執(zhí)行一個指令或一組指令。它還在硬件上支持條件重復(fù)。程序流程單元的主要優(yōu)點(diǎn)是其內(nèi)部具有一個專門的邏輯以保護(hù)流水線。除了對付控制冒險（control hazards）程序流程單元還對讀后寫數(shù)據(jù)冒險和寫后讀數(shù)據(jù)冒險提供完全的保護(hù)。當(dāng)這些冒險（hazard）出現(xiàn)在TMS320C55X的指令流中時，流水線保護(hù)邏輯會自動加入周期以保持操作順序并對程序進(jìn)行修正。

3.4 地址數(shù)據(jù)流程單元

地址數(shù)據(jù)流程單元（A單元）用于產(chǎn)生對數(shù)據(jù)空間進(jìn)行讀寫操作所需的地址。該單元包括所有產(chǎn)生兩組數(shù)據(jù)寫地址總線和三組數(shù)據(jù)讀地址線上的地址所需的邏輯單元和寄存器。此外，在地址數(shù)據(jù)流程單元中，還有一個16位的算術(shù)邏輯單元（ALU），圖4是地址數(shù)據(jù)流程的框圖。

在數(shù)據(jù)計算單元處理復(fù)雜操作時，16位的算術(shù)邏輯單元（ALU）可以并行地進(jìn)行一些簡單的運(yùn)算。它從指令緩沖單元接收立即數(shù)，并與數(shù)據(jù)計算單元的寄存器、存儲器、地址數(shù)據(jù)流程單元和程序流程單元進(jìn)行雙向通信。在地址數(shù)據(jù)流程單元，該ALU可以控制4個通用的臨時寄存器和任何一個地址寄存器。4個通用的寄存器可以提高編譯時的效率并減少對存儲器的訪問。除了通用的算術(shù)邏輯單元，TMS320C55X的其它3個地址寄存器算術(shù)邏輯單元以對進(jìn)行間接尋址的9個寄存器進(jìn)行修改。這3個地址寄存器算術(shù)邏輯單元產(chǎn)生獨(dú)立的地址以作為三組數(shù)據(jù)讀總線的地址。這種并行結(jié)構(gòu)允許兩個16位的操作數(shù)和一個16位的系數(shù)在一個CPU周期內(nèi)同時讀入數(shù)據(jù)計算單元。另外，地址數(shù)據(jù)流程單元還包括一些支持在間接尋址指令中循環(huán)尋址方式的寄存器。

3.5 數(shù)據(jù)計算單元

數(shù)據(jù)計算單元（D單元）是TMS320C55X的CPU的重要部分，DSP應(yīng)用系統(tǒng)的大量數(shù)據(jù)在這個單元進(jìn)行處理。圖5是數(shù)據(jù)計算單元的框圖，從圖中可以看出，三組數(shù)據(jù)讀數(shù)據(jù)總線上的數(shù)據(jù)可用作兩個AMC器件的輸入右40位的算術(shù)邏輯單元的輸入。MAC器件運(yùn)算的結(jié)構(gòu)可以存放在4個40位的累加器中。數(shù)據(jù)計算單元的這種并行性將減少TMS320C55X在執(zhí)行信號處理算法時所需的周期數(shù)。TMS320C55X相對TMS320C54X的性能有很大的提高，其中關(guān)鍵的一些是TMS320C55X采用了并行的雙MAC結(jié)構(gòu)，每一個MAC器件包括一個乘法器和一個專門的加法器，在單周期內(nèi)，每一個MAC單元可以執(zhí)行17×17位的乘法運(yùn)算和一個40位的加法運(yùn)算。MAC單元的輸入是三組數(shù)據(jù)讀數(shù)據(jù)總線上的數(shù)據(jù)，這三組數(shù)據(jù)一般是兩組數(shù)據(jù)流和一組常系數(shù)數(shù)據(jù)流。MAC運(yùn)算結(jié)果可以存放在數(shù)據(jù)計算單元的40位的累加器中。

數(shù)據(jù)計算單元包括一個40位的算術(shù)邏輯單元，這個算術(shù)邏輯單元是與MAC器件完全分開的。它能夠?qū)?0位累加器中的數(shù)據(jù)進(jìn)行算術(shù)或邏輯運(yùn)算。另外的一種工作方式是同時對兩組16位數(shù)據(jù)進(jìn)行算術(shù)運(yùn)算。該算術(shù)邏輯單元的輸入除了數(shù)據(jù)計算單元的累加器外，它還從指令緩沖單元接收立即數(shù)，并且能夠與存儲器、地址數(shù)據(jù)流程單元的寄存器以及程序流程單元的寄存器進(jìn)行雙向通信。

數(shù)據(jù)計算單元中還有一個功能強(qiáng)大的移位器。移位器可將累加器中40位的數(shù)據(jù)向左最多移31位或向右移32位。它從指令緩沖單元接收立即數(shù)并可與程序流程單元和地址數(shù)據(jù)流程單元的寄存器進(jìn)行雙向通信。此外，移位器移位后的值可以作為算術(shù)邏輯單元的輸入以便進(jìn)一步處理。

數(shù)據(jù)計算單元將處理的結(jié)果通過兩組16位的數(shù)據(jù)寫總線寫入存儲器中。這兩組總線與地址數(shù)據(jù)流程單元的地址發(fā)生器結(jié)合在一起，使TMS320C55X可以在一個CPU周期內(nèi)完成兩個16位數(shù)據(jù)寫或一個32位數(shù)據(jù)寫的功能。這種方法可以提高數(shù)字信號處理器CPU的數(shù)據(jù)天吞吐量，因而對實(shí)時性要求高的場合是十分必要的。

4 結(jié)束語

TMS320C55X具有性能高，功耗低和完善的軟件開發(fā)支持等特點(diǎn)，它的內(nèi)核與TI公司現(xiàn)有的DSP完全兼容，同時，TI公司還提供集成的開發(fā)環(huán)境eXpress DSP實(shí)時軟件技術(shù)，該技術(shù)包括所有必要的工上和軟件，支持新推出的TMS320C55X內(nèi)核，能使用戶較快地開發(fā)新的產(chǎn)品。

新聞中心

新一代數(shù)字信號處理器TMS320C55X

評論

相關(guān)推薦

技術(shù)專區(qū)