新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設計應用 > 新一代數(shù)字信號處理器TMS320C55X

新一代數(shù)字信號處理器TMS320C55X

作者: 時間:2006-05-07 來源:網絡 收藏

摘要:TMS320C55X是美國德州儀器公司生產的一種低功耗高性能器,它的每個MIPS功耗只需0.05mW,因而可使網絡音頻播放器在兩節(jié)AA電池作電源時工作200小時。文中介紹了TMS320C55X的主要特性,并詳細分析了TMS320C55X的CPU結構。

本文引用地址:http://butianyuan.cn/article/242284.htm

關鍵詞:器 低功耗 CPU結構 TMS320C55X

1 概述

TMS320C55X是德州儀器公司(TI)器產品TMS320CC5000系列中最新的一種。它極大地降低了功耗,每個MIPS只需要0.05mW,與目前市場上的主流產品TMS320C54X相比,TMS320C55X的功耗降低了6倍。由于TMS320C5000系列具有可編程、低功耗特性,全世界有70%的移動電話使用了這個系列的元件,而TMS320C55X則通過其強大的電源管理功能使省電特性進一步增強。例如,TMS320C55X可使網絡音頻播放器用兩節(jié)AA電池工作200個小時,是目前播放器的10倍;而且它還可以支持所有的INTERNET音頻標準。芯片中的可編程內核與現(xiàn)行主流TMS320C54X軟件相兼容。

TMS320C55X可廣泛應用個人無線通信系統(tǒng),個人醫(yī)療設備(助聽器、內耳植入器等)、數(shù)字相機、INTERNET音頻系統(tǒng)以及數(shù)字音樂隨射播放器等。

一般來說,TMS320C55X主要針對個人消費及通信市場,對執(zhí)行諸如語音解碼和碥碼調制解調、圖像壓縮及解壓、語音識別及語音合成等方面所用到的數(shù)字信號處理算法是十分有效的。

2 主要特性

TMS320C55X具有以下特性:

●1個32×16位的指令緩沖隊列;

●2個17×17位的乘積并累加單元(multiply-and-accumulate unit,MAC);

●1個40位的算術邏輯單元(ALU);

●1個40位的移位器(Shifter);

●1個16位算術邏輯單元(ALU);

●4個40位的累加器(accumulate);

●12組獨立總線。其中包括:3組數(shù)據(jù)讀總線、2組數(shù)據(jù)寫總線、5組數(shù)據(jù)地總線、1組等程序讀總線和1組程序寫總線。

3 TMS320C55X的CPU結構

TMS320C55X的中央處理單元(CPU)內部結構由四部分組成(如圖1)。它們分別是:指令緩沖單元,程序流程單元,地址數(shù)據(jù)流程單元,數(shù)據(jù)處理單元。下面對各個單元進行簡要地介紹。

3.1 TMS320C55X的總線結構

TMS320C55X采用增強型哈佛結構,程序存儲器和數(shù)據(jù)存儲器具有各自的總線結構,在CPU內部共有12組總線。下面對這12組總線分別進行介紹:

●數(shù)據(jù)讀數(shù)據(jù)總線:

該總線共3組,分別是BB、CB和DB,每組均為16位。數(shù)據(jù)讀數(shù)據(jù)總線的功能是將16位的數(shù)據(jù)從數(shù)據(jù)空間或I/O空間送入CPU的功能單元(如MAC單元)。其中,BB總線只能把數(shù)據(jù)送入數(shù)據(jù)處理單元(D單元),它的主要功能是聯(lián)結存儲器和數(shù)據(jù)處理單元中的兩個乘積并累加單元(MAC)。TMS320C55X指令集中有一些專門的指令使編程人員能夠使用BB,CB和DB在同一時刻讀取3個操作數(shù)。CB和DB總線上的數(shù)據(jù)可以送入程序流程單元(P單元)、數(shù)據(jù)處理單元(D單元)和地址數(shù)據(jù)流程單元(A單元)。指令如果同時讀取兩個操作數(shù),則CB和DB同時被使用,而在只讀取一個操作數(shù)時僅使用DB總線。

●數(shù)據(jù)讀地址總線:

數(shù)據(jù)讀地睛總線亦有3組,分別是BAB、CAB和DAB,每組均為24位。這三組數(shù)據(jù)總線將24位地址送入存儲器接口單元(Memory Interface Unit),由存儲器接口單元先中CPU所需的數(shù)據(jù)。三組數(shù)據(jù)讀地址總線上的地址信息是由CPU中的地址數(shù)據(jù)流程單元(A單元)產生的。BAB總線上的數(shù)據(jù)為數(shù)據(jù)讀數(shù)據(jù)總線中的BB總線送入CPU的數(shù)據(jù)的地址。CAB總線上的數(shù)據(jù)數(shù)據(jù)讀數(shù)據(jù)總線CB總線送入CPU的數(shù)據(jù)的地址。而DAB總線上的數(shù)據(jù)是由數(shù)據(jù)讀數(shù)據(jù)總線DB總線或者是由DB和CB總線送入CPU的數(shù)據(jù)的地址。

●程序讀數(shù)據(jù)總線:

該總線是一組32位總線,功能是將4字節(jié)的程序代碼送入指令緩沖單元(I單元),并在指令緩沖單元中對指令進行解碼。

●程序讀地址總線:

程序讀地址總線是一組24位總線。該總線上的數(shù)據(jù)是由PB總線傳磅到CPU的程序代碼的地址。

●數(shù)據(jù)寫數(shù)據(jù)總線:

該總線有兩組,分別為EB和FB,每一組總線為16位。數(shù)據(jù)寫數(shù)據(jù)總線的功能是將CPU內部器件(如MAC單元)的數(shù)據(jù)寫入存儲器空間或I/O空間。

●數(shù)據(jù)寫地址總線:

該總線共兩組,分別是EAB和FAB,每組總線均為24位。數(shù)據(jù)寫地址總線上的數(shù)據(jù)是由數(shù)據(jù)寫數(shù)據(jù)總線送入CPU的數(shù)據(jù)的地址。

可以看出,TMS320C55X不僅程序空間和數(shù)據(jù)空間是不分開的,而且數(shù)據(jù)的讀和寫都有各自分開的地址總線,這種并行結構允許CPU在一個周期內進行讀和寫,因而提高了CPU的處理速度。

3.2 指令緩沖單元

指令緩沖單元(I單元)的主要功能是將指令流從存儲器中取出并送入CPU。在每一個CPU周期,指令緩沖單元從32位的程序讀數(shù)據(jù)總線取出4個字節(jié)的程序代碼,同時將已經接收并存入在指令緩沖隊列前端的最多6個字節(jié)程序代碼送入指令解碼控制器中進行解碼(見圖2)。指令解碼控制器將解碼信息送入P單元(程序流程單元)、A單元(地址數(shù)據(jù)流程單元)和D單元(數(shù)據(jù)處理單元)。

在每一個流水線的預取階段,TMS320C55X的CPU從程序存儲器中取出32位的程序代碼并將其存放在指令緩沖隊列中。當CPU準備好對指令進行解碼時,從指令緩沖隊列中取出最多可有6個字節(jié)的代碼送入指令解碼控制器。指令緩沖隊列中最多可以存放64字節(jié)的代碼,這可以使CPU保持連續(xù)的程序流程,提高處理速度。在執(zhí)行位于指令緩沖隊列中的重復指令或循環(huán)指令代碼時,CPU不僅處理速度快,而且功耗低,因為被執(zhí)行的代碼存放在指令緩沖隊列中時,CPU執(zhí)行諸如loop的循環(huán)指令無需訪問存儲器,而訪問存儲器是需要消耗時間和能量的。在流水線的解碼階段,指令解碼器一次從指令緩沖隊列接受最多6個字節(jié)的程序代碼并對其進行解碼。指令緩沖單元的操作并不是動態(tài)的,也就是說:指令緩沖單元中的指令代碼是按其進入指令緩沖隊列的順序依次被解碼。其優(yōu)點是程序執(zhí)行時間可以預先知道,這對實時嵌入式系統(tǒng)的設計是十分重要的。

TMS320C55X的指令組的編碼是可變長的,指令長度可從1個字節(jié)到6個字節(jié)。與所有指令的編碼長度都相同的編碼方式不同,TMS320C55X指令中的一些簡單指令編碼后的長度要小于復雜指令編碼后的長度。指令編碼后的長度有8位、16位、24位、32位、40位和48位6種。這種編碼方式可以產生高密度的程序代碼,同時可以充分利用程序存儲空間。

3.3 程序流程單元

程序流程單元(P單元)用于控制指令執(zhí)行的次序、它內部的程序地址發(fā)生器能產生從程序存儲器中取指令的地址。該單元還包括管理程序流水線的邏輯,4個狀態(tài)寄存器可以控制和監(jiān)視CPU的各個特性。 圖3所示為程序流程單元的框圖。

在程序流程單元中,程序地址發(fā)生器可以產生24位的地址。因為程序流程單元支持字節(jié)尋址方式,所以代碼存放在存儲器中無需進行對齊操作。24位的地址總線使TMS320C55X的尋址空間達到16M字節(jié)。程序流程單元還控制著分支、調用、重復和中斷等。

程序流程單元為提高指令執(zhí)行效率進行了優(yōu)化。舉例來說:其內部的程序地址發(fā)生器完全獨立于CPU中的其它任何部分,這樣,條件分支的條件就能在流水線的早期進行測試并計算出分支的目標地址以減小分支延遲;這種并行性也使在流水線中執(zhí)行數(shù)據(jù)處理的同時處理程序控制指令。程序流程單元的另一個特點是具有一個分開的程序計數(shù)器,該程序計數(shù)器可以使子程序或中斷服務程序快速返回。

程序流程單元提供的循環(huán)(loop)功能包括重復執(zhí)行一個指令或一組指令。它還在硬件上支持條件重復。程序流程單元的主要優(yōu)點是其內部具有一個專門的邏輯以保護流水線。除了對付控制冒險(control hazards)程序流程單元還對讀后寫數(shù)據(jù)冒險和寫后讀數(shù)據(jù)冒險提供完全的保護。當這些冒險(hazard)出現(xiàn)在TMS320C55X的指令流中時,流水線保護邏輯會自動加入周期以保持操作順序并對程序進行修正。

3.4 地址數(shù)據(jù)流程單元

地址數(shù)據(jù)流程單元(A單元)用于產生對數(shù)據(jù)空間進行讀寫操作所需的地址。該單元包括所有產生兩組數(shù)據(jù)寫地址總線和三組數(shù)據(jù)讀地址線上的地址所需的邏輯單元和寄存器。此外,在地址數(shù)據(jù)流程單元中,還有一個16位的算術邏輯單元(ALU),圖4是地址數(shù)據(jù)流程的框圖。

在數(shù)據(jù)計算單元處理復雜操作時,16位的算術邏輯單元(ALU)可以并行地進行一些簡單的運算。它從指令緩沖單元接收立即數(shù),并與數(shù)據(jù)計算單元的寄存器、存儲器、地址數(shù)據(jù)流程單元和程序流程單元進行雙向通信。在地址數(shù)據(jù)流程單元,該ALU可以控制4個通用的臨時寄存器和任何一個地址寄存器。4個通用的寄存器可以提高編譯時的效率并減少對存儲器的訪問。除了通用的算術邏輯單元,TMS320C55X的其它3個地址寄存器算術邏輯單元以對進行間接尋址的9個寄存器進行修改。這3個地址寄存器算術邏輯單元產生獨立的地址以作為三組數(shù)據(jù)讀總線的地址。這種并行結構允許兩個16位的操作數(shù)和一個16位的系數(shù)在一個CPU周期內同時讀入數(shù)據(jù)計算單元。另外,地址數(shù)據(jù)流程單元還包括一些支持在間接尋址指令中循環(huán)尋址方式的寄存器。

3.5 數(shù)據(jù)計算單元

數(shù)據(jù)計算單元(D單元)是TMS320C55X的CPU的重要部分,應用系統(tǒng)的大量數(shù)據(jù)在這個單元進行處理。圖5是數(shù)據(jù)計算單元的框圖,從圖中可以看出,三組數(shù)據(jù)讀數(shù)據(jù)總線上的數(shù)據(jù)可用作兩個AMC器件的輸入右40位的算術邏輯單元的輸入。MAC器件運算的結構可以存放在4個40位的累加器中。數(shù)據(jù)計算單元的這種并行性將減少TMS320C55X在執(zhí)行信號處理算法時所需的周期數(shù)。TMS320C55X相對TMS320C54X的性能有很大的提高,其中關鍵的一些是TMS320C55X采用了并行的雙MAC結構,每一個MAC器件包括一個乘法器和一個專門的加法器,在單周期內,每一個MAC單元可以執(zhí)行17×17位的乘法運算和一個40位的加法運算。MAC單元的輸入是三組數(shù)據(jù)讀數(shù)據(jù)總線上的數(shù)據(jù),這三組數(shù)據(jù)一般是兩組數(shù)據(jù)流和一組常系數(shù)數(shù)據(jù)流。MAC運算結果可以存放在數(shù)據(jù)計算單元的40位的累加器中。

數(shù)據(jù)計算單元包括一個40位的算術邏輯單元,這個算術邏輯單元是與MAC器件完全分開的。它能夠對40位累加器中的數(shù)據(jù)進行算術或邏輯運算。另外的一種工作方式是同時對兩組16位數(shù)據(jù)進行算術運算。該算術邏輯單元的輸入除了數(shù)據(jù)計算單元的累加器外,它還從指令緩沖單元接收立即數(shù),并且能夠與存儲器、地址數(shù)據(jù)流程單元的寄存器以及程序流程單元的寄存器進行雙向通信。

數(shù)據(jù)計算單元中還有一個功能強大的移位器。移位器可將累加器中40位的數(shù)據(jù)向左最多移31位或向右移32位。它從指令緩沖單元接收立即數(shù)并可與程序流程單元和地址數(shù)據(jù)流程單元的寄存器進行雙向通信。此外,移位器移位后的值可以作為算術邏輯單元的輸入以便進一步處理。

數(shù)據(jù)計算單元將處理的結果通過兩組16位的數(shù)據(jù)寫總線寫入存儲器中。這兩組總線與地址數(shù)據(jù)流程單元的地址發(fā)生器結合在一起,使TMS320C55X可以在一個CPU周期內完成兩個16位數(shù)據(jù)寫或一個32位數(shù)據(jù)寫的功能。這種方法可以提高數(shù)字信號處理器CPU的數(shù)據(jù)天吞吐量,因而對實時性要求高的場合是十分必要的。

4 結束語

TMS320C55X具有性能高,功耗低和完善的軟件開發(fā)支持等特點,它的內核與TI公司現(xiàn)有的完全兼容,同時,TI公司還提供集成的開發(fā)環(huán)境eXpress 實時軟件技術,該技術包括所有必要的工上和軟件,支持新推出的TMS320C55X內核,能使用戶較快地開發(fā)新的產品。



評論


相關推薦

技術專區(qū)

關閉