新聞中心

EEPW首頁(yè) > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > TMS320C6000嵌入式系統(tǒng)優(yōu)化編程的研究

TMS320C6000嵌入式系統(tǒng)優(yōu)化編程的研究

作者: 時(shí)間:2009-03-19 來(lái)源:網(wǎng)絡(luò) 收藏

1 的硬件設(shè)計(jì)和指令

本文引用地址:http://butianyuan.cn/article/152576.htm

  系列(數(shù)字信號(hào)處理器)是TI公司最新推出的一種的數(shù)字信號(hào)處理器。它是基于TI的VLIW技術(shù)的,其中TMS320C62xx是定點(diǎn)處理器,TMS320C67xx是浮點(diǎn)處理器。本文主要討論TMS320C6201。該處理器的工作頻率最高可以采用50MHz,經(jīng)內(nèi)部4倍頻后升至200MHz,每個(gè)時(shí)鐘周期最多可以并行執(zhí)行8條指令,從而可以實(shí)現(xiàn)1600MIPS的定點(diǎn)運(yùn)算能力,而且完成1024定點(diǎn)FFT的時(shí)間只需70μs。

1.1 的硬件結(jié)構(gòu)

  圖1是TMS320C6000 CPU的結(jié)構(gòu)圖。

TMS320C6000的CPU有兩個(gè)數(shù)據(jù)通道A和B,每個(gè)通道有16個(gè)32位字長(zhǎng)的寄存器(A0~A15,B0~B15),四個(gè)功能單元(L,S,M,D),每個(gè)功能單元負(fù)責(zé)完成一定的算術(shù)或者邏輯運(yùn)算。A、B兩通道的寄存器并不是完全共享,只能通過(guò)TMS320C6000提供的兩個(gè)交換數(shù)據(jù)通道1X、2X,才能實(shí)現(xiàn)處理單元從不同通道的寄存器堆那里獲取32位字長(zhǎng)的操作數(shù)。

  TMS320C6000的地址線為32位,存儲(chǔ)器尋址空間是4G。C6201片內(nèi)集成有1Mbit SRAM――512Kbit的程序存儲(chǔ)器(根據(jù)需要可全部配置成Cache)和512Kbit的數(shù)據(jù)存儲(chǔ)器。通過(guò)片內(nèi)的程序存儲(chǔ)空間控制器,CPU一次可以取出256bit,即一次最多可以取出8條32位指令。

  C6201有32位的外部存儲(chǔ)接口EMIF為CPU訪問(wèn)外圍設(shè)備提供了無(wú)縫接口。外圍設(shè)備可以是同步動(dòng)態(tài)存儲(chǔ)器(SDRAM)、同步突發(fā)靜態(tài)存儲(chǔ)器(SBSRAM)、靜態(tài)存儲(chǔ)器(SRAM)、只讀存儲(chǔ)器(ROM),也可以是FIFO寄存器。

  為了便于進(jìn)行多信道數(shù)字信號(hào)處理,TMS320C6000配備了多信道帶緩沖能力的串口McBSP。McBSP的功能非常強(qiáng)大,除具有一般串口功能之外,還可以支持T1/E1、ST-BUS、IOM2、SPI、IIS等不同標(biāo)準(zhǔn)。McBSP最多支持128個(gè)信道;支持多種數(shù)據(jù)格式(8/12/16/20/24/32bit)的傳輸;可自動(dòng)進(jìn)行u律、A律壓擴(kuò)。其工作速率可達(dá)到1/2時(shí)鐘速率。

  TMS320C6000提供的16位主機(jī)接口(HPI)使得主機(jī)設(shè)備可以直接訪問(wèn)的存儲(chǔ)空間。通過(guò)內(nèi)部或外部存儲(chǔ)空間,主機(jī)和DSP可以交換信息。主機(jī)也可以利用HPI直接訪問(wèn)映射進(jìn)存儲(chǔ)空間的外圍設(shè)備。

  DSP器件一般都帶有DMA控制器,可以在CPU操作的后臺(tái)進(jìn)行數(shù)據(jù)傳輸。TMS320C6201的DMA控制器有4個(gè)獨(dú)立的可通道,可以同時(shí)進(jìn)行四個(gè)不同的DMA操作,每個(gè)通道的優(yōu)先級(jí)可以通過(guò)設(shè)定。每個(gè)通道可以根據(jù)需要傳輸8/16/32bit的數(shù)據(jù),并且DMA控制器可以訪問(wèn)全部32位的地址空間。此外,還有一個(gè)輔助通道允許DMA控制器響應(yīng)主機(jī)通過(guò)HPI口發(fā)來(lái)的請(qǐng)求。

1.2 指令

  C62xx和C67xx共享同一個(gè)指令集。C67xx可以使用所有的C62xx指令,但因?yàn)镃67xx是浮點(diǎn)芯片,所以C67xx的指令集中有一些指令只能用于浮點(diǎn)運(yùn)算。TMS320C6201CPU的設(shè)計(jì)采用了類(lèi)似于RISC的結(jié)構(gòu),指令集簡(jiǎn)單、運(yùn)算速度快。8個(gè)功能單元負(fù)責(zé)不同功能的運(yùn)算,指令和功能單元之間存在一個(gè)映射關(guān)系。其中,L單元有23條指令,M單元有20條指令,S單元29有條指令,D單元有26條指令。

  TMS320C6201的大部分指令都可在單周期內(nèi)完成,都可以直接對(duì)8/16/32bit數(shù)據(jù)進(jìn)行操作。同時(shí),TMS320C6201指令集針對(duì)數(shù)字信號(hào)處理算法提供了一些特殊指令:為復(fù)雜計(jì)算提供的40bit的特殊操作的加法運(yùn)算;有效的溢出處理和歸一化處理;簡(jiǎn)潔的位操作功能等。TMS320C6201中最多可以有8條指令同時(shí)并行執(zhí)行;所有指令均可條件執(zhí)行。以上所有特點(diǎn)提高了指令的執(zhí)行效率、減小了代碼長(zhǎng)度、大大減少了因跳轉(zhuǎn)引起的開(kāi)銷(xiāo)、提高了編碼效率。

  流水線操作是DSP實(shí)現(xiàn)高速度、高效率的關(guān)鍵技術(shù)之一。TMS320C6000只有在流水線充分發(fā)揮作用的情況下,才能達(dá)到1600MIPS的速度。C6000的流水線分為三個(gè)階段:取指、解碼、執(zhí)行,總共11級(jí)。和以前的C3x、C54x相比,有非常大的優(yōu)勢(shì),主要表現(xiàn)在:簡(jiǎn)化了流水線的控制以消除流水線互鎖;增加流水線的深度以消除傳統(tǒng)流水線結(jié)構(gòu)在取指、數(shù)據(jù)訪問(wèn)和乘法操作上的瓶頸。其中取指、數(shù)據(jù)訪問(wèn)分為多個(gè)階段,使得C6000可以高速地訪問(wèn)存儲(chǔ)空間。

2 的幾個(gè)方法

  使用TMS320C6000進(jìn)行程序設(shè)計(jì)時(shí),首先的感覺(jué)是匯編指令集太小了。C6000在設(shè)計(jì)時(shí)采用了一種類(lèi)RISC機(jī)的結(jié)構(gòu),運(yùn)算速度特別快,但是指令集卻非常簡(jiǎn)單。象DSP算法中常用的乘加指令、循環(huán)操作指令等,在C54x和C3x中兩條指令就可以完成的功能,而在C6000中卻需要一個(gè)循環(huán)體,所以它的程序設(shè)計(jì)一般比較復(fù)雜。要想充分發(fā)揮C6000的運(yùn)算能力,必須從它的硬件結(jié)構(gòu)出發(fā),最大限度地利用八個(gè)功能單元,使用軟件流水線,盡量讓程序無(wú)沖突的并行執(zhí)行。

  的長(zhǎng)處在于,在處理彼此之間沒(méi)有承接關(guān)系的運(yùn)算時(shí),在CPU資源允許的情況下可以并行完成。但對(duì)于前后有承接關(guān)系或者判斷、跳轉(zhuǎn)頻繁的情況,就無(wú)法發(fā)揮并行的優(yōu)勢(shì)。一般循環(huán)體都滿足的條件,并且循環(huán)體往往是程序中耗時(shí)最長(zhǎng)的地方。因此進(jìn)行C6000應(yīng)用開(kāi)發(fā)時(shí)應(yīng)將重點(diǎn)放在循環(huán)體上。為了降低開(kāi)發(fā)難度,C6000提供了很多在高級(jí)語(yǔ)言(如ANSI C)一級(jí)對(duì)程序進(jìn)行的方法。在應(yīng)用滿足實(shí)時(shí)性處理要求時(shí),應(yīng)盡量采用這種方法。但是這種方法的效率比較低,C語(yǔ)言優(yōu)化最好的例子是點(diǎn)乘,這種循環(huán)使用C語(yǔ)言進(jìn)行優(yōu)化可以百分之百地的利用CPU資源,程序的并行性達(dá)到最好。但是我們?cè)谧?0點(diǎn)的點(diǎn)乘時(shí)發(fā)現(xiàn)它的耗時(shí)是匯編語(yǔ)言程序的3倍。所以如果的實(shí)時(shí)性要求比較高,就不能使用這種優(yōu)化方法了。

linux操作系統(tǒng)文章專題:linux操作系統(tǒng)詳解(linux不再難懂)

上一頁(yè) 1 2 3 下一頁(yè)

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉