高性能浮點(diǎn)DSP芯片TMS320VC33
摘要:TMS320VC33是美國TI公司新推出的TMS320C3X系列新一代浮點(diǎn)式數(shù)字信號處理器。它以高速、低功耗、低成本、易于開發(fā)為顯著特點(diǎn)。是通信、手機(jī)、MODEM、DVD、便攜式儀器儀表中需要進(jìn)行俘點(diǎn)運(yùn)算應(yīng)用中的一種理想 的DSP器件。文中介紹了TMS320VC33的硬件結(jié)構(gòu)、性能特點(diǎn)、指令系統(tǒng)、仿真工具和開發(fā)環(huán)境,最后給出了由TMS320VC33組成的最小應(yīng)用系統(tǒng)。
本文引用地址:http://butianyuan.cn/article/242270.htm關(guān)鍵詞:數(shù)字信號處理器 TMS320VC33 浮點(diǎn)DSP
TMS320VC33是TI公司新推出的TMS320VC3X系列新一代浮點(diǎn)DSP。它是在原來的TMS320C31浮點(diǎn)DSP的基礎(chǔ)上開發(fā)一個價格更低的版本(15US$),該產(chǎn)品以高速、低功耗、低成本、易于開發(fā)為顯著特點(diǎn)。由于它采用了內(nèi)部1.8V、外部3.3V供電,因而功耗比原有型號降低了大約一個數(shù)量級,而且能支持高達(dá)150M/FLOPS的運(yùn)行速率,是需浮點(diǎn)運(yùn)行的便攜式產(chǎn)品應(yīng)用場合中的一種理想的DSP器件。
1 TMS320VC33的硬件結(jié)構(gòu)
TMS320VC33采用144腳LQFP四邊形封裝。表1所列是其引腳號與引腳名稱的對應(yīng)關(guān)系表。圖1是其功能結(jié)構(gòu)圖。它的主要性能如下:
表1 144腳LQFP封裝的TMS320VC33引腳號碼與引腳名稱的對應(yīng)關(guān)系表
引腳號 | 名 稱 | 引腳號 | 名 稱 | 引腳號 | 名 稱 | 引腳號 | 名 稱 | 引腳號 | 名 稱 | 引腳號 | 名 稱 |
1 | A20 | 25 | Vss | 49 | Vss | 73 | D15 | 97 | Vss | 121 | INT1 |
2 | Vss | 26 | A3 | 50 | D31 | 74 | D14 | 98 | TCK | 122 | INT0 |
3 | A19 | 27 | A2 | 51 | D30 | 75 | D13 | 99 | TDO | 123 | CVDD |
4 | A18 | 28 | CVDD | 52 | D29 | 76 | D12 | 100 | TDI | 124 | EDGENIDE |
5 | A17 | 29 | A1 | 53 | DVDD | 77 | DVDD | 101 | CVDD | 125 | NCBK/MP |
6 | DVDD | 30 | A0 | 54 | D28 | 78 | D11 | 102 | TMS | 126 | Vss |
7 | A16 | 31 | DVDD | 55 | D27 | 79 | D10 | 103 | TRST | 127 | RESET |
8 | A15 | 32 | PAG3 | 56 | Vss | 80 | Vss | 104 | DR0 | 128 | SHZ |
9 | Vss | 33 | PAG2 | 57 | D26 | 81 | D9 | 105 | Vss | 129 | DVDD |
10 | A14 | 34 | Vss | 58 | D25 | 82 | D8 | 106 | FSR0 | 130 | EXTCLK |
11 | A13 | 35 | PAG1 | 59 | D24 | 83 | CVDD | 107 | CLKR0 | 131 | PLLVDD |
12 | CDDD | 36 | PAG0 | 60 | DVDD | 84 | D7 | 108 | DVDD | 132 | XOUT |
13 | A12 | 37 | DVDD | 61 | D23 | 85 | D6 | 109 | CLKR0 | 133 | XIN |
14 | A11 | 38 | H1 | 62 | D22 | 86 | DVDD | 110 | FSX0 | 134 | PLLVSS |
15 | DVDD | 39 | H3 | 63 | Vss | 87 | D5 | 111 | DX0 | 135 | CLKMD1 |
16 | A10 | 40 | Vss | 64 | D21 | 88 | D4 | 112 | Vss | 136 | CLKMD0 |
17 | A9 | 41 | STRB | 65 | D20 | 89 | Vss | 113 | TCLK1 | 137 | CVDD |
18 | Vss | 42 | R/W | 66 | CVDD | 90 | D3 | 114 | TCLK0 | 138 | RSV1 |
19 | A8 | 43 | DVDD | 67 | D19 | 91 | D2 | 115 | DVDD | 139 | RSV0 |
20 | A7 | 44 | IACK | 68 | D18 | 92 | D1 | 116 | XF1 | 140 | Vss |
21 | A6 | 45 | RDY | 69 | DVDD | 93 | D0 | 117 | XF0 | 141 | A23 |
22 | A5 | 46 | CVDD | 70 | D17 | 94 | DVDD | 118 | Vss | 142 | A22 |
23 | DVDD | 47 | HOLD | 71 | D16 | 95 | EMU1 | 119 | INT3 | 143 | DVDD |
24 | A4 | 48 | HOLDA | 72 | Vss | 96 | EMU0 | 120 | INT2 | 144 | A21 |
●具有高速的浮點(diǎn)運(yùn)算能力,其中TMS320VC33-150型在13ns單周期指令執(zhí)行時間時為150MFLOPS和75MIPS;而TMS320VC33-120型在17ns單周期指令執(zhí)行時間時為120MFLOPS;60MIPS;
●帶有34k×32位(1.1M位)的片內(nèi)雙靜態(tài)RAM,分為2個16k×32位塊和2個1k×32位塊;
●內(nèi)含5倍頻的鎖相環(huán)(PLL)時鐘發(fā)生器;
●低功耗,在150MFLOPS下運(yùn)行時,功耗低于200mW。
●帶有32位的高性能CPU;
●可進(jìn)行16/32位整數(shù)和32/40位的浮點(diǎn)操作;
●具有四個內(nèi)部譯碼頁選,可大大簡化與I/O及存儲器的接口;
●帶有啟動程序裝載功能;
●外部中斷可選擇邊沿觸發(fā)方式和電平觸發(fā)方式;
●具有32位的指令字,24位的地址線;
●內(nèi)含8個擴(kuò)展精度寄存器;
●片內(nèi)存儲器可映射外設(shè),其中包括一個串行口、2個32位定時器和一個DMA;
●采用TI公司的0.8μm Timeline TM制造技術(shù);
●采用144管腳LQFP封裝;
●帶有2個地址發(fā)生器、8個輔助寄存器和2個輔助寄存器算術(shù)單元(ARAUs);
●具有兩個低功耗模式;
●支持2個或3個操作數(shù)指令;
●在一個單指令周期并行進(jìn)行算術(shù)/邏輯單元(ALU)和乘法器運(yùn)算;
●具有塊重復(fù)功能;
●可零開銷循環(huán)和單周期分支;
●具有條件調(diào)用和條件返回指令;
●總線控制寄存器配置選通控制等待狀態(tài)數(shù);
●采用1.8V內(nèi)核,3.3V I/O供電;
●具有符合IEEE 1149標(biāo)準(zhǔn)的片內(nèi)掃描仿真接口(JTAG)。
圖2是TMS320VC33存儲器映像圖。
2 TMS320VC33的指令系統(tǒng)
除了個別在C32才有的外設(shè)和在C30才有的第二個外部端口以及第二串行口外,所有的C3XDSP代碼都是兼容的,因此它們都是基于同樣技術(shù)的浮點(diǎn)CPU。TMS320VC33的指令集就是以前的C3X指令集。共分為6個功能組:1.裝入與存儲指令;2.兩操作數(shù)算術(shù)/邏輯運(yùn)算指令;3.三操作數(shù)算術(shù)/邏輯運(yùn)算指令;4.程序控制令;5.互鎖操作指令;6.并行操作指令等。使用C3X指令集編程需注意以下幾個問題:
(1)延時轉(zhuǎn)移的使用
延時轉(zhuǎn)移在單周期內(nèi)執(zhí)行,而通常的轉(zhuǎn)移需要4個周期,不管轉(zhuǎn)移發(fā)生與否,后面的三條指令總是要執(zhí)行的。如果后面的指令少于三條,則使用延時轉(zhuǎn)移時要再加上無操作指令(NOP),這樣可以節(jié)省機(jī)器時間。
(2)單指令/指令塊循環(huán)結(jié)構(gòu)的使用
使用這種方式可以做到零開鎖循環(huán),不過要注意RPTS是不可中斷的。
(3)并行指令的使用
在執(zhí)行乘法時,可以并行執(zhí)行加(減);在做乘法或算術(shù)/邏輯運(yùn)算時,可以并行行執(zhí)行存儲。以此來提高單周期內(nèi)執(zhí)行的操作個數(shù)。為了最大限度地提高效率,要注意并行指令中的尋址模式,并適當(dāng)?shù)匕才艛?shù)據(jù)。
寄存器是訪問存儲器的有效途徑。加強(qiáng)寄存器的使用,有助于使用并行指令,也有助于防止在各種尋址模式中使用寄存器時可能產(chǎn)生的流水沖突。
(5)高速緩存的使用
在與此同時片外慢速存儲器連接時,高速緩存的使用顯得特別重要。對于使用者來說,cache是透明的,只需將其使能即可。
(6)盡量使用片內(nèi)存儲器
片內(nèi)存儲器的訪問速度要快得多。在單周期內(nèi)存儲器可以調(diào)出2個操作數(shù),如果首先使用與CPU并行的DMA來將數(shù)據(jù)傳入片內(nèi)存儲器,以可以最大限度地發(fā)揮其功能。
(7)避免流水作業(yè)時的沖突
在時間要求很苛刻的情況下,要確保不會因為沖突而丟失任何機(jī)器周期。為了驗證沖突的存在,可在開發(fā)工具上(軟、硬仿真器)對該程序進(jìn)行跟蹤,以及時確認(rèn)流水作業(yè)的沖突,再經(jīng)認(rèn)真分析沖突的原因,進(jìn)而解決有關(guān)問題。
3 仿真工具及開發(fā)環(huán)境
由于所有C3X DSP具有相同的CPU,所以'C30、'31或'32上的程序可以很方便地移植到VC33上來使用,也可以用現(xiàn)有的C3X開發(fā)工具來編寫VC33程序。
TMS320C3X的開發(fā)工具有:
C3X軟件仿真器;
C3X優(yōu)化C編譯/匯編器;
DSK(Design Starter Kit);
評估板EVM(Evaluation Module);
XDS510'C3XC source dedugger software;
XDS510 emulator hardware with JTAG;
C3X/C4XCODECOMPOSSORSTUDIO.
其中,C3X/C4XCODECOMPOSSORSTUDIO是一個集成的開發(fā)平臺,具有編輯、匯編、編譯、軟硬件仿真調(diào)試功能,是一個界面非常友好、功能完善的開發(fā)軟件.
4 最小應(yīng)用系統(tǒng)
在采用TMS320VC33來組成應(yīng)用系統(tǒng)時,首先要考慮TMS320VC33所具有的各種功能是否滿足應(yīng)用系統(tǒng)的要求,如能滿足,則稱這樣的系統(tǒng)為最小系統(tǒng).VC33由于其片內(nèi)無ROM(或EPROM或FLASH),故其最小應(yīng)用系統(tǒng)還應(yīng)包括外接的EPROM或FALSH程序存儲器芯片.當(dāng)最小系統(tǒng)不能滿足系統(tǒng)功能的要求時,需擴(kuò)展ROM、ROM、I/O、A/D、D/A及其它所需的外圍芯片.DSP最小系統(tǒng)還包括沒有集成在芯片內(nèi)的其它器件如晶體振蕩電路、復(fù)位開發(fā)和電源管理芯片等。
圖3為典型的TMS320VC33最小應(yīng)用系統(tǒng)的電路原理圖,利用該電路可以實時在線對TMS320VC33芯片系統(tǒng)仿真開發(fā)和學(xué)習(xí)研究,其中TPS73HD301用于向VC33提供3.3V和1.8V的電源信號,并由外部電路提供15MHz的時鐘信號,當(dāng)EDGEMODE接高電平時,為外部邊沿觸發(fā)中斷方式;MCBL/MP引腳為高電平時可使VC33工作于微計算機(jī)自引導(dǎo)方式,在這種方式下,TMS320VC33可從JTAG仿真口直接設(shè)定裝入程序運(yùn)行,不過在應(yīng)用系統(tǒng)由三個特定的地址裝入程序(BOOT1,BOOT2,BOOT3)或從串口裝入程序時,具體應(yīng)用系統(tǒng)應(yīng)視需要來設(shè)計確定。
評論