解決DSP設(shè)計(jì)面臨的終極挑戰(zhàn)

作者：時(shí)間：2012-12-21 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

多年來，數(shù)字信號(hào)處理器 (DSP) 設(shè)計(jì)人員一直在應(yīng)付這樣一項(xiàng)艱難的工作：提供占用空間小的高性能芯片，而且要不影響靈活性和軟件的可編程能力。

本文引用地址：http://butianyuan.cn/article/148174.htm

由于新的應(yīng)用程序發(fā)展速度驚人，提供的 DSP 必須在功率、性能和使用壽命上跟上這種速度，應(yīng)對當(dāng)前面臨的挑戰(zhàn)，并準(zhǔn)備好應(yīng)對未來的應(yīng)用。這些高性能多核心 DSP被越來越多地應(yīng)用在電信接入、改進(jìn)數(shù)據(jù)率GSM服務(wù)(EDGE)和基礎(chǔ)設(shè)施設(shè)備領(lǐng)域，用來處理語音、視頻和無線電信號(hào)。

以前，電信設(shè)備制造商使用專用的 ASIC 或 DSP-ASIC 組合來達(dá)到自己的目標(biāo)?，F(xiàn)在，這些新的 DSP 可以替代那些繁瑣的解決方案;如果足夠強(qiáng)大，它們還可以實(shí)現(xiàn)以前的解決方案所無法實(shí)現(xiàn)的靈活性。對于那些必須在網(wǎng)絡(luò)部署中持續(xù)使用多年的接入和基礎(chǔ)設(shè)施設(shè)備，而言, 這些靈活的解決方案是大有裨益的。假如這些類型的設(shè)備和應(yīng)用程序的使用壽命得到延長，那么，成功的關(guān)鍵就是靈活性、適應(yīng)性和現(xiàn)場可編程性。

在目前的技術(shù)條件下，ASIC 在靈活性或現(xiàn)場可編程性方面不如 DSP，但 DSP 的能耗較大，這讓芯片設(shè)計(jì)人員左右為難。不過，還是有希望：新一代的多核心 DSP 可以同時(shí)做到高性能和高能效。做到這點(diǎn)的技術(shù)是存在的，但必須先解決“功率耗散”(功率極限)問題。

功率極限

目前，芯片功率耗散的源頭有兩個(gè)：以泄漏形式出現(xiàn)的靜態(tài)現(xiàn)象;以開關(guān)運(yùn)算形式出現(xiàn)的動(dòng)態(tài)現(xiàn)象。在采用 90 納米和以下工藝的 CMOS 技術(shù)中，這種功率耗散現(xiàn)象最為明顯。但是，新一代的 DSP 設(shè)計(jì)不僅能減輕和避開這種功率極限，而且實(shí)際上可以提高基礎(chǔ)設(shè)施、接入和 EDGE 設(shè)備的處理能力，同時(shí)限制功率消耗和熱量耗散。

部分特定CMOS 技術(shù)下的能耗界定的關(guān)鍵度量指標(biāo):

•電源電壓

•門開關(guān)速度

•門輸入電容

•門功耗

•每個(gè) MAC 運(yùn)算消耗的能源

研究表明，同等功能(如 MAC 單元)的功率密度(即單位面積的功率)在 0.13 微米(含)以上的芯片中相當(dāng)穩(wěn)定。但是，到達(dá) 90 納米時(shí)，這個(gè)指標(biāo)會(huì)突然升高。

Power/Area versus Silicon Technology

功率/面積與硅技術(shù)

Power crisis at 90 nm and below

90 納米及以下工藝的功率極限

微米

納米

在采用 0.13 微米技術(shù)以前，DSP 設(shè)計(jì)能夠在提高性能的同時(shí)降低功率，從而可以在單個(gè)芯片中植入更多的電路。這主要是通過減小尺寸并降低電壓實(shí)現(xiàn)的。采用了 90 納米技術(shù)后，所有這一切就都行不通了。

現(xiàn)在面臨的是以性能換功能的問題，這是設(shè)備制造商所不愿遇到的情況：在一個(gè)芯片中植入更多電路但降低性能，或者減少電路數(shù)以減少功能。

由于“功率極限”的情形繼續(xù)存在，設(shè)計(jì)人員一直在通過增加功耗來獲得性能和功能方面的優(yōu)勢。但是，這會(huì)帶來一種新的風(fēng)險(xiǎn)：達(dá)到熱量耗散的極限。所產(chǎn)生的問題可能已經(jīng)在當(dāng)前市場上最新一代的通用多核心 DSP 中出現(xiàn)。

零-和博弈：靜態(tài)能效

因?yàn)樾阅苁腔A(chǔ)設(shè)施、接入和 EDGE 應(yīng)用的主要目標(biāo)，因此設(shè)計(jì)人員一般并不關(guān)心零待機(jī)功率問題。因此，通常采用通用硅工藝來優(yōu)化性能，而不會(huì)選擇低泄漏的硅。選擇低泄漏的硅可以降低待機(jī)功率，但也會(huì)降低速度和性能。

這就要求有選擇地使用晶體管。

在使用電池的設(shè)備中，高電壓閾值 (HVT) 可能是最佳的;但在基礎(chǔ)設(shè)施應(yīng)用中，首選的是標(biāo)準(zhǔn)電壓閾值 (SVT) 技術(shù)。

例如，假如某個(gè)設(shè)計(jì)使用 HVT 邏輯運(yùn)算，并且電源電壓為 1.2V，則將連續(xù)產(chǎn)生 20mW 的泄漏功率。如果以最大容量運(yùn)算，則將消耗 1W 的動(dòng)態(tài)功率。

使用 SVT 邏輯運(yùn)算的相同設(shè)計(jì)在電源電壓為 1.0V 時(shí)可以實(shí)現(xiàn)幾乎相同性能，產(chǎn)生的泄漏功率多出 4 倍 (100mW)，但動(dòng)態(tài)消耗的功率只有 694mW (1.02 /1.22 = 0.694)。

因此，泄漏較高的 SVT 設(shè)計(jì)消耗的總功率只有 790mW，而相比之下，HVT 設(shè)計(jì)的消耗總功率為 1.02W。前者比后者節(jié)能 23%。

HVT 設(shè)計(jì)和 SVT 設(shè)計(jì)的功耗比較

An unused module can be disabled anytime using an enable signal. Associated logic and clock trees contained in a disabled module will therefore stop consuming power.

可以使用激活信號(hào)隨時(shí)禁用未使用的模塊。被禁用的模塊中包含的相關(guān)邏輯和時(shí)鐘樹會(huì)因此停止消耗能量。

An unused module can be disabled anytime using an enable signal. Associated logic and clock trees contained in a disabled module will therefore stop consuming power.

可以使用激活信號(hào)隨時(shí)禁用未使用的模塊。被禁用的模塊中包含的相關(guān)邏輯和時(shí)鐘樹會(huì)因此停止消耗能量。

module0 is enabled

module0 已激活

module1 is enabled

module1 已激活

module2 is disabled

module2 被禁用

mclk is grounded

mclk 接地

MODULE0 (array of gates and flip-flops)

MODULE0(門和觸發(fā)器陣列)

MODULE1 (array of gates and flip-flops)

MODULE1(門和觸發(fā)器陣列)

MODULE2 (array of gates and flip-flops)

MODULE2(門和觸發(fā)器陣列)

性能

兩種設(shè)計(jì)實(shí)現(xiàn)的性能相同。

盡管與人們預(yù)料的情況相反，這一示例表明，使用較高泄漏的 SVT 邏輯與使用低泄漏的 HVT 邏輯相比，可以在總體上節(jié)能，這是因?yàn)楹笳唠娐分械拈_關(guān)活動(dòng)量很大。對于乘法和累加 (MAC) 電路，這種設(shè)計(jì)特別有用;但如果用在低活動(dòng)因素的電路(如 RAM 電路或測試電路)上，則會(huì)出現(xiàn)相反的結(jié)果。因此，SVT 邏輯適用于基礎(chǔ)設(shè)施中“始終打開”的設(shè)備。

動(dòng)態(tài)化：能效優(yōu)化

時(shí)鐘樹和邏輯切換都會(huì)導(dǎo)致動(dòng)態(tài)能耗，必須在新一代多核心 DSP 中進(jìn)行處理。通過不斷優(yōu)化這兩種耗能因素的設(shè)計(jì)，可以極大地改進(jìn)能效指標(biāo)。

新聞中心

解決DSP設(shè)計(jì)面臨的終極挑戰(zhàn)

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)