新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > 解決DSP設(shè)計(jì)面臨的終極挑戰(zhàn)

解決DSP設(shè)計(jì)面臨的終極挑戰(zhàn)

作者: 時(shí)間:2012-12-21 來源:網(wǎng)絡(luò) 收藏

多年來,數(shù)字信號(hào)處理器 () 人員一直在應(yīng)付這樣一項(xiàng)艱難的工作:提供占用空間小的高性能芯片,而且要不影響靈活性和軟件的可編程能力。

本文引用地址:http://butianyuan.cn/article/148174.htm

由于新的應(yīng)用程序發(fā)展速度驚人,提供的 必須在功率、性能和使用壽命上跟上這種速度,應(yīng)對當(dāng)前,并準(zhǔn)備好應(yīng)對未來的應(yīng)用。這些高性能多核心 被越來越多地應(yīng)用在電信接入、改進(jìn)數(shù)據(jù)率GSM服務(wù)(EDGE)和基礎(chǔ)設(shè)施設(shè)備領(lǐng)域,用來處理語音、視頻和無線電信號(hào)。

以前,電信設(shè)備制造商使用專用的 ASIC 或 DSP-ASIC 組合來達(dá)到自己的目標(biāo)?,F(xiàn)在,這些新的 DSP 可以替代那些繁瑣的方案;如果足夠強(qiáng)大,它們還可以實(shí)現(xiàn)以前的方案所無法實(shí)現(xiàn)的靈活性。對于那些必須在網(wǎng)絡(luò)部署中持續(xù)使用多年的接入和基礎(chǔ)設(shè)施設(shè)備,而言, 這些靈活的方案是大有裨益的。假如這些類型的設(shè)備和應(yīng)用程序的使用壽命得到延長,那么,成功的關(guān)鍵就是靈活性、適應(yīng)性和現(xiàn)場可編程性。

在目前的技術(shù)條件下,ASIC 在靈活性或現(xiàn)場可編程性方面不如 DSP,但 DSP 的能耗較大,這讓芯片人員左右為難。不過,還是有希望:新一代的多核心 DSP 可以同時(shí)做到高性能和高能效。做到這點(diǎn)的技術(shù)是存在的,但必須先解決“功率耗散”(功率極限)問題。

功率極限

目前,芯片功率耗散的源頭有兩個(gè):以泄漏形式出現(xiàn)的靜態(tài)現(xiàn)象;以開關(guān)運(yùn)算形式出現(xiàn)的動(dòng)態(tài)現(xiàn)象。在采用 90 納米和以下工藝的 CMOS 技術(shù)中,這種功率耗散現(xiàn)象最為明顯。但是,新一代的 DSP 不僅能減輕和避開這種功率極限,而且實(shí)際上可以提高基礎(chǔ)設(shè)施、接入和 EDGE 設(shè)備的處理能力,同時(shí)限制功率消耗和熱量耗散。

部分特定CMOS 技術(shù)下的能耗界定的關(guān)鍵度量指標(biāo):

•電源電壓

•門開關(guān)速度

•門輸入電容

•門功耗

•每個(gè) MAC 運(yùn)算消耗的能源

研究表明,同等功能(如 MAC 單元)的功率密度(即單位面積的功率)在 0.13 微米(含)以上的芯片中相當(dāng)穩(wěn)定。但是,到達(dá) 90 納米時(shí),這個(gè)指標(biāo)會(huì)突然升高。

Power/Area versus Silicon Technology

功率/面積與硅技術(shù)

Power crisis at 90 nm and below

90 納米及以下工藝的功率極限

um

微米

nm

納米

在采用 0.13 微米技術(shù)以前,DSP 設(shè)計(jì)能夠在提高性能的同時(shí)降低功率,從而可以在單個(gè)芯片中植入更多的電路。這主要是通過減小尺寸并降低電壓實(shí)現(xiàn)的。采用了 90 納米技術(shù)后,所有這一切就都行不通了。

現(xiàn)在的是以性能換功能的問題,這是設(shè)備制造商所不愿遇到的情況:在一個(gè)芯片中植入更多電路但降低性能,或者減少電路數(shù)以減少功能。

由于“功率極限”的情形繼續(xù)存在,設(shè)計(jì)人員一直在通過增加功耗來獲得性能和功能方面的優(yōu)勢。但是,這會(huì)帶來一種新的風(fēng)險(xiǎn):達(dá)到熱量耗散的極限。所產(chǎn)生的問題可能已經(jīng)在當(dāng)前市場上最新一代的通用多核心 DSP 中出現(xiàn)。

零-和博弈:靜態(tài)能效

因?yàn)樾阅苁腔A(chǔ)設(shè)施、接入和 EDGE 應(yīng)用的主要目標(biāo),因此設(shè)計(jì)人員一般并不關(guān)心零待機(jī)功率問題。因此,通常采用通用硅工藝來優(yōu)化性能,而不會(huì)選擇低泄漏的硅。選擇低泄漏的硅可以降低待機(jī)功率,但也會(huì)降低速度和性能。

這就要求有選擇地使用晶體管。

在使用電池的設(shè)備中,高電壓閾值 (HVT) 可能是最佳的;但在基礎(chǔ)設(shè)施應(yīng)用中,首選的是標(biāo)準(zhǔn)電壓閾值 (SVT) 技術(shù)。

例如,假如某個(gè)設(shè)計(jì)使用 HVT 邏輯運(yùn)算,并且電源電壓為 1.2V,則將連續(xù)產(chǎn)生 20mW 的泄漏功率。如果以最大容量運(yùn)算,則將消耗 1W 的動(dòng)態(tài)功率。

使用 SVT 邏輯運(yùn)算的相同設(shè)計(jì)在電源電壓為 1.0V 時(shí)可以實(shí)現(xiàn)幾乎相同性能,產(chǎn)生的泄漏功率多出 4 倍 (100mW),但動(dòng)態(tài)消耗的功率只有 694mW (1.02 /1.22 = 0.694)。

因此,泄漏較高的 SVT 設(shè)計(jì)消耗的總功率只有 790mW,而相比之下,HVT 設(shè)計(jì)的消耗總功率為 1.02W。前者比后者節(jié)能 23%。

HVT 設(shè)計(jì)和 SVT 設(shè)計(jì)的功耗比較

An unused module can be disabled anytime using an enable signal. Associated logic and clock trees contained in a disabled module will therefore stop consuming power.

可以使用激活信號(hào)隨時(shí)禁用未使用的模塊。被禁用的模塊中包含的相關(guān)邏輯和時(shí)鐘樹會(huì)因此停止消耗能量。

An unused module can be disabled anytime using an enable signal. Associated logic and clock trees contained in a disabled module will therefore stop consuming power.

可以使用激活信號(hào)隨時(shí)禁用未使用的模塊。被禁用的模塊中包含的相關(guān)邏輯和時(shí)鐘樹會(huì)因此停止消耗能量。

module0 is enabled

module0 已激活

module1 is enabled

module1 已激活

module2 is disabled

module2 被禁用

mclk is grounded

mclk 接地

MODULE0 (array of gates and flip-flops)

MODULE0(門和觸發(fā)器陣列)

MODULE1 (array of gates and flip-flops)

MODULE1(門和觸發(fā)器陣列)

MODULE2 (array of gates and flip-flops)

MODULE2(門和觸發(fā)器陣列)

性能

兩種設(shè)計(jì)實(shí)現(xiàn)的性能相同。

盡管與人們預(yù)料的情況相反,這一示例表明,使用較高泄漏的 SVT 邏輯與使用低泄漏的 HVT 邏輯相比,可以在總體上節(jié)能,這是因?yàn)楹笳唠娐分械拈_關(guān)活動(dòng)量很大。對于乘法和累加 (MAC) 電路,這種設(shè)計(jì)特別有用;但如果用在低活動(dòng)因素的電路(如 RAM 電路或測試電路)上,則會(huì)出現(xiàn)相反的結(jié)果。因此,SVT 邏輯適用于基礎(chǔ)設(shè)施中“始終打開”的設(shè)備。

動(dòng)態(tài)化:能效優(yōu)化

時(shí)鐘樹和邏輯切換都會(huì)導(dǎo)致動(dòng)態(tài)能耗,必須在新一代多核心 DSP 中進(jìn)行處理。通過不斷優(yōu)化這兩種耗能因素的設(shè)計(jì),可以極大地改進(jìn)能效指標(biāo)。


上一頁 1 2 3 下一頁

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉