多媒體應用需要多處理器SoC的設計
——
多媒體應用需要多處理器SoC的設計
移動電話正成為手持終端娛樂的中心,其同時也可作為復雜的寬帶無線電話發(fā)揮作用。用戶因為其的無線功能而選用移動電話,但一旦隨身攜帶,用戶則進一步希望其還能作為PDA、MP3播放器、數(shù)碼相機、攝像機、視頻播放機以及游戲機等。
開發(fā)這樣的多媒體設備面臨著巨大的技術挑戰(zhàn),特別是在服務質量、響應性以及電池壽命方面尤為如此。最終的解決方案在于依靠被高度集成到片上系統(tǒng)技術中的多個處理引擎。
請考慮用戶面臨的以下情境:
--消費者使用無線電話作為帶耳機的MP3播放器,她同時還可以玩視頻游戲。音樂和游戲聲音必須混合在一起,這樣二者能夠同時出現(xiàn),不會出現(xiàn)爆音或靜止。
--另一位消費者正在觀看存儲在插入電話中閃存卡上的電影,這時他的母親來電話了。當然他希望無線電話能夠告知他有人來電話,并顯示來電者身份。
--還有一位用戶正在參加視頻會議,但他還必須關注因特網(wǎng)上發(fā)布的臺風警告。屏幕上的文本信息會為他提供新聞動態(tài),不會造成視頻或音頻的中斷。
為了按照上述消費者的期望提供必要的服務質量,我們要求多個處理引擎同時工作
開發(fā)這樣的多媒體設備面臨著巨大的技術挑戰(zhàn),特別是在服務質量、響應性以及電池壽命方面尤為如此。最終的解決方案在于依靠被高度集成到片上系統(tǒng)技術中的多個處理引擎。
請考慮用戶面臨的以下情境:
--消費者使用無線電話作為帶耳機的MP3播放器,她同時還可以玩視頻游戲。音樂和游戲聲音必須混合在一起,這樣二者能夠同時出現(xiàn),不會出現(xiàn)爆音或靜止。
--另一位消費者正在觀看存儲在插入電話中閃存卡上的電影,這時他的母親來電話了。當然他希望無線電話能夠告知他有人來電話,并顯示來電者身份。
--還有一位用戶正在參加視頻會議,但他還必須關注因特網(wǎng)上發(fā)布的臺風警告。屏幕上的文本信息會為他提供新聞動態(tài),不會造成視頻或音頻的中斷。
為了按照上述消費者的期望提供必要的服務質量,我們要求多個處理引擎同時工作
。單個處理器配置即便具備多媒體擴展,可能也難以實時、同時應對上述各種動態(tài)工作負載,因為它采用的是順序而不是并行的多任務處理方法。
為了能夠滿足同時出現(xiàn)的多媒體任務和用戶界面事件的要求,單個處理器必須始終在任務間進行交換,這會導致很高的系統(tǒng)開銷。最終,任務交換會造成幀丟失、音頻爆音、視頻閃爍或斑紋。
工作負載情境
我們不妨舉一個例子,考慮兩個處理器運行工作負載的情況,其中包括控制任務、用戶界面任務以及多媒體任務。處理器A使用單個處理引擎,在所有三個任務之間進行上下文交換(Context Switching),這就造成開銷。處理器B使用兩個處理引擎(一個ARM和一個DSP),將處理多媒體的任務交由DSP完成。由于ARM處理器只需完成控制和用戶界面任務,這就大大降低了上下文交換開銷。即便處理器A運行于快得多的時鐘速度上,從最終用戶角度來看,其結果也會遜于處理器B。
德州儀器公司 (TI) 的Omap 1611進一步推出了多處理技術,其集成了ARM926、TI 55x DSP以及一系列針對視頻、Java及安全性的專用硬件加速器。為了實現(xiàn)最佳成本組合,ARM內(nèi)核與DSP內(nèi)核通過流量控制器可共享外部存儲器。
當然,軟件的高度集成對兩個以上處理引擎并行工作以實現(xiàn)無縫性能是至關重要的。軟件的橋接功能可識別所要求的任務,并將其分配給最合適的處理器,在某些情況下,還會分配給尚未運行的處理器。其也可以關閉不使用的處理引擎,并在需要時再將其打開。
這種多處理功能也有助于實現(xiàn)用戶期望的響應性。用戶已習慣于等待 MP3 音樂從因特網(wǎng)上下載,他們想聽下載文件時,希望能夠對選擇歌曲、控制音量和暫停等進行操作,或實時切換至另一應用。用戶希望按鍵之后立即得到響應。
在無線多媒體設備中,實現(xiàn)這樣的響應性并不像想像的那么簡單。原因在于,命令與控制功能、用戶界面和信號處理等在播放MP3歌曲時都是處于工作狀態(tài)的,從本質上講,這要求不同類型的數(shù)據(jù)處理。用戶接口是一種高中斷活動,而信號處理則要求持續(xù)與高度重復地執(zhí)行復雜的數(shù)學運算。
近期的經(jīng)驗顯示,不管性能集多豐富,客戶都不會選擇通話時間或待機時間大大低于他們已習慣的、目前第二代電話的無線多媒體設備。日本電信運營商Docomo在推出其第三代電話時就此方面獲得了第一手經(jīng)驗。Docomo的第一批3G電話獲得的市場份額大大低于預期目標。目前,該公司正在提供經(jīng)過重新設計的電話,待機電池使用時間超過200小時,并且工業(yè)設計與日本現(xiàn)有的2G電話更為接近,這樣,市場才開始接受3G機型。
盡管聽起來似乎與想當然的看法相左,但一般說來多處理引擎的功耗確實低于單個處理核心設計,其電池壽命也更長。利用不同類型處理核心(RISC、DSP和硬件加速器)的各種功能,我們可以從性能和功耗角度就優(yōu)化的引擎給出合適的算法,而且可以根據(jù)需要啟用或關閉有關單元,從而進一步延長電池使用時間。
DSP使用復雜的指令,使其可在單個時鐘周期內(nèi)進行若干數(shù)學運算。RISC架構與指令集一般僅允許在一個周期內(nèi)僅執(zhí)行一次運算。因此,DSP處理MP3音樂或視頻流所需的周期遠低于RISC芯片。此外,DSP內(nèi)核由內(nèi)部存儲器支持,而非由高速緩存支持。就緊湊的DSP循環(huán)而言,內(nèi)部SRAM可提供兩大優(yōu)勢:確定性執(zhí)行和功耗節(jié)省。
RISC核心可執(zhí)行諸如用戶接口及視頻顯示管理等高中斷命令與控制功能,這比DSP的效率高得多,且其執(zhí)行這些操作的功耗也比DSP低,特別是當其不需要實時發(fā)生時更為如此。
硬件加速器既可增強性能,又能提高電源效率,但會降低靈活性和可升級性。TI為其Omap器件添加了上述加速器,以解決特定的專用加速任務,諸如Java、安全性和視頻、離散余弦轉換、反DCT、運動估計以及像素插值等。
設計人員將多處理引擎運用到其系統(tǒng)的核心,既可以滿足消費者的當前需求,又可以為將來的無線多媒體設備制定發(fā)展策略。
Avner Goren (avner@ti.com)現(xiàn)就任于 TI(位于達拉斯)的全球無線終端業(yè)務部。
為了能夠滿足同時出現(xiàn)的多媒體任務和用戶界面事件的要求,單個處理器必須始終在任務間進行交換,這會導致很高的系統(tǒng)開銷。最終,任務交換會造成幀丟失、音頻爆音、視頻閃爍或斑紋。
工作負載情境
我們不妨舉一個例子,考慮兩個處理器運行工作負載的情況,其中包括控制任務、用戶界面任務以及多媒體任務。處理器A使用單個處理引擎,在所有三個任務之間進行上下文交換(Context Switching),這就造成開銷。處理器B使用兩個處理引擎(一個ARM和一個DSP),將處理多媒體的任務交由DSP完成。由于ARM處理器只需完成控制和用戶界面任務,這就大大降低了上下文交換開銷。即便處理器A運行于快得多的時鐘速度上,從最終用戶角度來看,其結果也會遜于處理器B。
德州儀器公司 (TI) 的Omap 1611進一步推出了多處理技術,其集成了ARM926、TI 55x DSP以及一系列針對視頻、Java及安全性的專用硬件加速器。為了實現(xiàn)最佳成本組合,ARM內(nèi)核與DSP內(nèi)核通過流量控制器可共享外部存儲器。
當然,軟件的高度集成對兩個以上處理引擎并行工作以實現(xiàn)無縫性能是至關重要的。軟件的橋接功能可識別所要求的任務,并將其分配給最合適的處理器,在某些情況下,還會分配給尚未運行的處理器。其也可以關閉不使用的處理引擎,并在需要時再將其打開。
這種多處理功能也有助于實現(xiàn)用戶期望的響應性。用戶已習慣于等待 MP3 音樂從因特網(wǎng)上下載,他們想聽下載文件時,希望能夠對選擇歌曲、控制音量和暫停等進行操作,或實時切換至另一應用。用戶希望按鍵之后立即得到響應。
在無線多媒體設備中,實現(xiàn)這樣的響應性并不像想像的那么簡單。原因在于,命令與控制功能、用戶界面和信號處理等在播放MP3歌曲時都是處于工作狀態(tài)的,從本質上講,這要求不同類型的數(shù)據(jù)處理。用戶接口是一種高中斷活動,而信號處理則要求持續(xù)與高度重復地執(zhí)行復雜的數(shù)學運算。
近期的經(jīng)驗顯示,不管性能集多豐富,客戶都不會選擇通話時間或待機時間大大低于他們已習慣的、目前第二代電話的無線多媒體設備。日本電信運營商Docomo在推出其第三代電話時就此方面獲得了第一手經(jīng)驗。Docomo的第一批3G電話獲得的市場份額大大低于預期目標。目前,該公司正在提供經(jīng)過重新設計的電話,待機電池使用時間超過200小時,并且工業(yè)設計與日本現(xiàn)有的2G電話更為接近,這樣,市場才開始接受3G機型。
盡管聽起來似乎與想當然的看法相左,但一般說來多處理引擎的功耗確實低于單個處理核心設計,其電池壽命也更長。利用不同類型處理核心(RISC、DSP和硬件加速器)的各種功能,我們可以從性能和功耗角度就優(yōu)化的引擎給出合適的算法,而且可以根據(jù)需要啟用或關閉有關單元,從而進一步延長電池使用時間。
DSP使用復雜的指令,使其可在單個時鐘周期內(nèi)進行若干數(shù)學運算。RISC架構與指令集一般僅允許在一個周期內(nèi)僅執(zhí)行一次運算。因此,DSP處理MP3音樂或視頻流所需的周期遠低于RISC芯片。此外,DSP內(nèi)核由內(nèi)部存儲器支持,而非由高速緩存支持。就緊湊的DSP循環(huán)而言,內(nèi)部SRAM可提供兩大優(yōu)勢:確定性執(zhí)行和功耗節(jié)省。
RISC核心可執(zhí)行諸如用戶接口及視頻顯示管理等高中斷命令與控制功能,這比DSP的效率高得多,且其執(zhí)行這些操作的功耗也比DSP低,特別是當其不需要實時發(fā)生時更為如此。
硬件加速器既可增強性能,又能提高電源效率,但會降低靈活性和可升級性。TI為其Omap器件添加了上述加速器,以解決特定的專用加速任務,諸如Java、安全性和視頻、離散余弦轉換、反DCT、運動估計以及像素插值等。
設計人員將多處理引擎運用到其系統(tǒng)的核心,既可以滿足消費者的當前需求,又可以為將來的無線多媒體設備制定發(fā)展策略。
Avner Goren (avner@ti.com)現(xiàn)就任于 TI(位于達拉斯)的全球無線終端業(yè)務部。
評論