新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設計應用 > 用于便攜式多媒體SoC的視頻處理方案

用于便攜式多媒體SoC的視頻處理方案

作者: 時間:2013-01-04 來源:網(wǎng)絡 收藏

方案的主要優(yōu)點如下:

1. 支持多標準。這些處理器支持各種視頻標準,以及各種分辨率和幀率。所有的參數(shù)可以通過軟件來定義。同一硬件平臺可以運行幀率為15fps的QVGA分辨率,也能運行幀率為30fps的D1分辨率;

2. 音視頻同步。DSP能夠處理不同種類的音頻編碼,并能處理音視頻間的同步。當同步在DSP上進行時,多媒體任務就可以從CPU上卸載,或者系統(tǒng)中可以根本不用;

3. 非視頻操作的復用。除了之外,還能夠執(zhí)行很多其它工作;

4. 支持下一代產品。采用同一平臺可以支持未來的各代產品,這就使得SoC設計師能夠很容易地支持其消費產品路線圖。

該方案同樣也具有以下缺點:硅片面積大-可編程性將不可避免地需要較大的裸片面積。由于能夠在之外執(zhí)行多種其它任務,從而導致了一些并不用于的功能模塊。不過,由于使用而增加的面積可以通過從系統(tǒng)中去掉CPU來彌補,或者可以采用只能帶低處理載荷的小規(guī)模CPU。

對用于視頻處理的通用處理器進行加速

有以下幾種方法可以幫助提高通用處理器的效率(性能):

1. 采用專用指令來更好地利用DSP引擎;

2. 從DSP上卸載所有的數(shù)據(jù)傳輸操作,使其專門用于視頻處理;

3. 算法加速。利用獨特的軟件算法來旁路掉常規(guī)的詳細運算。

視頻指令——DSP中的多媒體建構模塊

專用的多媒體指令能夠大大加速純軟件多媒體實現(xiàn)。下面給出了一部分指令和程序結構,他們可以被嵌入到通用DSP中,專用于加速多媒體功能:

1. 絕對差分。用于運動估計和解鎖濾波器;

2. 四分平均。用于1/2或1/4像素運動補償;

3. 分類字節(jié)。用于非線性濾波器和預/后處理;

4. 字節(jié)加/減。用于DCT、運動重建、1/4像素濾波器、對稱濾波器、運動估計和解鎖濾波器;

5. 排列數(shù)據(jù)剪輯(對字節(jié)或字的動態(tài)范圍)。用于環(huán)內解鎖濾波器。

下面是用于H.264環(huán)內解鎖濾波器的代碼例子,采用了專用的4路SIMD視頻指令(CEVA-X1620匯編代碼):

上面的樣本代碼描述了在視頻后處理中將VLIW與SIMD結合在一起的用法。該例中,'4b' SIMD指令用于操作4個不同且相互獨立的字節(jié)數(shù)據(jù)。在上面的樣本代碼中有兩個指令數(shù)據(jù)包都包括有5個并行指令(VLIW),其中4個是4向SIMD指令,可在一個單周期中實現(xiàn)17個并發(fā)操作。

DSP卸載——數(shù)據(jù)管理引擎

幾乎在所有多媒體應用的SoC設計中都有一個DMA引擎,它最重要的任務是執(zhí)行片內外絕大多數(shù)數(shù)據(jù)的傳遞,同時訪問所有可用的資源,包括存儲器、I/O口、外設和總線橋。這樣,DMA引擎就能從DSP上卸載部分數(shù)據(jù)管理任務,從而使得DSP能集中于多媒體處理功能。

二維和三維DMA通道能夠收集存在存儲器不同位置上的分散數(shù)據(jù)(來自不同的幀),并將其作為一個單數(shù)據(jù)塊送入DSP進行處理。

在圖5中,三維DMA通道在無需DSP任何干預的條件下,可以允許DMA收集宏數(shù)據(jù)塊。


圖5:數(shù)據(jù)管理引擎實例。

通過編程DMA在3個分離維度上的不同步幅和不同單元數(shù)量,下面的數(shù)據(jù)傳送可以完全獨立于DSP實現(xiàn)。

算法加速

可以通過純算法來實現(xiàn)額外的加速,這樣做可以在視頻處理流水線中產生一條“捷徑”,并且DSP功耗也較低。這種加速算法的一個例子是來自CEVA公司基于先進圖形識別算法的FST專利技術。利用該技術可以避免多媒體編解碼構件模塊的“強力(brute-force)”軟件實現(xiàn),從而獲得更快的編解碼實現(xiàn),而且功耗也較低。

該加速算法能夠使視頻處理性能大大加速,相對于傳統(tǒng)的編解碼實現(xiàn)方案來說,性能最大可以提高到十倍。

CEVA Mobile-Media2000——將上述所有優(yōu)點集于一身

CEVA Mobile-Media2000的方案是一個基于通用處理器的多媒體平臺。它利用上述各項技術開發(fā)出了一個真正的多媒體引擎,能夠在視頻處理以外處理多種任務。運行頻率為370MHz(在TSMC 90nm G上,最壞的工作和處理條件),Mobile-Media2000能夠以低于150MHz的頻率解碼30幀、D1分辨率的H.264 BP。這是依靠專用的視頻指令和CEVA的專利技術——軟件加速算法(FST)來實現(xiàn)的。

SoC中其它任務可以復用Mobile-Media2000的能力對用戶來說也是極其有益的。相同的內核架構可以被用來研發(fā)各類市場上的不同產品,例如具有移動電視功能的個人導航設備,或具有WiMAX連接能力的便攜式多媒體播放設備。這些設備都可以在SoC中復用相同的CEVA DSP處理器,來實現(xiàn)多種不同的功能,從而降低成本并平衡研發(fā)投資,在不同的市場和應用中獲取增量收入。

Mobile-Media2000基于CEVA-X1620 DSP核,并整合了硬件平臺,即一整套優(yōu)化的編解碼和應用框架層。CEVA-X1620是一個開放架構DSP,用戶只需通過軟件就可以方便地差異化或定制他們的移動多媒體方案,不需要任何的硬件升級或重新流片。

本文小結

隨著新的和更多標準的引入,在研發(fā)帶有多媒體功能的SoC時所遇到的挑戰(zhàn)正變得更加復雜。有許多方案可以用來處理多媒體。而所有這些方案可以被劃分為三大類:硬件加速器類,視頻協(xié)處理類和通用處理器類。CEVA公司推出的基于通用處理器的Mobile-Media2000方案,具有專用的視頻指令和一個功能強大的三維DMA,并利用專用的FST,因而使得這一方案成為能夠適應當今視頻處理多樣性和多任務環(huán)境的最佳選擇。


上一頁 1 2 3 下一頁

評論


相關推薦

技術專區(qū)

關閉