通過開源API進(jìn)行DSP視頻處理
基于DaVinci技術(shù)的DM644x器件上ARM926的MMU(存儲(chǔ)器管理單元)具有虛擬/物理尋址能力。然而,C64x+DSP內(nèi)核只能夠處理物理地址。因此,用于DSP處理的輸入和輸出緩沖器必須駐存在物理上連續(xù)的存儲(chǔ)器中。
虛擬到物理地址的轉(zhuǎn)換由編解碼引擎處理。通過復(fù)用(指針指向)某些由驅(qū)動(dòng)器分配的緩沖器,可獲得物理上連續(xù)的存儲(chǔ)器,這里使用了Linux中的一些技術(shù),比如dma_alloc_coherent(),來在內(nèi)核空間中分配這類存儲(chǔ)器。由TI開發(fā)的庫/內(nèi)核模塊CMEM,允許從用戶空間應(yīng)用來分配物理上連續(xù)的存儲(chǔ)器。
例如,我們利用前面提到的CMEM驅(qū)動(dòng)器來分配物理上連續(xù)的“輸出”緩沖器。編解碼引擎對(duì)幀進(jìn)行解碼,并把解碼后的幀放在輸出緩沖器中。
接下來,指向輸出緩沖器的指針被傳遞給fbvideosink(通過 GstBuffer)。這個(gè)videosink必須把解碼后的數(shù)據(jù)memcpy(復(fù)制)到幀緩存中,然后才能顯示。由于memcpy操作是一種成本很高的GPP使用,這種方法使得ARM 和DDR接口的負(fù)載很重,因而增加了功耗,且效率極低。
這種技術(shù)對(duì)非常小的緩沖器是可行的,但在開發(fā)人員使用D1(和更高)大小的緩沖器時(shí),將開始降低系統(tǒng)性能。一種更有效的方案是復(fù)用已經(jīng)驅(qū)動(dòng)器分配了的物理連續(xù)緩沖器,并在編解碼器引擎和videosink插件之間把指向這些緩沖器的指針來回傳遞。
評(píng)論