H.264算法的DSP移植與優(yōu)化
2.3 ICT/反ICT和量化
原始的ICT/IICT和量化算法不能夠充分發(fā)揮DSP的并行優(yōu)勢(shì),以至于8個(gè)功能單元在編碼的過(guò)程中都處于閑置狀態(tài),存儲(chǔ)器中的數(shù)據(jù)被頻繁重復(fù)的訪問(wèn)也導(dǎo)致了DSP運(yùn)行效率的降低。在圖4所示中,提出對(duì)于ICT/IICT和量化部分的算法圖例,一個(gè)宏塊中所有基于4×4塊的IC-T/IICT變換都能夠同時(shí)執(zhí)行,這充分利用了DSP的8個(gè)功能單元。實(shí)驗(yàn)結(jié)果表明,經(jīng)量化后,計(jì)算一個(gè)ICT/HCT的4×4塊僅僅需要12個(gè)平均周期。這一優(yōu)化不但提高了算法的速度又顯著地降低了碼流大小,使視頻信號(hào)的實(shí)時(shí)處理成為可能。本文引用地址:http://butianyuan.cn/article/150854.htm
3 實(shí)驗(yàn)結(jié)果分析
在600 MHz的TMS320DM643平臺(tái)上,通過(guò)開(kāi)發(fā)軟件CCS載入開(kāi)源代碼X264構(gòu)架對(duì)CIF格式的5個(gè)視頻序列(Akiyo,News,F(xiàn)oreman,F(xiàn)ootba-ll,Mobile)進(jìn)行了相關(guān)實(shí)驗(yàn)。在這5個(gè)視頻序列中,Akiyo和News序列有較低的運(yùn)動(dòng)級(jí)別,背景變化畫面人物運(yùn)動(dòng)幅度不大,而Foreman和Fo-otball有高的運(yùn)動(dòng)級(jí)別,運(yùn)動(dòng)劇烈有場(chǎng)景切換,最后一種Mobile序列則有復(fù)雜的背景。表1列出了在量化步長(zhǎng)(QP)為25的情況下,原始H.264編碼器和優(yōu)化后的H.264編碼器之間的對(duì)比結(jié)果。從中可以看出,原始的編碼器的編碼速度是2~3 f/s,而優(yōu)化后的編碼速度是前者的10倍多。
4 總結(jié)
本系統(tǒng)采用TMS320DM643作為的核心處理器,這款DSP芯片主要是為實(shí)現(xiàn)低功耗、高性能而專門設(shè)計(jì)的定點(diǎn)DSP芯片。它具有高度靈活的可操作性和高速的處理能力,先進(jìn)的多總線結(jié)構(gòu),主要應(yīng)用在通信、數(shù)據(jù)采集等系統(tǒng)中,特別在實(shí)時(shí)性方面效果最佳。
本設(shè)計(jì)借助開(kāi)源代碼X264在CCS開(kāi)發(fā)平臺(tái)進(jìn)行試驗(yàn),測(cè)試了編碼優(yōu)化前后的幀率等各種性能,旨在尋求更高效的視屏編碼算法。
評(píng)論