DSP 在數(shù)字視頻處理技術(shù)中的應(yīng)用
數(shù)字?jǐn)z錄機(jī)/數(shù)碼相機(jī)
這兩領(lǐng)域是消費類數(shù)字圖像的典型應(yīng)用,一般來講,前者強(qiáng)調(diào)移動圖像的攝錄,后者追求靜止圖像的高質(zhì)量。如果處理芯片的可編程性足夠強(qiáng),這兩者完全可以兼顧。這可以帶來兩個好處,第一,可以開發(fā)出平衡這兩方面需求的產(chǎn)品,既可以錄像又可以拍出高質(zhì)量的照片;第二,考慮到成本的影響,仍然開發(fā)不同的產(chǎn)品,但可以共用一套圖像處理方案,這樣便減少了開發(fā)的重復(fù)投資。
除了可編程性,這兩應(yīng)用對芯片的要求就是低功耗,因為它們都是便攜式的。其它的要求就是對移動存儲的支持。
個人數(shù)字視頻播放器_隨身看/點播機(jī)
這類設(shè)備都是完成視頻解碼,前者更強(qiáng)調(diào)便攜性而后者則強(qiáng)調(diào)節(jié)目源的豐富。
在這里處理性能并不是第一位要考慮的,整個系統(tǒng)的能耗顯得更加關(guān)鍵。另一方面,要求芯片的接口比較豐富以支持LCD顯示屏,CFC或其它存儲卡,或者硬盤接口。
這些視頻應(yīng)用總體上可以分為兩大類:一類是高性能,要求多通道處理或多編碼制式,或追求高圖像質(zhì)量,同時由于技術(shù)的不斷發(fā)展,它又需要較強(qiáng)的可編程性支持未來的技術(shù)發(fā)展;另一類是可便攜應(yīng)用,強(qiáng)調(diào)的是小型化,低功耗,支持多種移動存儲接口以及USB, 1394或其它高速總線。
針對應(yīng)用選擇合適的芯片
上文已提到,這些應(yīng)用大致上可以分為兩類,高性能和可便攜。TI針對這些市場都有相應(yīng)的產(chǎn)品。
首先我們看一下高性能的應(yīng)用。
高性能視頻應(yīng)用
在這類市場里,通常數(shù)據(jù)運算量極大,比如僅考慮這類圖像運算中最基本的運算離散余弦轉(zhuǎn)換(DCT),對于單通道30幀的VGA視頻,它就需要每秒大約6千萬次的乘加運算。這還僅是其中非常一小部分。
要完成這么艱巨的任務(wù),我們就不得不看一看TI的單核性能最強(qiáng)的DSP核C64x,一個主頻可以達(dá)到720MHz,峰值運算能力達(dá)到5760MIPS的32位DSP。除了這些無與倫比的主頻和通用乘加性能,C64的核更增強(qiáng)了對8位和16位操作的支持,而圖像領(lǐng)域絕大多數(shù)運算是在8位的基礎(chǔ)上。例如,C64x增加了很多專用指令,如SUBABS4,同一機(jī)器周期里可同時完成四次減法和求絕對值, 還有諸如BITC4,AVGx,MPYHLx,DOTP2等等。這些增強(qiáng)使得運動補(bǔ)償平均提升達(dá)七倍,而四重8位運算則使得每時鐘周期運動估計的8x8最小絕對差(MAD)的計算能力提高到7.6倍。這些都使以C64x為核心的DSP成為高性能視頻應(yīng)用的選擇。
我們來具體看一下,例如上文提到的視頻局端設(shè)備,由于它是一局端設(shè)備,挑戰(zhàn)在于多路多碼率以及多制式,因而要求片上內(nèi)存要大已放下足夠的多路數(shù)據(jù)和各種譯碼器,同時也需要與控制主機(jī)相連。由此TMS320C6415就是一個不二的選擇。它主頻可以跑到720MHz,有8兆位的片上內(nèi)存,有PCI接口。圖一就是一個C6415為核心的局端設(shè)備框圖。
圖一,視頻局端設(shè)備
相類似的應(yīng)用還有無線媒體網(wǎng)關(guān)。
對于客戶端設(shè)備,用TMS320C6415就不是那么合適了。例如IP視頻網(wǎng)絡(luò)電話,它通常是單路的,因而不需要太大的片上內(nèi)存,但它的接口卻要求很多。例如他們一般都是直接視頻輸入輸出,或從有線電視或從攝像頭到LCD,又要求接以太網(wǎng)。這里,我們就需要一個內(nèi)存夠用(因而便宜),支持通用視頻標(biāo)準(zhǔn)如BT656,還帶有以太網(wǎng)口的處理芯片TMS320DM642。
TMS320DM642是針對這類客戶端市場的數(shù)字信號處理芯片,TI 出了一系列類似的處理芯片,成為數(shù)字媒體(Digital Media)處理器。DM642帶有三個視頻口,均可輸入或輸出,支持BT656,百兆以太網(wǎng)口,多路音頻串口,66MHz PCI等等,可支持四路D1圖像30幀的MPEG-2的實時壓縮。以它為中心的IP視頻電話結(jié)構(gòu)非常簡潔,如圖二
圖二 IP視頻電話方案
相類似的高性能視頻應(yīng)用還有機(jī)頂盒、數(shù)字視頻播放器/點播機(jī)和網(wǎng)絡(luò)相機(jī)/監(jiān)控系統(tǒng),它們都可以以DM642為中心將上各自特需的硬件,形成不同的應(yīng)用。這也最大程度上發(fā)揮了開發(fā)投資的價值,一套方案上的經(jīng)驗可以為其它所有方案利用。
可便攜設(shè)備的視頻應(yīng)用
這類設(shè)備中最典型的應(yīng)用就是數(shù)字?jǐn)z錄機(jī)/數(shù)碼相機(jī),除了共有的視頻圖像處理外,它們最大的考慮就是功耗。這些都是電池驅(qū)動的,因而能量消耗必須有所限制。這種情況下C64x核的處理芯片就很不合適,如一顆C6415跑在600MHz時功耗超過1瓦。
幸好TI在功耗上很有研究,她的C5000是專門針對低功耗計算市場的,特別是C55x,創(chuàng)造了業(yè)界耗電最低紀(jì)錄,0.22mW每MIPS!C55x功耗低,性能也不差,它具有雙MAC雙ALU結(jié)構(gòu),200MHz的主頻可以達(dá)到400MIPS的處理能力!低功耗高性能使得C55x系列DSP成為便攜式消費類電子的最佳選擇。
對于我們今天談到的視頻圖像應(yīng)用更重要的是TI 有系列專門針對便攜媒體市場的處理芯片。
TMS320DSC21/DSC25/DM270/DM310,這系列芯片的共同特點都是雙核結(jié)構(gòu)RISC的MCU核加上C5000的DSP核。運算主要有DSP完成,同時針對圖像處理使用了硬件加速。所有這些芯片都有圖像擴(kuò)展協(xié)處理器iMX 和變長編解碼協(xié)處理器VLCD,除了DSC21外都有量化反量化協(xié)處理器QIQ。其中iMX是多個并行乘加器來加速那些運算量極大的圖像處理算法,例如DCT運算。VLCD是用來進(jìn)行Huffman編解碼的,它DSP從不停的跳轉(zhuǎn)中解脫出來。QIQ則是進(jìn)行量化和反量化,由于量化是執(zhí)行除法運算,DSP沒有專門的除法指令,只能用移位指令實現(xiàn),相當(dāng)耗資源。
有了這些協(xié)處理器,DM系列芯片的處理能力也向當(dāng)?shù)貜?qiáng),例如DM310可以實現(xiàn)D1圖像(720x480)30幀每秒的實時MPEG-4編解碼。
圖三,數(shù)碼相機(jī)
圖三即為一個DM310為基礎(chǔ)的系統(tǒng)。
芯片之外
看到這里,大家可以看到,這些應(yīng)用都有一些共同點,也會自然而然地想到,不同的客戶用同一套芯片開發(fā)同一種應(yīng)用會不會造出同樣的東西?這點勿須擔(dān)心,DSP充分的可編程性是差異化的保證。同時為了更好地集中于差異化,那些標(biāo)準(zhǔn)件,如各種碼制的編解碼器,也可以同第三方獲得。TI圍繞DSP完備而成熟的開發(fā)環(huán)境也是縮短開發(fā)周期迅速占領(lǐng)市場的保證。
評論