視偵檢索技術(shù)——視頻解碼研究
一、認(rèn)識(shí)視偵檢索
本文引用地址:http://butianyuan.cn/article/201612/332893.htm1、視偵檢索定義
視頻偵查檢索技術(shù)(簡(jiǎn)稱視偵檢索)是指利用高性能計(jì)算機(jī)對(duì)視頻數(shù)據(jù)進(jìn)行快速處理,對(duì)視頻數(shù)據(jù)幀進(jìn)行檢測(cè)、分類(lèi)、識(shí)別、跟蹤,遍歷所有數(shù)據(jù)幀后即可得到所有運(yùn)動(dòng)目標(biāo)的軌跡、特征信息,辦案民警可根據(jù)時(shí)間、位置、行進(jìn)方向、嫌疑人衣著等信息對(duì)視頻進(jìn)行過(guò)濾,找出符合特征的視頻片段,快速?gòu)闹蝎@取更多信息,提升效率,節(jié)省人力成本。
2、視偵檢索的意義
視頻監(jiān)控具有客觀詳實(shí)性、反復(fù)使用性、信息拓展性等特點(diǎn),這些特點(diǎn)使其在偵查破案、打擊犯罪中發(fā)揮著不可替代的作用。目前,監(jiān)控?cái)z像頭已遍布中國(guó)大地的每個(gè)街頭,晝夜不停地監(jiān)視和錄像。
視頻監(jiān)控在改善社會(huì)治安的同時(shí),也產(chǎn)生了海量視頻信息。在海量的視頻中查找我們需要的信息,無(wú)疑是大海撈針,給視頻監(jiān)控帶來(lái)巨大的挑戰(zhàn)。傳統(tǒng)的人海戰(zhàn)術(shù),因效率低下以及容易錯(cuò)過(guò)關(guān)鍵目標(biāo),容易使視頻監(jiān)控處于“監(jiān)而不控”的狀態(tài)。如何化解這一危機(jī),是現(xiàn)代安防的熱點(diǎn)和難點(diǎn)。視頻檢索和視頻濃縮是解決這一問(wèn)題的關(guān)鍵,其中視頻檢索技術(shù)已經(jīng)逐漸成熟并開(kāi)始走向市場(chǎng)。
3、視頻數(shù)據(jù)來(lái)源
視頻數(shù)據(jù)來(lái)源非常廣泛,常見(jiàn)的有天網(wǎng)視頻、路口卡口、小區(qū)監(jiān)控、門(mén)店監(jiān)控等各種固定監(jiān)控探頭,其中視頻數(shù)據(jù)的格式和圖像制式也是多種多樣,監(jiān)控設(shè)備硬件出自不同廠商,暫時(shí)還沒(méi)有統(tǒng)一的標(biāo)準(zhǔn)。
二、視頻解碼是視偵檢索的前提
視頻解碼是視偵檢索的前置條件,其解碼速度直接對(duì)檢索速度產(chǎn)生影響。檢索是非常耗時(shí)的一種操作,經(jīng)測(cè)試,對(duì)高清(1920x1080、1280x720)視頻直接檢索時(shí),通常只能達(dá)到實(shí)時(shí)的速度,這顯然對(duì)檢索的意義不大。怎樣盡可能快,盡可能少漏檢目的是檢索算法改進(jìn)的方向。目前,在暫時(shí)沒(méi)有更好方法的情況下,對(duì)視頻進(jìn)行快速解碼和對(duì)圖像幀進(jìn)行縮放,以減少檢索算法的數(shù)據(jù)輸入,是一種非常有效的方法。
三、視頻解碼具體解決方案
針對(duì)視頻解碼,數(shù)據(jù)恢復(fù)四川省重點(diǎn)實(shí)驗(yàn)室科研人員提供的具體解決方案是:使用統(tǒng)一API的方式實(shí)現(xiàn)視頻解碼框架,對(duì)輸入輸出參數(shù)和數(shù)據(jù)類(lèi)型進(jìn)行統(tǒng)一。具體來(lái)說(shuō),又分為通用格式解碼和專(zhuān)用格式解碼:
1、通用格式解碼
FFmpeg是一套可以用來(lái)記錄、轉(zhuǎn)換數(shù)字音頻、視頻一套開(kāi)源軟件,它包含了非常先進(jìn)的音頻、視頻編解碼庫(kù),并具體高可移植性,多款視頻播放軟件中使用了其技術(shù)。
這里,我們僅需要使用它的視頻解碼功能,經(jīng)測(cè)試,F(xiàn)Fmpeg目前版本已經(jīng)支持常用的計(jì)算機(jī)視頻格式asf/avi/rm/flv/mkv/mov/mp4/3gp等,所以與其兼容的監(jiān)控視頻都可以采用FFmpeg來(lái)進(jìn)行解碼處理,并將解碼輸出圖像進(jìn)行縮放處理。
經(jīng)測(cè)試1080p視頻圖像縮放0.4倍時(shí)處理時(shí)間與漏檢率之比是最好的,速度約12倍左右;視頻圖像縮放0.25倍時(shí),速度約為正常播放時(shí)的20倍左右,1小時(shí)視頻可以在3分鐘內(nèi)檢索完畢。720p視頻0.25倍時(shí)可達(dá)48倍檢索速度,640x480的視頻可達(dá)80倍檢索速度。
關(guān)鍵C++代碼:
//在上下文是指定輸出高寬*倍數(shù)
swScaleCtx = sws_getContext(
videoCodecCtx->width, videoCodecCtx->height, //視頻幀高寬
videoCodecCtx->pix_fmt, //視頻幀數(shù)據(jù)格式
videoCodecCtx->width * outZoom, videoCodecCtx->height * outZoom, //輸出高寬
dstFormat, //輸出幀格式,使用PIX_FMT_YUV420P
SWS_POINT, NULL, NULL, NULL);
2、專(zhuān)用格式解碼
對(duì)于那些與計(jì)算機(jī)視頻不兼容的監(jiān)控廠商專(zhuān)用視頻格式,只能使用廠商提供的SDK進(jìn)行解碼,使用統(tǒng)一的解碼框架,統(tǒng)一輸入輸出參數(shù)和數(shù)據(jù)類(lèi)型,其中圖像縮放部分可以使用FFmpeg提供的轉(zhuǎn)換方法,因?yàn)槠溽槍?duì)CPU多媒體指令集進(jìn)行了優(yōu)化,效率非常高。
四、總結(jié):
目前,市場(chǎng)上主要采用FFmpeg解決方案進(jìn)行視頻解碼,而數(shù)據(jù)恢復(fù)四川省重點(diǎn)實(shí)驗(yàn)室科研人員提供的方案,使用統(tǒng)一API的方式實(shí)現(xiàn)視頻解碼框架,輸入輸出參數(shù)和數(shù)據(jù)類(lèi)型是統(tǒng)一的,方便擴(kuò)展新的第三方監(jiān)控廠家專(zhuān)用視頻格式,而且方案對(duì)解碼圖像做了縮放處理,使解碼過(guò)程變得更高效。目前,此項(xiàng)方案已經(jīng)成功應(yīng)用在了效率源VIE視頻全能提取系統(tǒng)、VICP視頻偵查應(yīng)用平臺(tái)等產(chǎn)品中,取得了很好的效果。
評(píng)論