動態(tài)人臉識別技術(shù)難點與解決思路分析
作為一種比較新而且發(fā)展快的技術(shù),并不是所有人都對這門技術(shù)有較為清晰的認識和理解。比如人臉識別技術(shù)的算法是怎樣的,人臉識別技術(shù)目前發(fā)展到什么程度了,該技術(shù)對圖像類別及質(zhì)量有何要求,在實際應(yīng)用中又有那些分類等等,這些問題姚委員在講座中都一一為大家進行了比較細致的解答,并對動態(tài)人臉識別技術(shù)的系統(tǒng)構(gòu)成和優(yōu)勢、動態(tài)人臉識別與常規(guī)監(jiān)控的區(qū)別也進行了闡述。
如地鐵、高速公路卡口、車站卡口、超市反扒、邊檢、人群分析等等。因而很多廠家也生產(chǎn)了動態(tài)人臉識別技術(shù)的相關(guān)產(chǎn)品,如具有人臉識別功能的攝像機、人臉識別分析儀等等。但是林林總總的人臉識別產(chǎn)品給人以豐富的選擇的同時也帶來了相當大的選擇困擾,到底如何選擇人臉識別產(chǎn)品呢?哪些產(chǎn)品在人臉識別方面技術(shù)比較先進呢?
就這類問題,姚委員介紹了近期省公安局組織的人臉識別攝像機的測試,測試地點在東山口地鐵站某扶梯口進行。在該測試中,性能表現(xiàn)最好的攝像機為Basler黑白攝像機,在監(jiān)控名單庫1和庫2時采用低清算法的性能表現(xiàn)最好。在監(jiān)控名單庫3時采用高清算法的性能表現(xiàn)最好,誤報率在1%時漏報率維持在25%的實際可用水平。
參照國標《安全防范視頻監(jiān)控人臉識別系統(tǒng)技術(shù)要求》,該次測試監(jiān)控名單庫相當于C級(監(jiān)控名單庫容量為1萬至10萬人),參加測試人員也基本滿足于C級水平(注冊測試人員多于10人,每人至少通過2次,即不少于200人次通過;非注冊測試人員需為注冊測試人員通過次數(shù)的2倍以上)。在該次測試中,沒有達到一級的系統(tǒng)性能級別,二級系統(tǒng)性能級別有1個測試組合,三級的性能級別有28個測試組合,四級的性能級別有10個測試組合。(誤報率在5%的情況下,漏報率小于5%的為一級,5%~20%為二級,20%~50%為三級,50%~70%為四級)。
從實際測試來看,用戶的預期與當前的技術(shù)水平之間的差距還是比較大的。人臉識別技術(shù)在動態(tài)監(jiān)控應(yīng)用中面臨的壓力實際上也比較大。
1.用戶希望正確報警率要求高。而現(xiàn)實是理論上來說必須接受高誤報率。在技術(shù)方面,要達到高正確報警率,可以通過降低閾值來實現(xiàn),但是降低閾值的代價是:高誤報率。為了達到95%正確報警率,很多算法可能會產(chǎn)生300%或更高的誤報率。
2.用戶希望監(jiān)控庫足夠大,往往要求數(shù)萬或幾十萬,甚至上百萬的監(jiān)控名單,希望能捕到“大魚”?,F(xiàn)實是庫容量大就必須接受高誤報率。
3.用戶希望大規(guī)模成網(wǎng)建設(shè),能夠勾畫出監(jiān)控人員的活動軌跡?,F(xiàn)實是必須高投入,重新建專用網(wǎng)絡(luò)和相關(guān)硬件。
4.用戶希望盡量使用目前的監(jiān)控設(shè)備(攝像機和網(wǎng)絡(luò))?,F(xiàn)實是現(xiàn)有的攝像機清晰度不夠,圖像質(zhì)量差,用于場景監(jiān)控時視頻中人臉過小,網(wǎng)絡(luò)帶寬不夠等等造成無法使用現(xiàn)有設(shè)備。
5.用戶希望少產(chǎn)生誤報甚至不產(chǎn)生誤報?,F(xiàn)實是這樣就必將損失正確報警率和減少監(jiān)控庫容量,與用戶的想法相違。
動態(tài)人臉識別在應(yīng)用中遇到的挑戰(zhàn)
1.光照問題
面臨各種環(huán)境光源的考驗,可能出現(xiàn)側(cè)光、頂光、背光和高光等現(xiàn)象,而且有可能出現(xiàn)各個時段的光照不同,甚至在監(jiān)控區(qū)域內(nèi)各個位置的光照都不同。
2.人臉姿態(tài)和飾物問題
因為監(jiān)控是非配合型的,監(jiān)控人員通過監(jiān)控區(qū)域時以自然的姿態(tài)通過,因此可能出現(xiàn)側(cè)臉、低頭、抬頭等的各種非正臉的姿態(tài)和佩戴帽子、黑框眼鏡、口罩等飾物現(xiàn)象。
3.攝像機的圖像問題
攝像機很多技術(shù)參數(shù)影響視頻圖像的質(zhì)量,這些因素有感光器(CCD、CMOS)、感光器的大小、DSP的處理速度、內(nèi)置圖像處理芯片和鏡頭等,同時攝像機內(nèi)置的一些設(shè)置參數(shù)也將影響視頻質(zhì)量,如曝光時間、光圈、動態(tài)白平衡等參數(shù)。
4.丟幀和丟臉問題
需要的網(wǎng)絡(luò)識別和系統(tǒng)的計算識別可能會造成視頻的丟幀和丟臉現(xiàn)象,特別是監(jiān)控人流量大的區(qū)域,由于網(wǎng)絡(luò)傳輸?shù)膸拞栴}和計算能力問題,常常引起丟幀和丟臉。
視頻人臉識別監(jiān)控的最優(yōu)方案
1.使用更先進的高清攝像頭(3-5百萬)。
2.室內(nèi)均勻光線,或室外白天,無側(cè)光和直射光
3.人群面向同樣的方向,朝向相機的方向。
4.恰當?shù)谋O(jiān)控點,如走廊、巷子或安檢門/閘機口等(不要一群人同時出現(xiàn))。
5.相機與人臉的角度小于20°。
決定監(jiān)控系統(tǒng)性能的幾個主要因素:
1.模板庫的人數(shù):不宜大,包含關(guān)鍵人物即可。
2.經(jīng)過攝像頭的人數(shù):同時出現(xiàn)在攝像頭的人數(shù)決定了單位時間里的比對次數(shù)。
3.報警反饋時間:實時性越強,對系統(tǒng)性能要求越高。
4.攝像頭采集幀數(shù):幀數(shù)越高,人員經(jīng)過攝像頭前采集的次數(shù)越多,比對的次數(shù)也越多。
報警過濾機制
建立報警過濾機制是解決錯誤報警率高的有效方法,當監(jiān)控名單庫容量較大時,可以通過此方法,將錯誤報警率控制在千分之N的之內(nèi),使動態(tài)監(jiān)控走向?qū)嶋H應(yīng)用。
綜合來看,目前動態(tài)人臉識別技術(shù)的發(fā)展還遠遠達不到用戶的需求,圖像分析不盡人意,正確報警率普遍不高,誤報率與大容量之間似乎不可調(diào)節(jié),性價比較低等等問題似乎成為了動態(tài)人臉識別技術(shù)的絆腳石。但是,如何將這些絆腳石變?yōu)殇伮肥礁鲝S商及技術(shù)人員需要努力的目標。
評論