自動(dòng)駕駛之基于視覺信息的行人檢測(cè)
使用CCD/CMOS攝像頭的行人檢測(cè)
本文引用地址:http://butianyuan.cn/article/201806/382187.htm1.行人定位
檢測(cè)步驟的目的是找到行人可能出現(xiàn)的區(qū)域,然后在這些區(qū)域中完成行人識(shí)別和跟蹤過程。與車輛檢測(cè)類似,該領(lǐng)域的三種主要方法是基于先驗(yàn)知識(shí)的方法、基于立體視覺的方法和基于運(yùn)動(dòng)的方法。
許多方法使用了人體的形狀信息。這些方法一般不需要時(shí)間維度的信息,可以避免背景變化帶來的問題。另一方面,由于行人運(yùn)動(dòng)過程中身體形狀多變,會(huì)給這種方法帶來極大的計(jì)算量。例如,Curio等研究人員首先根據(jù)局部圖像熵值來獲取主動(dòng)區(qū)域,然后進(jìn)行形狀匹配。該方法使用Λ形狀來表示多變的腿部形狀信息。此外,它們使用逆透視映射來檢測(cè)短距離障礙物。最后,他們使用DAF( Dynamic Activation Field,DAF)策略來進(jìn)行下一步的處理,如下圖所示。
左圖是使用熵信息、輪廓信息和三維信息來得到DAF,然后進(jìn)行初次行人檢測(cè)的示例。右圖是行人行走模型的典型步態(tài),a-l是行人行走過程的12個(gè)階段。
另一種行人潛在區(qū)域的檢測(cè)方式是使用立體圖的方法,例如,有研究者使用基于多變量的判別分析方法來提取三維物體的特征,最終得到區(qū)分行人和周圍物體的三個(gè)有效變量。還有的研究者使用兩個(gè)車載攝像頭成對(duì)圖像中的位置差別來計(jì)算得到主體車輛與某特征點(diǎn)的距離。同時(shí),他們使用梯度方向光流法來檢測(cè)物體的運(yùn)動(dòng)情況。結(jié)合立體視覺方法和運(yùn)動(dòng)信息方法的優(yōu)勢(shì),他們提出了光流和深度約束法,該方法可以在多種情況下快速完成行人的檢測(cè)任務(wù)。
對(duì)于提取興趣區(qū)域而言,行人運(yùn)動(dòng)信息至關(guān)重要。基于運(yùn)動(dòng)信息的行人定位方法的一個(gè)優(yōu)勢(shì)是可以檢測(cè)被其他行人部分遺擋的行人。然而,該方法需要分析多幀的信息,這大大增加了運(yùn)行時(shí)間和計(jì)算量。同時(shí),該方法不能檢測(cè)靜態(tài)的行人,所以該方法常常用于行人識(shí)別過程。
2.行人識(shí)別
確定行人可能出現(xiàn)的區(qū)域后,需要進(jìn)行行人識(shí)別過程,從面去掉錯(cuò)誤的區(qū)域。近剛的研究分為兩類:基于運(yùn)動(dòng)的方法和基于人體形狀的方法。第一類方法考慮了時(shí)間維度的信息,試圖檢測(cè)行人運(yùn)動(dòng)的周期性特征。第二類方法沒有用圖像序列中的特點(diǎn),而是分析人體形狀信息。
運(yùn)動(dòng)模式,尤其是步態(tài)周期模式是區(qū)分行人和其他運(yùn)動(dòng)物體的一個(gè)重要信息。例如,有的研究者使用最大熵算法來研究行人運(yùn)動(dòng)所引發(fā)的圖像強(qiáng)度變化。他們利用運(yùn)動(dòng)過程分解得到的時(shí)間頻率和空間頻率信息,進(jìn)行模型的匹配過程。也有研究者使用時(shí)頻分析和帶 Harming窗的短時(shí)傅里葉變換來得到行走周期的變化信息。還有研究者使用自適應(yīng)時(shí)間延遲神經(jīng)網(wǎng)絡(luò)算法從輸入的圖像序列中提取局部時(shí)空特征,跟使用全局特征的方法不同,該方法在低計(jì)算量、低存儲(chǔ)需求的情況下,可以取得更好的識(shí)別別效果。
基于人體形狀的識(shí)別方法不僅可以識(shí)別運(yùn)動(dòng)行人,也可以識(shí)別靜態(tài)行人。該類方法的主要困難是光照變化、衣服變化、姿態(tài)變化和遮擋情況下的行人識(shí)別間題。
據(jù)悉,研究者Gavrila使用模板來匹配行人,然后調(diào)整這些配區(qū)域,最后使用徑向基函數(shù)對(duì)這些區(qū)域進(jìn)行分類。有研究者也使用了基于輪廓信息的四配方法。首先,基于拉普拉斯濾波來檢測(cè)邊沿,進(jìn)面得到二值邊沿圖。然后,利用距離變換將邊沿圖轉(zhuǎn)換為DT圖。最后,使用DT圖跟模板進(jìn)行匹配,小于特定閾值的被看作是真正的行人區(qū)域。為了減少計(jì)算量,有的研究者使用主動(dòng)搜索法完成后續(xù)的圖像差分搜索計(jì)算過程。有的研究者還指出之前的方法所提取的運(yùn)動(dòng)信息主要是攝像頭的運(yùn)動(dòng)而非行人的運(yùn)動(dòng),所以他們主要在靜態(tài)圖上完成行人識(shí)別過程,利用的是行人腿部的信息。有的研究者使用 Adaboost訓(xùn)練算法將一組分類準(zhǔn)準(zhǔn)確率略高于50%的弱分類器整合成一個(gè)準(zhǔn)確率接近100%的強(qiáng)分類器。有研究者提出單幀分類算法,將獲取的圖像分成許多子區(qū)域。然后在每個(gè)子區(qū)域上分別進(jìn)行分類操作,得到局部的判別結(jié)果,最后使用特征向量分類器整合這些局部結(jié)果。研究者Bertozzi等人在基于人體形狀的方法中引入蟻群優(yōu)化算法,得到行人存在的潛在區(qū)域。
許多單步法也使用了人體形狀信息。研究者Papagcorgiou等人使用小波模板定義了物體的形狀。小波模板包含了大量對(duì)應(yīng)于不同小波子集不同尺度上的規(guī)則區(qū)域。不同區(qū)域間的關(guān)系可以用小波系數(shù)來表示和加以限制。雖然不同區(qū)域的強(qiáng)度會(huì)有較大變化,但其關(guān)系卻變化不大。 Elein等研究人使用基于小波的特征提取算法和模板匹配方式來檢測(cè)行人。他們對(duì)訓(xùn)練圖像分塊后使用Haar小波變換提取相關(guān)特征,得到特征模板,然后將測(cè)試圖像的特征向量跟模板進(jìn)行匹配,得到檢測(cè)結(jié)果。
3.行人跟蹤
行人跟蹤能夠有效評(píng)估行人的運(yùn)動(dòng)過程,同時(shí)預(yù)測(cè)可能的碰撞情況,從而成為現(xiàn)階段的一個(gè)研究熱點(diǎn)。跟蹤過程中會(huì)綜合使用位置、速度、形狀和圖像序列中的其他特征??柭鼮V波、 Condensation算法和動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)也被用到該任務(wù)中。
借助行人的線性形狀模型,研究者Philomin等人使用 Condensation器來完成目標(biāo)的跟蹤任務(wù),最終使用準(zhǔn)蒙特卡洛方法將其轉(zhuǎn)化為高維問題, Gavrila等人使用特定的(α-β)跟蹤器來估計(jì)物體的狀態(tài)參數(shù)。跟蹤器本身是一個(gè)卡爾曼濾波器,其速度固定,帶有穩(wěn)態(tài)增益。由于檢測(cè)過程已經(jīng)成功解決了物體的形變問題,跟蹤器只需要完成定位任務(wù)。研究者Bertozzi等人使用卡爾曼濾波器來估計(jì)行人位置,計(jì)算行人運(yùn)動(dòng),進(jìn)而實(shí)現(xiàn)行人跟蹤。
使用紅外攝像頭的行人檢測(cè)
盡管大量研究人員使用視覺信息進(jìn)行行人檢測(cè),但該類方法在實(shí)際應(yīng)用中仍然存在許多困難。例如室外場(chǎng)景的復(fù)雜多變,行人外形因?yàn)榉?、姿態(tài)和運(yùn)動(dòng)面變化多端。由于車輛處于運(yùn)動(dòng)狀態(tài),背景場(chǎng)景的變化也不可避免。
為解決這些問題,近期的一些研究在智能車輛系統(tǒng)中使用了熱電堆和紅外傳感器。由于行人比周圍背景的溫度高,有研究人員使用熱電堆傳感器來探測(cè)視野中的物體?;谕瑯拥脑砝?,有研究者使用紅外傳感器進(jìn)行行人檢測(cè)??梢詮倪@些二推熱圖像中分析形態(tài)學(xué)特征和熱特征,進(jìn)面找到行人。
熱電堆和紅外傳感器的優(yōu)點(diǎn)是檢測(cè)過程簡(jiǎn)便易行。檢測(cè)率高于傳傳統(tǒng)的基于視覺的方法。下圖形象地說明了利用紅外圖像從周圍環(huán)境檢出行人的過程。此外,基于紅外攝像頭的方法似乎是唯一可靠的夜間行人檢測(cè)方法
立體紅外攝像頭系統(tǒng)的預(yù)處理過程
a)最初的輸人圖 b)注意力焦點(diǎn)區(qū)域
熱電堆和紅外傳感器的另一個(gè)優(yōu)點(diǎn)是不需要照亮周圍環(huán)境,就可以被動(dòng)地完成行人檢測(cè)任務(wù)。因此,它們對(duì)環(huán)境不產(chǎn)生額外的干找,是一種環(huán)境友好型的傳感器。紅外攝像頭的唯一缺點(diǎn)是其成本較高,這限制了它的應(yīng)用范圍。今后,如何使用低成本的車載紅外攝像頭完成行人檢測(cè)將成為一個(gè)熱點(diǎn)問題。
評(píng)論