基于3G視頻的駕駛員疲勞狀態(tài)檢測方法
摘要 疲勞駕駛已成為交通事故發(fā)生的主要原因之一。文中提出了一種基于3G視頻的人眼疲勞檢測方法。通過DirectShow技術(shù)對視頻流抓取視頻幀,采用膚色聚性特征進(jìn)行人臉定位,基于灰度信息進(jìn)行人眼定位與追蹤,并采用Perclos方法進(jìn)行疲勞判斷。通過此方法,可以及時(shí)了解駕駛者的疲勞狀態(tài),有效預(yù)防疲勞駕駛。
關(guān)鍵詞 3G視頻;車輛監(jiān)控;疲勞檢測
疲勞駕駛是司機(jī)在駕車過程中介于意識清醒和進(jìn)人睡眠的一種非正常狀態(tài),是導(dǎo)致交通事故的主要原因之一。由于車輛流動性強(qiáng)、任務(wù)區(qū)域廣、安全隱患多、風(fēng)險(xiǎn)責(zé)任大,并缺乏科學(xué)有效的監(jiān)管手段,近年來疲勞駕駛所造成的車輛事故時(shí)有發(fā)生。通過3G視頻監(jiān)控系統(tǒng)對駕駛員面部狀態(tài)的實(shí)時(shí)監(jiān)控,一旦發(fā)現(xiàn)駕駛員眼睛疲勞狀態(tài)立即進(jìn)行報(bào)警,能有效減少駕駛員疲勞所造成的交通事故,解決車輛管理中“看不見、聽不著、控不了”的難題。
基于3C視頻的疲勞檢測主要包括視頻流解壓抓幀、人臉定位、人眼定位追蹤和疲勞判斷4個(gè)部分。文中提出一種基于膚色檢測及灰度信息的疲勞檢測算法,能有效用于3G車輛視頻監(jiān)控系統(tǒng)。
1 視頻采集及預(yù)處理
文中使用車輛內(nèi)部的3G視頻監(jiān)控裝置來進(jìn)行視頻采集,位于駕駛員頭頂正面上方,拍攝在駕駛過程中多種光照環(huán)境下、不同姿勢和精神狀態(tài)的駕駛員視頻。
視頻預(yù)處理主要采用DirectShow技術(shù)進(jìn)行視頻流解壓抓幀。利用DirectShow的媒體監(jiān)測器對象(Media Detector Object),將拍攝到的駕駛員視頻文件進(jìn)行視頻流解壓縮,實(shí)時(shí)在線地從視頻流中提取指定的幀視頻圖像,并為后續(xù)的駕駛員眼睛狀態(tài)檢測提供位圖數(shù)據(jù)。
媒體監(jiān)測器不僅能獲取媒體源文件的格式信息,也可以通過捕獲過濾器從一個(gè)媒體文件的視頻流中捕獲一幅位圖圖像,通常獲得的位圖是24位RGB格式。通過搜索媒體文件,媒體監(jiān)測器可以獲得這個(gè)文件中任意點(diǎn)的圖像。應(yīng)用程序通過調(diào)用IMediaDet接口與Media Detector進(jìn)行交互。接口包含了一些方法能夠從媒體源文件中提取重要信息,比如媒體類型、幀速率甚至是視頻流的單個(gè)幀。媒體監(jiān)測器將過濾器視圖封裝到對象中,從而使應(yīng)用程序屏蔽掉與視圖相關(guān)的一些細(xì)節(jié)。
在疲勞檢測中,用得到的第一幅圖像檢測人臉和眼睛,如若失敗則從下一幅圖像檢測直至成功,并將得到的眼睛圖像作為動態(tài)模板對以后的序列進(jìn)行眼睛追蹤,若失敗則重新定位人眼。
2 基于膚色檢測的人臉定位
膚色是人臉最為顯著特征之一,對于彩色圖像,膚色是圖像中相對集中、穩(wěn)定區(qū)域。膚色信息可將人臉和背景區(qū)域分開。研究表明,在除去亮度的色度空間中,不同人臉膚色分布具有聚類性。所以膚色的差異主要取決于色彩信息,而非亮度信息?;谀w色檢測方法利用人的膚色中Cr和Cb的聚類特性,在YCbCr色彩空間中檢測圖像中是否存在人臉。這種算法檢測速度快,并且受人臉旋轉(zhuǎn)或側(cè)轉(zhuǎn)的影響較小。
膚色分割可以采用的色彩空間有很多種。其中YCbCr色彩空間具有與人類視覺感知過程類似的構(gòu)成機(jī)理,能很好地反映膚色分布,并反映出膚色聚類特性。YCbCr模型與RGB模型的變換公式如下
通過對人臉數(shù)據(jù)庫中和人臉視頻圖像中黃種人人臉膚色點(diǎn)的采樣進(jìn)行分析,可得到實(shí)驗(yàn)環(huán)境下膚色在YCbCr空間中的聚類,用數(shù)學(xué)表達(dá)式確定膚色范圍的方法進(jìn)行膚色建模??筛鶕?jù)Chai采用YCbCr顏色空間的CbCr平面,如果某像素點(diǎn)的顏色落入Cr=[133:173]和Cb=[77:127]范圍內(nèi),就認(rèn)為是屬于膚色像素,否則就認(rèn)為是非膚色像素。確定為膚色區(qū)域后,將其認(rèn)定的膚色區(qū)域的R、G、B值均設(shè)定為255,在圖像中顯示為白色;非膚色區(qū)域設(shè)y=R=G=B=0,即在圖像中顯示為黑色。隨后對得到的圖像采用自適應(yīng)閾值二值化。
式中,g(t)為灰度值為t的像素個(gè)數(shù);G為非零像素個(gè)數(shù)。最后利用投影技術(shù)及頭部的特點(diǎn)確定人臉上下和左右邊界。由于眼部處于人臉上半部分,故只需保留圖像的3/5。
3 基于灰度信息的人眼定位
眼睛區(qū)域與周圍區(qū)域相比,具有灰度值較低且灰度變化率較大的特點(diǎn)。因此可基于眼睛圖像的灰度信息進(jìn)行定位。
評論