基于樹形檢測器的多標(biāo)志識別
摘要:本文首先采用了soft cascade結(jié)構(gòu)的頭結(jié)點(diǎn)分類器檢測出大量的背景圖像;然后,通過一個貪婪搜索算法構(gòu)建分叉樹分類器,將不同的臺標(biāo)分類到正確的檢測線路中;最后,使用普通cascade結(jié)構(gòu)來得到更加準(zhǔn)確的識別結(jié)果。實驗結(jié)果,本文的檢測器可以獲得較高的識別準(zhǔn)確度。
關(guān)鍵詞:soft cascade,joint boosting,canny算子
0 引言
自動的電視臺標(biāo)檢測和識別已經(jīng)在多媒體領(lǐng)域獲得非常高的關(guān)注度。如今,多數(shù)的手機(jī)都具備了攝像頭功能,所以人們可以隨心所欲地拍攝各種事物,然后利用各種算法去分析處理獲得的圖像。本文中,展示一個系統(tǒng)一利用手機(jī)內(nèi)置攝像頭幫助人們識別電視頻道信息。日常觀看的電視頻道就有幾十個不同的臺標(biāo),所以可以把這個問題看作是一個多類檢測問題,而單類的檢測即識別,最終就實現(xiàn)了多類識別。
對于單類檢測問題,Viola和Jones給出了state-of-the-art算法。他們先訓(xùn)練了一系列節(jié)點(diǎn)分類器去檢測圖像里的每一個子窗口,只有那些能夠通過所有節(jié)點(diǎn)分類器的子窗口圖像才被認(rèn)為是正樣本。吳將Voila的工作簡單地拓展到了多視角人臉檢測上,為每個獨(dú)立的人臉視角訓(xùn)練了一個不同的 cascade結(jié)構(gòu),并且并行地運(yùn)用它們進(jìn)行檢測。但是當(dāng)正樣本的類型數(shù)量增加時,這個方案所花費(fèi)的檢測時間也是線性增長的,而這個代價是我們無法負(fù)擔(dān)的。Torrobla提出了一種新的boosting框架,命名為jointboosting。他將N類分類問題轉(zhuǎn)化為N-1個兩類分類問題,然后自動地共享相同的弱分類器。盡管它的檢測器可以共享特征,但是當(dāng)檢測目標(biāo)時,它仍然需要計算全部特征,所以它并不是一個快速檢測框架。
近些年來,樹形檢測器被引入了多視角人臉檢測應(yīng)用中。許多研究者更加偏愛于這種樹形結(jié)構(gòu),例如,F(xiàn)leuret和Geman的scalar tree,Li等人的金字塔結(jié)構(gòu),還有Huang chang的廣度優(yōu)先搜索樹。在他們的工作里,Huang的工作最有新意,他提出來一種新的輸出一個布爾矢量的boosting算法,取名為vector boosting。由于它具有良好的性能,本文選用它作為分叉樹的部分。有別于多視角人臉的并行結(jié)構(gòu),經(jīng)驗證明直接構(gòu)建一個由粗到精的樹是比較困難的。故此,本文設(shè)計了一種根據(jù)不同組合的誤報率來構(gòu)建分叉樹的方法。詳細(xì)的方案會在1.3中闡述。
本文的其他部分是這樣組織的:在1.1小節(jié)中,本文介紹所采用的特征集,然后簡要地描述下普通cascade結(jié)構(gòu)和soft cascade結(jié)構(gòu)。在實驗過程中,作者測試了本文算法的精確度和檢測所需的平均特征數(shù)。
1 檢測器框架
在實驗中,本文采用了一架攝像機(jī)來拍攝電視節(jié)目的全屏幕圖像??紤]到此方法的通用性,不假設(shè)關(guān)于臺標(biāo)位置的先驗信息(盡管臺標(biāo)通常會出現(xiàn)在屏幕的上部)。為了可以檢測出臺標(biāo),本文先使用了一個分類器對大量的不同尺度和位置的子窗口進(jìn)行掃描。因為多數(shù)的子窗
口都是背景,而背景的輪廓特征不明顯,所以可以將任務(wù)分割成兩個部分:首先是盡可能早的拒判掉非臺標(biāo)的子窗口,然后是區(qū)別每個臺標(biāo)屬于哪個頻道。接下來描述下算法的第一部分。
評論