人臉識別技術(shù)的應(yīng)用背景及研究現(xiàn)狀
(3)神經(jīng)網(wǎng)絡(luò)
從本質(zhì)上講,神經(jīng)網(wǎng)絡(luò)也是一種基于樣本的學(xué)習(xí)方法。將神經(jīng)網(wǎng)絡(luò)用于人臉檢測取得了很大的進(jìn)展。MIT的學(xué)者首先對人臉樣本集和非人臉樣本集聚類,以測試樣本與人臉樣本集和非人臉樣本集的子類之間的距離作為分類的度量,利用多層感知器(MLP)網(wǎng)絡(luò)作為分類器。CMU的研究人員直接以圖像作為神經(jīng)網(wǎng)絡(luò)的輸入,設(shè)計了一個具有獨特結(jié)構(gòu)的適用于人臉特征的神經(jīng)網(wǎng)絡(luò)分類器,并通過前饋神經(jīng)網(wǎng)絡(luò)對檢測結(jié)果優(yōu)化。Raphael Feraud等利用多個神經(jīng)網(wǎng)絡(luò):多層感知器(MLP)和約束產(chǎn)生式模型(CGM,Constrained Generative Model),實現(xiàn)了一個可應(yīng)用于WEB中人臉圖像檢索的快速而準(zhǔn)確的人臉檢測方法。Shang-Hung Lin等訓(xùn)練了三個基于概率決策的神經(jīng)網(wǎng)絡(luò)(PDBNN,Probabilistic Decision Based Neural Network),用于人臉檢測,眼睛定位和人臉識別,實現(xiàn)了一個完整的人臉識別系統(tǒng)。
(4)基于隱馬爾可夫模型的方法
馬爾可夫模型是一個離散時序有限狀態(tài)自動機(jī),隱馬爾可夫模型(HMM)是指這一馬爾可夫模型的內(nèi)部狀態(tài)外界不可見,外界只能看到各個時刻的輸出值。對于人臉模式來說,我們可以把它分成前額,眼睛,鼻子,嘴巴和下巴這樣一個序列。人臉模式就可以通過對這些區(qū)域的有序的識別來檢測,這正好是隱馬爾可夫模型容易做到的。Samaria等人提出了使用HMM模型進(jìn)行人臉檢測的算法,他們使用人臉區(qū)域的結(jié)構(gòu)信息作為隱馬爾可夫模型的狀態(tài)遷移條件。除此以外,基于AdaBoost的人臉識別算法,基于彩色信息的方法,基于形狀
分析的方法,以及多模態(tài)信息融合的方法,國外都進(jìn)行了大量的研究與實驗。
3.人臉識別技術(shù)在國內(nèi)的研究現(xiàn)狀
國內(nèi)關(guān)于人臉自動識別的研究始于二十世紀(jì)80年代,主要的研究單位有清華大學(xué),哈爾濱工業(yè)大學(xué),中科院計算所,中科院自動化所,復(fù)旦大學(xué),北京科技大學(xué)等,并都取得了一定的成果。國內(nèi)的研究工作主要是集中在三大類方法的研究:基于幾何特征的人臉正面自動識別方法、基于代數(shù)特征的人臉正面自動識別方法和基于連接機(jī)制的人臉正面自動識別方法。周激流實現(xiàn)了具有反饋機(jī)制的人臉正面識別系統(tǒng),運用積分投影法提取面部特征的關(guān)鍵點并用于識別,獲得了比較滿意的效果。他同時也嘗試了“穩(wěn)定視點”特征提取方法,即為使識別系統(tǒng)中包含3D信息,他對人臉側(cè)面剪影識別做了一定的研究,并實現(xiàn)了正,側(cè)面互相參照的識別系統(tǒng)。彭輝、張長水等對“特征臉”的方法做了進(jìn)一步的發(fā)展,提出采用類間散布矩陣作為產(chǎn)生矩陣,進(jìn)一步降低了產(chǎn)生矩陣的維數(shù),在保持識別率的情況下,大大降低了運算量。程永清,莊永明等對同類圖像的平均灰度圖進(jìn)行SVD分解得到特征臉空間,每一幅圖像在特征臉空間上的投影作為其代數(shù)特征,然后利用層次判別進(jìn)行分類。張輝,周洪祥,何振亞采用對稱主元分析神經(jīng)網(wǎng)絡(luò),用去冗余和權(quán)值正交相結(jié)合的方法對人臉進(jìn)行特征提取和識別。該方法所用特征數(shù)據(jù)量小,特征提取運算量也較小,比較好地實現(xiàn)了大量人臉樣本的存儲和人臉的快速識別。北京科技大學(xué)的王志良教授主要研究人工心理,建立了以數(shù)學(xué)公式為基礎(chǔ)的心理學(xué)模型。
4.當(dāng)前人臉識別技術(shù)所存在的主要問題
盡管人臉識別技術(shù)有著廣闊的應(yīng)用前景,但是無論是在識別率,還是在防偽性上,都與指紋,視網(wǎng)膜等有著較大的差距,歸根結(jié)底,影響人臉識別效果的原因主要有以下的幾個方面:
1)人臉圖像的獲取過程中的不確定性(如光的方向,以及光的強(qiáng)度等)。
2)人臉模式的多樣性(如胡須,眼鏡,發(fā)型等)。
3)人臉?biāo)苄宰冃蔚牟淮_定性(如表情等)。
4)所涉及的領(lǐng)域知識的綜合性(如心理學(xué),醫(yī)學(xué),模式識別,圖像處理,數(shù)學(xué)等)。正因為在人臉識別的過程中存在上述的各種各樣的問題,因此在實際的檢測和識別過程中,當(dāng)這些因素疊加到一起的時候,情況就變得更加復(fù)雜?;趲缀翁卣鞯淖R別方法,其存在的主要問題在于,沒有形成一個統(tǒng)一的,優(yōu)秀的特征提取標(biāo)準(zhǔn)。在描述人臉的時候,受到表情,光照,姿態(tài)的影響比較大,無法準(zhǔn)確地描述人臉特征。盡管如此,基于幾何特征的方法在處理人臉表情分析時,仍然是一個最有效的依據(jù)。同時,目前已經(jīng)提出了很多改進(jìn)的特征提取的算法,使得人臉幾何特征的提取越來越趨于合理,這里面最具代表性的方法就是結(jié)合3D人臉信息的特征點提取技術(shù)?;诖鷶?shù)特征的識別方法是目前在實際應(yīng)用中使用得最多的一類方法,其主要原因是由于代數(shù)特征矢量(即人臉圖像在特征空間的投影結(jié)果)對角度,表情等因素都具有一定的穩(wěn)定性。但對于光照而言,似乎效果并不太明顯。這種代數(shù)的特征識別方法,無法應(yīng)用于人臉的表情識別。
從某種意義上來說,人臉識別的各種方法,實際上就是在尋找一種人臉的描述方式,但是要找到一種能夠不受各種因素影響的描述方式非常地困難,無論是最早使用的幾何描述方式以及后來比較常用的代數(shù)描述方式,都不可避免地存在各種干擾。我們只能是在以后的研究中,逐漸去完善人臉的描述方式,使之更加有效,更加準(zhǔn)確。
矢量控制相關(guān)文章:矢量控制原理
評論