探秘人臉識別技術(shù)
什么是人臉識別技術(shù)?這到底會給我們的生活帶來怎樣的改變呢?
什么是人臉識別技術(shù)
人臉識別技術(shù),是基于人的臉部特征信息進行身份識別的一種生物識別技術(shù)。用攝像機或攝像頭采集含有人臉的圖像或視頻流,并自動在圖像中檢測和跟蹤人臉,進而對檢測到的人臉進行臉部的一系列相關(guān)技術(shù),通常也叫做人像識別、面部識別。傳統(tǒng)的人臉識別技術(shù)主要是基于可見光圖像的人臉識別,這也是人們熟悉的識別方式。簡單的來說就是一個讓計算機認出你的過程。
人臉識別技術(shù)主要是通過人臉圖像特征的提取與對比來進行的。人臉識別系統(tǒng)將提取的人臉圖像的特征數(shù)據(jù)與數(shù)據(jù)庫中存儲的特征模板進行搜索匹配,通過設(shè)定一個閾值,當相似度超過這一閾值,則把匹配得到的結(jié)果輸出。將待識別的人臉特征與已得到的人臉特征模板進行比較,根據(jù)相似程度對人臉的身份信息進行判斷。這一過程又分為兩類:一類是確認,是一對一進行圖像比較的過程,另一類是辨認,是一對多進行圖像匹配對比的過程。
廣義的人臉識別實際包括構(gòu)建人臉識別系統(tǒng)的一系列相關(guān)技術(shù),包括人臉圖像采集、人臉定位、人臉識別預處理、身份確認以及身份查找等;而狹義的人臉識別特指通過人臉進行身份確認或者身份查找的技術(shù)或系統(tǒng)。
人臉識別技術(shù)特點
傳統(tǒng)的人臉識別技術(shù)主要是基于可見光圖像的人臉識別,這也是人們最熟悉的識別方式,已有30多年的研發(fā)歷史。但這種方式有著難以克服的缺陷,尤其在環(huán)境光照發(fā)生變化時,識別效果會急劇下降,無法滿足實際系統(tǒng)的需要。解決光照問題的方案有三維圖像人臉識別,和熱成像人臉識別。但這兩種技術(shù)還遠不成熟,識別效果不盡人意。
迅速發(fā)展起來的一種解決方案是基于主動近紅外圖像的多光源人臉識別技術(shù)。它可以克服光線變化的影響,已經(jīng)取得了卓越的識別性能,在精度、穩(wěn)定性和速度方面的整體系統(tǒng)性能超過三維圖像人臉識別。這項技術(shù)在近兩三年發(fā)展迅速,使人臉識別技術(shù)逐漸走向?qū)嵱没?/p>
人臉與人體的其它生物特征(指紋、虹膜等)一樣與生俱來,它的唯一性和不易被復制的良好特性為身份鑒別提供了必要的前提。
與其它類型的生物識別比較人臉識別具有如下特點:
非強制性:用戶不需要專門配合人臉采集設(shè)備,幾乎可以在無意識的狀態(tài)下就可獲取人臉圖像,這樣的取樣方式?jīng)]有“強制性”;
非接觸性:用戶不需要和設(shè)備直接接觸就能獲取人臉圖像;
并發(fā)性:在實際應用場景下可以進行多個人臉的分揀、判斷及識別;
除此之外,還符合視覺特性:“以貌識人”的特性,以及操作簡單、結(jié)果直觀、隱蔽性好等特點。
人臉識別技術(shù)流程
人臉識別系統(tǒng)主要包括四個組成部分,分別為:人臉圖像采集及檢測、人臉圖像預處理、人臉圖像特征提取以及匹配與識別。
人臉圖像采集及檢測
人臉圖像采集:不同的人臉圖像都能通過攝像鏡頭采集下來,比如靜態(tài)圖像、動態(tài)圖像、不同的位置、不同表情等方面都可以得到很好的采集。當用戶在采集設(shè)備的拍攝范圍內(nèi)時,采集設(shè)備會自動搜索并拍攝用戶的人臉圖像。
人臉檢測:人臉檢測在實際中主要用于人臉識別的預處理,即在圖像中準確標定出人臉的位置和大小。人臉圖像中包含的模式特征十分豐富,如直方圖特征、顏色特征、模板特征、結(jié)構(gòu)特征及Haar特征等。人臉檢測就是把這其中有用的信息挑出來,并利用這些特征實現(xiàn)人臉檢測。
主流的人臉檢測方法基于以上特征采用Adaboost學習算法,Adaboost算法是一種用來分類的方法,它把一些比較弱的分類方法合在一起,組合出新的很強的分類方法。
人臉檢測過程中使用Adaboost算法挑選出一些最能代表人臉的矩形特征(弱分類器),按照加權(quán)投票的方式將弱分類器構(gòu)造為一個強分類器,再將訓練得到的若干強分類器串聯(lián)組成一個級聯(lián)結(jié)構(gòu)的層疊分類器,有效地提高分類器的檢測速度。
人臉圖像預處理
人臉圖像預處理:對于人臉的圖像預處理是基于人臉檢測結(jié)果,對圖像進行處理并最終服務于特征提取的過程。系統(tǒng)獲取的原始圖像由于受到各種條件的限制和隨機 干擾,往往不能直接使用,必須在圖像處理的早期階段對它進行灰度校正、噪聲過濾等圖像預處理。對于人臉圖像而言,其預處理過程主要包括人臉圖像的光線補 償、灰度變換、直方圖均衡化、歸一化、幾何校正、濾波以及銳化等。
人臉圖像特征提取
人臉圖像特征提?。喝四樧R別系統(tǒng)可使用的特征通常分為視覺特征、像素統(tǒng)計特征、人臉圖像變換系數(shù)特征、人臉圖像代數(shù) 特征等。人臉特征提取就是針對人臉的某些特征進行的。人臉特征提取,也稱人臉表征,它是對人臉進行特征建模的過程。人臉特征提取的方法歸納起來分為兩大 類:一種是基于知識的表征方法;另外一種是基于代數(shù)特征或統(tǒng)計學習的表征方法。
基于知識的表征方法主要是根據(jù)人臉器官的形狀描述以及他們之間的距離特性來獲得有助于人臉分類的特征數(shù)據(jù),其特征分 量通常包括特征點間的歐氏距離、曲率和角度等。人臉由眼睛、鼻子、嘴、下巴等局部構(gòu)成,對這些局部和它們之間結(jié)構(gòu)關(guān)系的幾何描述,可作為識別人臉的重要特 征,這些特征被稱為幾何特征?;谥R的人臉表征主要包括基于幾何特征的方法和模板匹配法。
人臉圖像匹配與識別
人臉圖像匹配與識別:提取的人臉圖像的特征數(shù)據(jù)與數(shù)據(jù)庫中存儲的特征模板進行搜索匹配,通過設(shè)定一個閾值,當相似度超過這一閾值,則把匹配得到的結(jié)果輸 出。人臉識別就是將待識別的人臉特征與已得到的人臉特征模板進行比較,根據(jù)相似程度對人臉的身份信息進行判斷。這一過程又分為兩類:一類是確認,是一對一 進行圖像比較的過程,另一類是辨認,是一對多進行圖像匹配對比的過程。
人臉識別三大關(guān)鍵技術(shù)
基于特征的人臉檢測技術(shù)
通過采用顏色、輪廓、紋理、結(jié)構(gòu)或者直方圖特征等進行人臉檢測。
基于模板匹配人臉檢測技術(shù)
從數(shù)據(jù)庫當中提取人臉模板,接著采取一定模板匹配策略,使抓取人臉圖像與從模板庫提取圖片相匹配,由相關(guān)性的高低和所匹配的模板大小確定人臉大小以及位置信息。
基于統(tǒng)計的人臉檢測技術(shù)
通過對于“人臉”和“非人臉”的圖像大量搜集構(gòu)成的人臉正、負樣本庫,采用統(tǒng)計方法強化訓練該系統(tǒng),從而實現(xiàn)對人臉和非人臉的模式進行檢測和分類。
人臉識別幾大特征
幾何特征
從面部點之間的距離和比率作為特征,識別速度快,內(nèi)存要求比較小,對于光照敏感度降低。
基于模型特征
根據(jù)不同特征狀態(tài)所具有概率不同而提取人臉圖像特征。
基于統(tǒng)計特征
將人臉圖像視為隨機向量,并用統(tǒng)計方法辨別不同人臉特征模式,比較典型的有特征臉、獨立成分分析、奇異值分解等。
基于神經(jīng)網(wǎng)絡(luò)特征
利用大量神經(jīng)單元對人臉圖像特征進行聯(lián)想存儲和記憶,根據(jù)不同神經(jīng)單元狀態(tài)的概率實現(xiàn)對人臉圖像準確識別。
人臉識別是根據(jù)所提取的人臉圖像特征采用相關(guān)識別算法進行人臉確認或辨別。即將已檢測到的待識別人臉與數(shù)據(jù)庫中已知人臉進行比較匹配,得出相關(guān)信息,該過程的關(guān)鍵是選擇適當?shù)娜四槺碚鞣绞脚c匹配策略,系統(tǒng)的構(gòu)造與人臉的表征方式密切相關(guān)。一般根據(jù)所提特征而選擇不同識別算法進行度量,常用的包括距離度量、支持向量機、神經(jīng)網(wǎng)絡(luò)、k均值聚類等。
人臉識別技術(shù)的主要算法
主流的人臉識別技術(shù)基本上可以歸結(jié)為三類,即:基于幾何特征的方法、基于模板的方法和基于模型的方法。
1、基于幾何特征的方法是最早、最傳統(tǒng)的方法,通常需要和其他算法結(jié)合才能有比較好的效果;
2、基于模板的方法可以分為基于相關(guān)匹配的方法、特征臉方法、線性判別分析方法、奇異值分解方法、神經(jīng)網(wǎng)絡(luò)方法、動態(tài)連接匹配方法等。
3、基于模型的方法則有基于隱馬爾柯夫模型,主動形狀模型和主動外觀模型的方法等。
基于幾何特征的方法
人臉由眼睛、鼻子、嘴巴、下巴等部件構(gòu)成,正因為這些部件的形狀、大小和結(jié)構(gòu)上的各種差異才使得世界上每個人臉千差萬別,因此對這些部件的形狀和結(jié)構(gòu)關(guān)系的幾何描述,可以做為人臉識別的重要特征。
幾何特征最早是用于人臉側(cè)面輪廓的描述與識別,首先根據(jù)側(cè)面輪廓曲線確定若干顯著點,并由這些顯著點導出一組用于識別的特征度量如距離、角度等。Jia 等由正面灰度圖中線附近的積分投影模擬側(cè)面輪廓圖是一種很有新意的方法。
采用幾何特征進行正面人臉識別一般是通過提取人眼、口、鼻等重要特征點的位置和眼睛等重要器官的幾何形狀作為分類特征,但對幾何特征提取的精確性進行了實驗性的研究,結(jié)果不容樂觀。
可變形模板法可以視為幾何特征方法的一種改進,其基本思想是:設(shè)計一個參數(shù)可調(diào)的器官模型 (即可變形模板),定義一個能量函數(shù),通過調(diào)整模型參數(shù)使能量函數(shù)最小化,此時的模型參數(shù)即做為該器官的幾何特征。
這種方法思想很好,但是存在兩個問題,一是能量函數(shù)中各種代價的加權(quán)系數(shù)只能由經(jīng)驗確定,難以推廣,二是能量函數(shù)優(yōu)化過程十分耗時,難以實際應用。 基于參數(shù)的人臉表示可以實現(xiàn)對人臉顯著特征的一個高效描述,但它需要大量的前處理和精細的參數(shù)選擇。同時,采用一般幾何特征只描述了部件的基本形狀與結(jié)構(gòu)關(guān)系,忽略了局部細微特征,造成部分信息的丟失,更適合于做粗分類,而且目前已有的特征點檢測技術(shù)在精確率上還遠不能滿足要求,計算量也較大。
特征臉方法
特征臉方法是90年代初期由Turk和Pentland提出的目前最流行的算法之一,具有簡單有效的特點, 也稱為基于主成分分析(principal component analysis,簡稱PCA)的人臉識別方法。
特征臉技術(shù)的基本思想是:從統(tǒng)計的觀點,尋找人臉圖像分布的基本元素,即人臉圖像樣本集協(xié)方差矩陣的特征向量,以此近似地表征人臉圖像。這些特征向量稱為特征臉(Eigenface)。
實際上,特征臉反映了隱含在人臉樣本集合內(nèi)部的信息和人臉的結(jié)構(gòu)關(guān)系。將眼睛、面頰、下頜的樣本集協(xié)方差矩陣的特征向量稱為特征眼、特征頜和特征唇,統(tǒng)稱特征子臉。特征子臉在相應的圖像空間中生成子空間,稱為子臉空間。計算出測試圖像窗口在子臉空間的投影距離,若窗口圖像滿足閾值比較條件,則判斷其為人臉。
基于特征分析的方法,也就是將人臉基準點的相對比率和其它描述人臉臉部特征的形狀參數(shù)或類別參數(shù)等一起構(gòu)成識別特征向量,這種基于整體臉的識別不僅保留了人臉部件之間的拓撲關(guān)系,而且也保留了各部件本身的信息,而基于部件的識別則是通過提取出局部輪廓信息及灰度信息來設(shè)計具體識別算法?,F(xiàn)在Eigenface(PCA)算法已經(jīng)與經(jīng)典的模板匹配算法一起成為測試人臉識別系統(tǒng)性能的基準算法;而自1991年特征臉技術(shù)誕生以來,研究者對其進行了各種各樣的實驗和理論分析,F(xiàn)ERET'96測試結(jié)果也表明,改進的特征臉算法是主流的人臉識別技術(shù),也是具有最好性能的識別方法之一。
該方法是先確定眼虹膜、鼻翼、嘴角等面像五官輪廓的大小、位置、距離等屬性,然后再計算出它們的幾何特征量,而這些特征量形成一描述該面像的特征向量。其技術(shù)的核心實際為“局部人體特征分析”和“圖形/神經(jīng)識別算法。”這種算法是利用人體面部各器官及特征部位的方法。如對應幾何關(guān)系多數(shù)據(jù)形成識別參數(shù)與數(shù)據(jù)庫中所有的原始參數(shù)進行比較、判斷與確認。Turk和Pentland提出特征臉的方法,它根據(jù)一組人臉訓練圖像構(gòu)造主元子空間,由于主元具有臉的形狀,也稱為特征臉 ,識別時將測試 圖像投影到主元子空間上,得到一組投影系數(shù),和各個已知人的人臉圖像比較進行識別。Pentland等報告了相當好的結(jié)果,在 200個人的 3000幅圖像中得到 95%的正確識別率,在FERET數(shù)據(jù)庫上對 150幅正面人臉象只有一個誤識別。但系統(tǒng)在進行特征臉方法之前需要作大量預處理工作如歸一化等。
傳統(tǒng)特征臉的基礎(chǔ)上,研究者注意到特征值大的特征向量 (即特征臉 )并不一定是分類性能好的方向,據(jù)此發(fā)展了多種特征 (子空間 )選擇方法,如Peng的雙子空間方法、Weng的線性歧義分析方法、Belhumeur的FisherFace方法等。事實上,特征臉方法是一種顯式主元分析人臉建模,一些線性自聯(lián)想、線性壓縮型BP網(wǎng)則為隱式的主元分析方法,它們都是把人臉表示為一些向量的加權(quán)和,這些向量是訓練集叉積陣的主特征向量,Valentin對此作了詳細討論。總之,特征臉方法是一種簡單、快速、實用的基于變換系數(shù)特征的算法,但由于它在本質(zhì)上依賴于訓練集和測試集圖像的灰度相關(guān)性,而且要求測試圖像與訓練集比較像,所以它有著很大的局限性。
基于KL 變換的特征人臉識別方法
KL變換是圖象壓縮中的一種最優(yōu)正交變換,人們將它用于統(tǒng)計特征提取,從而形成了子空間法模式識別的基礎(chǔ),若將KL變換用于人臉識別,則需假設(shè)人臉處于低維線性空間,且不同人臉具有可分性,由于高維圖象空間KL變換后可得到一組新的正交基,因此可通過保留部分正交基,以生成低維人臉空間,而低維空間的基則是通過分析人臉訓練樣本集的統(tǒng)計特性來獲得,KL變換的生成矩陣可以是訓練樣本集的總體散布矩陣,也可以是訓練樣本集的類間散布矩陣,即可采用同一人的數(shù)張圖象的平均來進行訓練,這樣可在一定程度上消除光線等的干擾,且計算量也得到減少,而識別率不會下降。
基于彈性模型的方法
Llades等人針對畸變不變性的物體識別提出了動態(tài)鏈接模型 (DLA),將物體用稀疏圖形來描述 ,其頂點用局部能量譜的多尺度描述來標記,邊則表示拓撲連接關(guān)系并用幾何距離來標記,然后應用塑性圖形匹配技術(shù)來尋找最近的已知圖形。Wiscott等人在此基礎(chǔ)上作了改進,用FERET圖像庫做實驗,用 300幅人臉圖像和另外 300幅圖像作比較,準確率達到 97.3%。此方法的缺點是計算量非常巨大 。
Nastar將人臉圖像 (Ⅰ ) (x,y)建模為可變形的 3D網(wǎng)格表面 (x,y,I(x,y) ),從而將人臉匹配問題轉(zhuǎn)化為可變形曲面的彈性匹配問題。利用有限元分析的方法進行曲面變形,并根據(jù)變形的情況判斷兩張圖片是否為同一個人。這種方法的特點在于將空間 (x,y)和灰度I(x,y)放在了一個 3D空間中同時考慮,實驗表明識別結(jié)果明顯優(yōu)于特征臉方法。
Lanitis等提出靈活表現(xiàn)模型方法,通過自動定位人臉的顯著特征點將人臉編碼為 83個模型參數(shù),并利用辨別分析的方法進行基于形狀信息的人臉識別。彈性圖匹配技術(shù)是一種基于幾何特征和對灰度分布信息進行小波紋理分析相結(jié)合的識別算法,由于該算法較好的利用了人臉的結(jié)構(gòu)和灰度分布信息,而且還具有自動精確定位面部特征點的功能,因而具有良好的識別效果,適應性強識別率較高,該技術(shù)在FERET測試中若干指標名列前茅,其缺點是時間復雜度高,速度較慢,實現(xiàn)復雜。
神經(jīng)網(wǎng)絡(luò)方法
人工神經(jīng)網(wǎng)絡(luò)是一種非線性動力學系統(tǒng),具有良好的自組織、自適應能力。目前神經(jīng)網(wǎng)絡(luò)方法在人臉識別中的研究方興未艾。Valentin提出一種方法,首先提取人臉的 50個主元,然后用自相關(guān)神經(jīng)網(wǎng)絡(luò)將它映射到 5維空間中,再用一個普通的多層感知器進行判別,對一些簡單的測試圖像效果較好;Intrator等提出了一種混合型神經(jīng)網(wǎng)絡(luò)來進行人臉識別,其中非監(jiān)督神經(jīng)網(wǎng)絡(luò)用于特征提取,而監(jiān)督神經(jīng)網(wǎng)絡(luò)用于分類。
Lee等將人臉的特點用六條規(guī)則描述,然后根據(jù)這六條規(guī)則進行五官的定位,將五官之間的幾何距離輸入模糊神經(jīng)網(wǎng)絡(luò)進行識別,效果較一般的基于歐氏距離的方法有較大改善,Laurence等采用卷積神經(jīng)網(wǎng)絡(luò)方法進行人臉識別,由于卷積神經(jīng)網(wǎng)絡(luò)中集成了相鄰像素之間的相關(guān)性知識,從而在一定程度上獲得了對圖像平移、旋轉(zhuǎn)和局部變形的不變性,因此得到非常理想的識別結(jié)果,Lin等提出了基于概率決策的神經(jīng)網(wǎng)絡(luò)方法 (PDBNN),其主要思想是采用虛擬 (正反例 )樣本進行強化和反強化學習,從而得到較為理想的概率估計結(jié)果,并采用模塊化的網(wǎng)絡(luò)結(jié)構(gòu) (OCON)加快網(wǎng)絡(luò)的學習。
這種方法在人臉檢測、人臉定位和人臉識別的各個步驟上都得到了較好的應用,其它研究還有 :Dai等提出用Hopfield網(wǎng)絡(luò)進行低分辨率人臉聯(lián)想與識別,Gutta等提出將RBF與樹型分類器結(jié)合起來進行人臉識別的混合分類器模型,Phillips等人將MatchingPursuit濾波器用于人臉識別,國內(nèi)則采用統(tǒng)計學習理論中的支撐向量機進行人臉分類。
經(jīng)網(wǎng)絡(luò)方法在人臉識別上的應用比起前述幾類方法來有一定的優(yōu)勢,因為對人臉識別的許多規(guī)律或規(guī)則進行顯性的描述是相當困難的,而神經(jīng)網(wǎng)絡(luò)方法則可以通過學習的過程獲得對這些規(guī)律和規(guī)則的隱性表達,它的適應性更強,一般也比較容易實現(xiàn)。因此人工神經(jīng)網(wǎng)絡(luò)識別速度快,但識別率低 。而神經(jīng)網(wǎng)絡(luò)方法通常需要將人臉作為一個一維向量輸入,因此輸入節(jié)點龐大,其識別重要的一個目標就是降維處理。
其它算法:
除了以上幾種方法,人臉識別還有其它若干思路和方法,包括一下一些:
1、隱馬爾可夫模型方法
2、 Gabor 小波變換+圖形匹配
(1)精確抽取面部特征點以及基于Gabor引擎的匹配算法,具有較好的準確性,能夠排除由于面部姿態(tài)、表情、發(fā)型、眼鏡、照明環(huán)境等帶來的變化。
(2)Gabor濾波器將Gaussian網(wǎng)絡(luò)函數(shù)限制為一個平面波的形狀,并且在濾波器設(shè)計中有優(yōu)先方位和頻率的選擇,表現(xiàn)為對線條邊緣反應敏感。
(3)但該算法的識別速度很慢,只適合于錄象資料的回放識別,對于現(xiàn)場的適應性很差。
3、人臉等密度線分析匹配方法
(1) 多重模板匹配方法
該方法是在庫中存貯若干標準面像模板或面像器官模板,在進行比對時,將采樣面像所有象素與庫中所有模板采用歸一化相關(guān)量度量進行匹配。
(2) 線性判別分析方法
(3)本征臉法:本征臉法將圖像看做矩陣 ,計算本征值和對應的本征向量作為代數(shù)特征進行識別 ,具有無需提取眼嘴鼻等幾何特征的優(yōu)點 ,但在單樣本時識別率不高 ,且在人臉模式數(shù)較大時計算量大
4、特定人臉子空間(FSS)算法
該技術(shù)來源于但在本質(zhì)上區(qū)別于傳統(tǒng)的"特征臉"人臉識別方法。"特征臉"方法中所有人共有一個人臉子空間,而該方法則為每一個體人臉建立一個該個體對象所私有的人臉子空間,從而不但能夠更好的描述不同個體人臉之間的差異性,而且最大可能地擯棄了對識別不利的類內(nèi)差異性和噪聲,因而比傳統(tǒng)的"特征臉算法"具有更好的判別能力。另外,針對每個待識別個體只有單一訓練樣本的人臉識別問題,提出了一種基于單一樣本生成多個訓練樣本的技術(shù),從而使得需要多個訓練樣本的個體人臉子空間方法可以適用于單訓練樣本人臉識別問題。
5、奇異值分解(singular value decomposition,簡稱SVD)
這是一種有效的代數(shù)特征提取方法。由于奇異值特征在描述圖像時是穩(wěn)定的,且具有轉(zhuǎn)置不變性、旋轉(zhuǎn)不變性、位移不變性、鏡像變換不變性等重要性質(zhì),因此奇異值特征可以作為圖像的一種有效的代數(shù)特征描述。奇異值分解技術(shù)已經(jīng)在圖像數(shù)據(jù)壓縮、信號處理和模式分析中得到了廣泛應用。
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。