依圖NIST奪冠,解密人臉識別算法原理
近日,由美國國家標準與技術(shù)研究院NIST(National Institute of Standards and Technology) 組織的人臉識別算法測試FRVT2018結(jié)果公布,三家中國公司挺進前五。其中冠軍被中國公司依圖科技再度摘得,中國科學院深圳先進技術(shù)研究院獲得第二名,排名前五的另一家企業(yè)是曠視科技。
本文引用地址:http://butianyuan.cn/article/201806/382456.htmNIST測試以其評測標準的嚴謹性、一致性和全面性,成為了全球規(guī)模最大、標準最嚴、競爭最激烈、最權(quán)威的人臉識別算法比賽。
依圖科技其實是第二次獲得NIST比賽人臉識別冠軍,去年6月NIST官方公布的測試結(jié)果中,依圖在千萬分之一誤報下達到識別準確率95.5%,是當時全球工業(yè)界在此項指標下的最好水平。今年依圖將這一指標提升到了接近極限的水平,即在千萬分之一誤報下的識別準確率已經(jīng)接近99%。根據(jù)NIST官方4月發(fā)布的競賽結(jié)果,曠視科技也曾登頂榜首,在百萬分之一誤報下的準確率為97.5%。
中國公司取得如此戰(zhàn)績,一定程度上代表在人工智能領(lǐng)域,我國的人臉識別技術(shù)已經(jīng)走在世界前列,可喜可賀!為此,小編特別想探究一下人臉識別背后的算法原理。
1.基于幾何特征的方法
基本思想:采用幾何特征進行正面人臉識別一般是通過提取人眼、口、鼻等重要特征點的位置和眼睛等重要器官的幾何形狀作為分類特征。因為人臉由眼睛、鼻子、嘴巴、下巴等部件構(gòu)成,正因為這些部件的形狀、大小和結(jié)構(gòu)上的各種差異才使得世界上每個人臉千差萬別,所以對這些部件的形狀和結(jié)構(gòu)關(guān)系的幾何描述,可以做為人臉識別的重要特征。
局限性:基于幾何特征的方法是最早、最傳統(tǒng)的方法,通常需要和其他算法結(jié)合才能有比較好的效果?;趨?shù)的人臉表示可以實現(xiàn)對人臉顯著特征的一個高效描述,但它需要大量的前處理和精細的參數(shù)選擇。同時,采用一般幾何特征只描述了部件的基本形狀與結(jié)構(gòu)關(guān)系,忽略了局部細微特征,造成部分信息的丟失,更適合于做粗分類,而且目前已有的特征點檢測技術(shù)在精確率上還遠不能滿足要求,計算量也較大。
2.特征臉方法(PCA)
特征臉方法是90年代初期由Turk和Pentland提出的目前最流行的算法之一,具有簡單有效的特點, 也稱為基于主成分分析(principal component analysis,簡稱PCA)的人臉識別方法。
基本思想:該方法是先確定眼虹膜、鼻翼、嘴角等面像五官輪廓的大小、位置、距離等屬性,然后再計算出它們的幾何特征量,而這些特征量形成一描述該面像的特征向量。其技術(shù)的核心實際為“局部人體特征分析”和“圖形/神經(jīng)識別算法?!边@種算法是利用人體面部各器官及特征部位的方法。如對應幾何關(guān)系多數(shù)據(jù)形成識別參數(shù)與數(shù)據(jù)庫中所有的原始參數(shù)進行比較、判斷與確認。
局限性:特征臉方法是一種簡單、快速、實用的基于變換系數(shù)特征的算法,但由于它在本質(zhì)上依賴于訓練集和測試集圖像的灰度相關(guān)性,而且要求測試圖像與訓練集比較像,所以它有著很大的局限性。
3.神經(jīng)網(wǎng)絡(luò)方法
基本思想:人工神經(jīng)網(wǎng)絡(luò)是一種非線性動力學系統(tǒng),具有良好的自組織、自適應能力。目前神經(jīng)網(wǎng)絡(luò)方法在人臉識別中的研究方興未艾,但在人臉識別上的應用比起前兩類方法來有一定的優(yōu)勢,因為對人臉識別的許多規(guī)律或規(guī)則進行顯性的描述是相當困難的,而神經(jīng)網(wǎng)絡(luò)方法則可以通過學習的過程獲得對這些規(guī)律和規(guī)則的隱性表達,它的適應性更強,一般也比較容易實現(xiàn)。因此人工神經(jīng)網(wǎng)絡(luò)識別速度快,但識別率低 。
局限性:神經(jīng)網(wǎng)絡(luò)方法通常需要將人臉作為一個一維向量輸入,因此輸入節(jié)點龐大,其識別重要的一個目標就是降維處理。
影響人臉識別的關(guān)鍵因素
光照變化
光照變化是影響人臉識別性能的最關(guān)鍵因素,對該問題的解決程度關(guān)系著人臉識別實用化進程的成敗。目前有兩種解決思路:第一是利用光照模式參數(shù)空間估計光照模式,然后進行針對性的光照補償,以便消除非均勻正面光照造成的陰影、高光等影響;第二是基于光照子空間模型的任意光照圖像生成算法,用于生成多個不同光照條件的訓練樣本,然后利用具有良好的學習能力的人臉識別算法,如子空間法。
姿態(tài)問題
姿態(tài)問題涉及頭部在三維垂直坐標系中繞三個軸的旋轉(zhuǎn)造成的面部變化,其中垂直于圖像平面的兩個方向的深度旋轉(zhuǎn)會造成面部信息的部分缺失,因此姿態(tài)問題成為人臉識別的一個技術(shù)難題。
解決姿態(tài)問題有三種思路:第一種思路是學習并記憶多種姿態(tài)特征,這對于多姿態(tài)人臉數(shù)據(jù)可以容易獲取的情況比較實用;第二種思路是基于單張視圖生成多角度視圖,可以在只能獲取用戶單張照片的情況下合成該用戶的多個學習樣本,可以解決訓練樣本較少的情況下的多姿態(tài)人臉識別問題,從而改善識別性能;第三種思路是基于姿態(tài)不變特征的方法,即尋求那些不隨姿態(tài)的變化而變化的特征。
評論