機(jī)器視覺人臉識別技術(shù)在智能商業(yè)中的應(yīng)用

作者：時間：2016-12-22 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

現(xiàn)任曠視科技(Face++)智能商業(yè)產(chǎn)品線資深總監(jiān)的宋晨在第17期RobotXDay上與聽眾分享了人工智能機(jī)器視覺領(lǐng)域中的人臉識別技術(shù)在智能商業(yè)領(lǐng)域應(yīng)用的價值和實踐經(jīng)驗，以下是根據(jù)宋晨的演講內(nèi)容提煉出的核心內(nèi)容：

　　什么是人工智能

本文引用地址：http://butianyuan.cn/article/201612/332892.htm

　　在曠視科技(Face++)宋晨看來，人工智能應(yīng)該是一種能夠通過數(shù)據(jù)、技術(shù)、產(chǎn)品三者不斷循環(huán)完成的滾雪球式閉環(huán)。以Google為例，它是通過數(shù)據(jù)來產(chǎn)生了搜索的技術(shù)，從而形成的一種產(chǎn)品，通過點(diǎn)擊的轉(zhuǎn)換最終又產(chǎn)生了數(shù)據(jù)，通過這種數(shù)據(jù)再次去學(xué)習(xí)并優(yōu)化結(jié)果，而相比掃地機(jī)器人也許算不上人工智能產(chǎn)品，因為它并不能夠通過數(shù)據(jù)和掃地的經(jīng)驗行為來優(yōu)化自身算法而提升效率。

　　人工智能領(lǐng)域主要分布在機(jī)器學(xué)習(xí)(通用)、機(jī)器學(xué)習(xí)(應(yīng)用)、計算機(jī)視覺(通用)、智能機(jī)器人、虛擬個人助理、自然語言處理(語音識別)、自然語言處理(通用)、實時語音翻譯、情境感知計算、手勢控制、推薦引擎及協(xié)同過濾、視頻內(nèi)容自動識別等。如今機(jī)器視覺已成為人工智能領(lǐng)域中一項核心關(guān)鍵技術(shù)，并成功應(yīng)用到多個重要行業(yè)中，虛擬現(xiàn)實、自動駕駛汽車、機(jī)器人、智能城市和物聯(lián)網(wǎng)等應(yīng)用領(lǐng)域也隨之加速發(fā)展。曠視科技(Face++)在計算機(jī)視覺通用平臺中以人臉識別技術(shù)為突破點(diǎn)，為企業(yè)用戶和開發(fā)者們提供技術(shù)支持。

　　機(jī)器視覺是賦予機(jī)器一雙眼睛

　　我們知道機(jī)器視覺領(lǐng)域可分為人臉識別、物體識別以及行為、動作識別等，曠視科技是在人臉識別方面做的比較早的。而在人臉識別技術(shù)應(yīng)用中，我們同樣會發(fā)現(xiàn)在數(shù)據(jù)、產(chǎn)品、技術(shù)這幾個維度形成一個整體閉環(huán)。通過標(biāo)注出來的有包括人像，物體的信息的圖像數(shù)據(jù)，和核心算法、深度學(xué)習(xí)技術(shù)行成自己的產(chǎn)品，比如人臉識別的閘機(jī)、人臉識別機(jī)器人等，然后再通過產(chǎn)品本身來服務(wù)用戶，在用戶使用的過程當(dāng)中自主去學(xué)習(xí)從而產(chǎn)生用戶行為數(shù)據(jù)，接而再反哺并促使產(chǎn)品和技術(shù)不斷優(yōu)化、自我學(xué)習(xí)。

　　從2011年成立以來，曠視科技(Face++)致力于成為“讓機(jī)器看懂世界”的人工智能公司，賦予機(jī)器一雙慧眼。讓它像人一樣去“觀察”、去“思考”，這樣它就能夠產(chǎn)生更多的功能，從它看的、想的一些數(shù)據(jù)里面繼而形成一個整體的數(shù)據(jù)分析，而我們可以運(yùn)用這些數(shù)據(jù)去做判斷、檢測、識別還有測量等，這樣以往可能需要人工或半人工做的事情，隨著機(jī)器視覺技術(shù)的變革都可以通過機(jī)器提升效率。

　　1:1和1:N

　　人臉識別有兩個比較重要的概念，即1:1和1:N。

　　1:1的應(yīng)用于證明自己是自己的場景，你可以想象當(dāng)你去機(jī)場過安檢的時候，總有一個人拿著你的身份證對比，身份證里面是不是你本人。這種場景就是1:1的場景。人的肉眼識別精準(zhǔn)度是在95%左右，而人的眼睛是有疲勞度的，所以機(jī)場安檢人員需要在半個小時到一個小時之內(nèi)換班一次。換崗的目的就是為了保持比較平均的識別的準(zhǔn)確率。但是，在這種場景下，機(jī)器可以達(dá)到97%甚至是更高的準(zhǔn)確率而且機(jī)器沒有疲勞度的問題。

　　1:N的特點(diǎn)是動態(tài)和非配合，這是對于1:N而言也是非常重要的兩個點(diǎn)，所謂的動態(tài)也就是識別的不是照片，不是圖片，而是一個動態(tài)的視頻流;非配合是指識別對象不用感知到攝像頭的位置并配合完成識別工作，而地點(diǎn)，陰暗，光線，玻璃都會影響識別的準(zhǔn)確性，所以1:N相對根據(jù)挑戰(zhàn)性。

　　在行業(yè)應(yīng)用中，1:1更多是應(yīng)用在金融、核身、信息安全領(lǐng)域，特點(diǎn)是精準(zhǔn)安全。而1:N主要應(yīng)用的方向是在商業(yè)、安防等。比如一個女士去商場買包包，店員不知道她是否是會員。如果引用機(jī)器視覺技術(shù)，不管店員換沒換，當(dāng)顧客進(jìn)門的時候她的信息就被推送給店員完成精準(zhǔn)的推薦，這就是機(jī)器視覺在商業(yè)領(lǐng)域VIP客戶識別的典型應(yīng)用。在安防方面的應(yīng)用比如公共場所動態(tài)監(jiān)控、緝拿逃犯、人員布控等。

　　而無論是1:1還是1:N的場景中，都涉及幾個比較重要的關(guān)鍵環(huán)節(jié)——人臉檢測、質(zhì)量判斷、識別比對。不管是照片還是視頻流，靜態(tài)還是動態(tài)都要在畫面中判斷出人臉的位置，這便是人臉檢測;第二點(diǎn)質(zhì)量判斷也就是讓機(jī)器去判斷是不是一張正面有效的照片，1:N的動態(tài)場景中更難一些，在動態(tài)過程中，抬頭，低頭，側(cè)臉都是非配合的狀態(tài)。因此質(zhì)量判斷的好壞直接影響最后的結(jié)果。根據(jù)每秒輸出的25-30幀畫面，機(jī)器就會思考哪些會達(dá)到機(jī)器識別的及格線，其中有一張達(dá)到了的時候就吐出來交由后臺比對數(shù)據(jù)庫以完成最后一步識別比對的工作。

　　人臉識別到了大規(guī)模應(yīng)用階段?

　　在現(xiàn)實生活中，大家應(yīng)用的可能還不是很多，一個新技術(shù)推出時，大家還是很期待的。在6、7年前的支付環(huán)境下，大家對用手機(jī)綁定銀行卡都有著各種疑慮，但是現(xiàn)在，經(jīng)過技術(shù)分發(fā)展和市場的培養(yǎng)，現(xiàn)在每個人的手機(jī)都會綁定一個賬號，線下的支付場景非常非常多，人們都很少帶現(xiàn)金出門。大家對新技術(shù)的出現(xiàn)都會抱有一種懷疑或者一種有可能出現(xiàn)漏洞的態(tài)度來看。隨著科技的發(fā)展，人們的生活習(xí)慣會潛移默化地發(fā)生改變。

　　人臉識別技術(shù)也是一樣，實際上人臉識別的技術(shù)已經(jīng)到了一個成熟期，但是由于大眾對這個技術(shù)陌生，所以大家對它還有一種保守以及懷疑的態(tài)度——這個是一定會存在的問題，所以目前還沒有大規(guī)模的在現(xiàn)實生活中應(yīng)用。

　　在人臉識別技術(shù)開始普及的這幾年，巨頭公司將會對這種技術(shù)進(jìn)行大幅度的預(yù)熱及積累，比如現(xiàn)在很多應(yīng)用平臺需要手持身份證拍照的實名驗證、還有現(xiàn)在顏值的評分，都是在通過不同的方式測試人臉識別這種技術(shù)。隨著初級的測試不斷完善，新一代的技術(shù)如刷臉去積分、刷臉支付、刷臉簽到等將會得到更普遍的應(yīng)用。當(dāng)這些場景真正的進(jìn)入到大眾生活一段時間后后，很多事情就是水到渠成了。

　　從技術(shù)角度看，人臉識別的識別率早已經(jīng)超過了人眼的水平，目前在金融、安防等領(lǐng)域正在擬定相關(guān)的行業(yè)標(biāo)準(zhǔn)。相比其他生物識別方式而言，人臉識別更為便捷不易盜取，人臉識別技術(shù)水平不能單一地用競賽結(jié)果排名來衡量，畢竟現(xiàn)實生活場景中的環(huán)境因素和實驗室里有限的數(shù)據(jù)集相比更為復(fù)雜也更具挑戰(zhàn)性，這也是催熟人臉識別走出實驗室實現(xiàn)產(chǎn)業(yè)化的重要動力。曠視科技(Face++)正在做的就是推動人臉識別走向規(guī)模化應(yīng)用，推出行業(yè)智能解決方案，建立集中的生態(tài)。

　　人工智能視覺分析能做些什么

　　從企業(yè)樓宇到園區(qū)，人臉識別智能系統(tǒng)可以與很多人的權(quán)限掛鉤，從人員的考勤到OA系統(tǒng)打通，訪客的管理和注冊，隨之而來的就是更加智能的管理人群和流向，比如機(jī)器可以通過對訪客的人臉進(jìn)行標(biāo)注，告訴他到底那個入口能進(jìn)，哪個區(qū)域你沒權(quán)限進(jìn)入，也能夠為受訪企業(yè)標(biāo)記訪客來訪時間和停留位置，這些所有的東西都是圍繞企業(yè)的智能化來展開的。

　　在零售領(lǐng)域，隨著互聯(lián)網(wǎng)摧枯拉朽般地變革，線下零售業(yè)正遭受著前所未有的沖擊。而人工智能視覺可以幫助線下零售商家更了解他們的客戶，將線下人群信息向線上轉(zhuǎn)化。通過前端的圖像獲取硬件和機(jī)器視覺技術(shù)分析客群，提供精準(zhǔn)的客流分析如顧客年齡、性別、穿衣風(fēng)格等，甚至停留時長、熱力圖、行為分析等多維數(shù)據(jù)。

　　除此之外，人工智能視覺分析還能夠賦予傳統(tǒng)場景、傳統(tǒng)產(chǎn)品新的使命。比如結(jié)合企業(yè)的需要可以用于考勤、OA管理，在消費(fèi)場景可以幫助經(jīng)營者進(jìn)行精準(zhǔn)營銷，而在生活領(lǐng)域，可以讓業(yè)主獲得更好的居住體驗。因此，不管是社區(qū)的刷臉門禁、VIP通道、酒店的人證合一終端機(jī)、展會的刷臉簽到還是智能機(jī)器人的眼睛，都是人工智能機(jī)器視覺技術(shù)在我們生產(chǎn)和生活中的運(yùn)用，只是在不同平臺和場景發(fā)揮著不同的價值。曠視科技(Face++)要做的就是通過對基礎(chǔ)數(shù)據(jù)的管理、分析，以及智能識別結(jié)構(gòu)化處理，同時與合作伙伴一起推動人臉識別技術(shù)應(yīng)用和業(yè)務(wù)增長，使傳統(tǒng)的產(chǎn)品更具競爭力。

新聞中心

機(jī)器視覺人臉識別技術(shù)在智能商業(yè)中的應(yīng)用

評論

相關(guān)推薦

技術(shù)專區(qū)