關(guān) 閉

新聞中心

EEPW首頁 > 安全與國防 > 設(shè)計(jì)應(yīng)用 > 機(jī)器視覺人臉識別技術(shù)在智能商業(yè)中的應(yīng)用

機(jī)器視覺人臉識別技術(shù)在智能商業(yè)中的應(yīng)用

作者: 時(shí)間:2016-12-22 來源:網(wǎng)絡(luò) 收藏
現(xiàn)任曠視科技(Face++)智能商業(yè)產(chǎn)品線資深總監(jiān)的宋晨在第17期RobotXDay上與聽眾分享了人工智能機(jī)器視覺領(lǐng)域中的人臉識別技術(shù)在智能商業(yè)領(lǐng)域應(yīng)用的價(jià)值和實(shí)踐經(jīng)驗(yàn),以下是根據(jù)宋晨的演講內(nèi)容提煉出的核心內(nèi)容:

  什么是人工智能

本文引用地址:http://www.butianyuan.cn/article/201612/332892.htm

  在曠視科技(Face++)宋晨看來,人工智能應(yīng)該是一種能夠通過數(shù)據(jù)、技術(shù)、產(chǎn)品三者不斷循環(huán)完成的滾雪球式閉環(huán)。以Google為例,它是通過數(shù)據(jù)來產(chǎn)生了搜索的技術(shù),從而形成的一種產(chǎn)品,通過點(diǎn)擊的轉(zhuǎn)換最終又產(chǎn)生了數(shù)據(jù),通過這種數(shù)據(jù)再次去學(xué)習(xí)并優(yōu)化結(jié)果,而相比掃地機(jī)器人也許算不上人工智能產(chǎn)品,因?yàn)樗⒉荒軌蛲ㄟ^數(shù)據(jù)和掃地的經(jīng)驗(yàn)行為來優(yōu)化自身算法而提升效率。

  人工智能領(lǐng)域主要分布在機(jī)器學(xué)習(xí)(通用)、機(jī)器學(xué)習(xí)(應(yīng)用)、計(jì)算機(jī)視覺(通用)、智能機(jī)器人、虛擬個(gè)人助理、自然語言處理(語音識別)、自然語言處理(通用)、實(shí)時(shí)語音翻譯、情境感知計(jì)算、手勢控制、推薦引擎及協(xié)同過濾、視頻內(nèi)容自動識別等。如今機(jī)器視覺已成為人工智能領(lǐng)域中一項(xiàng)核心關(guān)鍵技術(shù),并成功應(yīng)用到多個(gè)重要行業(yè)中,虛擬現(xiàn)實(shí)、自動駕駛汽車、機(jī)器人、智能城市和物聯(lián)網(wǎng)等應(yīng)用領(lǐng)域也隨之加速發(fā)展。曠視科技(Face++)在計(jì)算機(jī)視覺通用平臺中以人臉識別技術(shù)為突破點(diǎn),為企業(yè)用戶和開發(fā)者們提供技術(shù)支持。

  機(jī)器視覺是賦予機(jī)器一雙眼睛

  我們知道機(jī)器視覺領(lǐng)域可分為人臉識別、物體識別以及行為、動作識別等,曠視科技是在人臉識別方面做的比較早的。而在人臉識別技術(shù)應(yīng)用中,我們同樣會發(fā)現(xiàn)在數(shù)據(jù)、產(chǎn)品、技術(shù)這幾個(gè)維度形成一個(gè)整體閉環(huán)。通過標(biāo)注出來的有包括人像,物體的信息的圖像數(shù)據(jù),和核心算法、深度學(xué)習(xí)技術(shù)行成自己的產(chǎn)品,比如人臉識別的閘機(jī)、人臉識別機(jī)器人等,然后再通過產(chǎn)品本身來服務(wù)用戶,在用戶使用的過程當(dāng)中自主去學(xué)習(xí)從而產(chǎn)生用戶行為數(shù)據(jù),接而再反哺并促使產(chǎn)品和技術(shù)不斷優(yōu)化、自我學(xué)習(xí)。

  從2011年成立以來,曠視科技(Face++)致力于成為“讓機(jī)器看懂世界”的人工智能公司,賦予機(jī)器一雙慧眼。讓它像人一樣去“觀察”、去“思考”,這樣它就能夠產(chǎn)生更多的功能,從它看的、想的一些數(shù)據(jù)里面繼而形成一個(gè)整體的數(shù)據(jù)分析,而我們可以運(yùn)用這些數(shù)據(jù)去做判斷、檢測、識別還有測量等,這樣以往可能需要人工或半人工做的事情,隨著機(jī)器視覺技術(shù)的變革都可以通過機(jī)器提升效率。

  1:1和1:N

  人臉識別有兩個(gè)比較重要的概念,即1:1和1:N。

  1:1的應(yīng)用于證明自己是自己的場景,你可以想象當(dāng)你去機(jī)場過安檢的時(shí)候,總有一個(gè)人拿著你的身份證對比,身份證里面是不是你本人。這種場景就是1:1的場景。人的肉眼識別精準(zhǔn)度是在95%左右,而人的眼睛是有疲勞度的,所以機(jī)場安檢人員需要在半個(gè)小時(shí)到一個(gè)小時(shí)之內(nèi)換班一次。換崗的目的就是為了保持比較平均的識別的準(zhǔn)確率。但是,在這種場景下,機(jī)器可以達(dá)到97%甚至是更高的準(zhǔn)確率而且機(jī)器沒有疲勞度的問題。

  1:N的特點(diǎn)是動態(tài)和非配合,這是對于1:N而言也是非常重要的兩個(gè)點(diǎn),所謂的動態(tài)也就是識別的不是照片,不是圖片,而是一個(gè)動態(tài)的視頻流;非配合是指識別對象不用感知到攝像頭的位置并配合完成識別工作,而地點(diǎn),陰暗,光線,玻璃都會影響識別的準(zhǔn)確性,所以1:N相對根據(jù)挑戰(zhàn)性。

  在行業(yè)應(yīng)用中,1:1更多是應(yīng)用在金融、核身、信息安全領(lǐng)域,特點(diǎn)是精準(zhǔn)安全。而1:N主要應(yīng)用的方向是在商業(yè)、安防等。比如一個(gè)女士去商場買包包,店員不知道她是否是會員。如果引用機(jī)器視覺技術(shù),不管店員換沒換,當(dāng)顧客進(jìn)門的時(shí)候她的信息就被推送給店員完成精準(zhǔn)的推薦,這就是機(jī)器視覺在商業(yè)領(lǐng)域VIP客戶識別的典型應(yīng)用。在安防方面的應(yīng)用比如公共場所動態(tài)監(jiān)控、緝拿逃犯、人員布控等。

  而無論是1:1還是1:N的場景中,都涉及幾個(gè)比較重要的關(guān)鍵環(huán)節(jié)——人臉檢測、質(zhì)量判斷、識別比對。不管是照片還是視頻流,靜態(tài)還是動態(tài)都要在畫面中判斷出人臉的位置,這便是人臉檢測;第二點(diǎn)質(zhì)量判斷也就是讓機(jī)器去判斷是不是一張正面有效的照片,1:N的動態(tài)場景中更難一些,在動態(tài)過程中,抬頭,低頭,側(cè)臉都是非配合的狀態(tài)。因此質(zhì)量判斷的好壞直接影響最后的結(jié)果。根據(jù)每秒輸出的25-30幀畫面,機(jī)器就會思考哪些會達(dá)到機(jī)器識別的及格線,其中有一張達(dá)到了的時(shí)候就吐出來交由后臺比對數(shù)據(jù)庫以完成最后一步識別比對的工作。

  人臉識別到了大規(guī)模應(yīng)用階段?

  在現(xiàn)實(shí)生活中,大家應(yīng)用的可能還不是很多,一個(gè)新技術(shù)推出時(shí),大家還是很期待的。在6、7年前的支付環(huán)境下,大家對用手機(jī)綁定銀行卡都有著各種疑慮,但是現(xiàn)在,經(jīng)過技術(shù)分發(fā)展和市場的培養(yǎng),現(xiàn)在每個(gè)人的手機(jī)都會綁定一個(gè)賬號,線下的支付場景非常非常多,人們都很少帶現(xiàn)金出門。大家對新技術(shù)的出現(xiàn)都會抱有一種懷疑或者一種有可能出現(xiàn)漏洞的態(tài)度來看。隨著科技的發(fā)展,人們的生活習(xí)慣會潛移默化地發(fā)生改變。

  人臉識別技術(shù)也是一樣,實(shí)際上人臉識別的技術(shù)已經(jīng)到了一個(gè)成熟期,但是由于大眾對這個(gè)技術(shù)陌生,所以大家對它還有一種保守以及懷疑的態(tài)度——這個(gè)是一定會存在的問題,所以目前還沒有大規(guī)模的在現(xiàn)實(shí)生活中應(yīng)用。

  在人臉識別技術(shù)開始普及的這幾年,巨頭公司將會對這種技術(shù)進(jìn)行大幅度的預(yù)熱及積累,比如現(xiàn)在很多應(yīng)用平臺需要手持身份證拍照的實(shí)名驗(yàn)證、還有現(xiàn)在顏值的評分,都是在通過不同的方式測試人臉識別這種技術(shù)。隨著初級的測試不斷完善,新一代的技術(shù)如刷臉去積分、刷臉支付、刷臉簽到等將會得到更普遍的應(yīng)用。當(dāng)這些場景真正的進(jìn)入到大眾生活一段時(shí)間后后,很多事情就是水到渠成了。

  從技術(shù)角度看,人臉識別的識別率早已經(jīng)超過了人眼的水平,目前在金融、安防等領(lǐng)域正在擬定相關(guān)的行業(yè)標(biāo)準(zhǔn)。相比其他生物識別方式而言,人臉識別更為便捷不易盜取,人臉識別技術(shù)水平不能單一地用競賽結(jié)果排名來衡量,畢竟現(xiàn)實(shí)生活場景中的環(huán)境因素和實(shí)驗(yàn)室里有限的數(shù)據(jù)集相比更為復(fù)雜也更具挑戰(zhàn)性,這也是催熟人臉識別走出實(shí)驗(yàn)室實(shí)現(xiàn)產(chǎn)業(yè)化的重要動力。曠視科技(Face++)正在做的就是推動人臉識別走向規(guī)?;瘧?yīng)用,推出行業(yè)智能解決方案,建立集中的生態(tài)。

  人工智能視覺分析能做些什么

  從企業(yè)樓宇到園區(qū),人臉識別智能系統(tǒng)可以與很多人的權(quán)限掛鉤,從人員的考勤到OA系統(tǒng)打通,訪客的管理和注冊,隨之而來的就是更加智能的管理人群和流向,比如機(jī)器可以通過對訪客的人臉進(jìn)行標(biāo)注,告訴他到底那個(gè)入口能進(jìn),哪個(gè)區(qū)域你沒權(quán)限進(jìn)入,也能夠?yàn)槭茉L企業(yè)標(biāo)記訪客來訪時(shí)間和停留位置,這些所有的東西都是圍繞企業(yè)的智能化來展開的。

  在零售領(lǐng)域,隨著互聯(lián)網(wǎng)摧枯拉朽般地變革,線下零售業(yè)正遭受著前所未有的沖擊。而人工智能視覺可以幫助線下零售商家更了解他們的客戶,將線下人群信息向線上轉(zhuǎn)化。通過前端的圖像獲取硬件和機(jī)器視覺技術(shù)分析客群,提供精準(zhǔn)的客流分析如顧客年齡、性別、穿衣風(fēng)格等,甚至停留時(shí)長、熱力圖、行為分析等多維數(shù)據(jù)。

  除此之外,人工智能視覺分析還能夠賦予傳統(tǒng)場景、傳統(tǒng)產(chǎn)品新的使命。比如結(jié)合企業(yè)的需要可以用于考勤、OA管理,在消費(fèi)場景可以幫助經(jīng)營者進(jìn)行精準(zhǔn)營銷,而在生活領(lǐng)域,可以讓業(yè)主獲得更好的居住體驗(yàn)。因此,不管是社區(qū)的刷臉門禁、VIP通道、酒店的人證合一終端機(jī)、展會的刷臉簽到還是智能機(jī)器人的眼睛,都是人工智能機(jī)器視覺技術(shù)在我們生產(chǎn)和生活中的運(yùn)用,只是在不同平臺和場景發(fā)揮著不同的價(jià)值。曠視科技(Face++)要做的就是通過對基礎(chǔ)數(shù)據(jù)的管理、分析,以及智能識別結(jié)構(gòu)化處理,同時(shí)與合作伙伴一起推動人臉識別技術(shù)應(yīng)用和業(yè)務(wù)增長,使傳統(tǒng)的產(chǎn)品更具競爭力。



評論


技術(shù)專區(qū)

關(guān)閉