MaskedFace-Net | 新冠疫情中的口罩檢測（附論文及源代碼）

發(fā)布人：CV研究院時間：2022-03-08 來源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

戴口罩似乎是限制covid-19傳播的一種解決方案。在這種情況下，有效的識別系統(tǒng)被期望用于檢查人在被管制的區(qū)域是否戴口罩。因此，對于訓(xùn)練深度學(xué)習(xí)模型來檢測戴口罩的人和不戴口罩的人，一個大量的戴口罩的人臉數(shù)據(jù)集是必要的。

一、簡要

目前，沒有可用的大型戴口罩人臉圖像數(shù)據(jù)集允許檢查面部是否正確遮擋。事實(shí)上，由于不良行為或個人（如兒童、老年人）的原因，許多人沒有正確地戴上口罩。由于這些原因，一些戴著口罩的活動打算讓人們了解這個問題和良好的做法。

從這個意義上說，有研究者就提出了一種圖像編輯方法和三種遮擋人臉檢測數(shù)據(jù)集；即正確遮擋人臉數(shù)據(jù)集(CMFD)、錯誤遮擋人臉數(shù)據(jù)集(IMFD)及其全局遮擋人臉檢測(MaskedFace-Net)的組合?，F(xiàn)實(shí)的遮擋人臉數(shù)據(jù)集有兩個目標(biāo)：

i)檢測他們是否有戴口罩；ii)檢測是否正確戴口罩（例如在機(jī)場入口或人群中）。

據(jù)我們所知，沒有一個大的遮擋人臉數(shù)據(jù)集為檢測是否戴口罩提供如此細(xì)粒度的分類。此外，這項(xiàng)工作在全球提出了應(yīng)用的遮擋人臉對人臉形變模型，允許生成其他遮擋人臉圖像。新提出的遮擋人臉數(shù)據(jù)集可以在https://github.com/cabani/MaskedFace-Net上找到。由NVIDIA公司在線公開提供的Flickr-Faces-HQ3 (FFHQ)數(shù)據(jù)集，已被用于生成MaskedFace-Net。

二、背景與動機(jī)

戴口罩似乎是限制covid-19傳播的一種解決方案。在這種情況下，有效的識別系統(tǒng)被期望用于檢查人在被管制的區(qū)域是否戴口罩。為了完成這項(xiàng)任務(wù)，訓(xùn)練深度學(xué)習(xí)模型需要大量的遮擋人臉數(shù)據(jù)集來檢測。從這個意義上說，在文獻(xiàn)中可以找到一些具有病毒相關(guān)遮擋的大型人臉圖像數(shù)據(jù)集；例如：MAsked FAces dataset (MAFA)【Detecting masked faces in the wild with lle-cnns. In 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR)】，the Real-World Masked Face Dataset (RMFD)【https://github:com/X-zhangyang/Real-World-Masked-Face-Dataset】和一個遮擋人臉識別數(shù)據(jù)集【Masked face recognition dataset and application. ArXiv:2003.09093】，其由Masked Face Detection Dataset (MFDD), Real-world Masked Face Recognition Dataset (RMFRD) and Simulated Masked Face Recognition Dataset (SMFRD) 組成。

三、應(yīng)用及數(shù)據(jù)輸出

人臉圖像數(shù)據(jù)集(Flickr-Faces-HQ3 (FFHQ))被選為創(chuàng)建一個增強(qiáng)的遮擋人臉圖像。實(shí)際上，F(xiàn)FHQ包含70000張高質(zhì)量的人臉圖像，PNG文件格式為1024×1024分辨率，并公開提供。FFHQ數(shù)據(jù)集在年齡、種族、視點(diǎn)、燈光和圖像背景方面提供了許多多樣性。它最初是作為生成式對抗性網(wǎng)絡(luò)(GAN)的基準(zhǔn)而創(chuàng)建的。

全局?jǐn)?shù)據(jù)流程圖如下圖所示。

上圖顯示了用于生成“correctly/incorrectly masked face images MaskedFace-Net”數(shù)據(jù)集的圖像編輯方法的主要階段。特別是，MaskedFace-Net數(shù)據(jù)集是通過定義一個mask-toface deformable model創(chuàng)建的。

(a)：depicts the structure of the generated MaskedFace-Net dataset.

(b)：shows a pseudo-code of the mask-to-face deformable model applied for generating outputs (a) of the MaskedFace-Net dataset

對于FFHQ【3】的每一個人臉圖像(例如上圖a所示)，基于Haar特征的級聯(lián)分類器被用于檢測一個感興趣的區(qū)域（檢測人臉矩形）。然后，一個特定的關(guān)鍵點(diǎn)檢測器“預(yù)測68個關(guān)鍵點(diǎn)【4】【5】”應(yīng)用于感興趣的檢測區(qū)域，并允許自動檢測68個面部結(jié)構(gòu)的坐標(biāo)(見圖b所示的樣本)。

【3】：“dataset of face images Flickr-Faces-HQ (FFHQ)” https://github:com/NVlabs/ffhq-dataset.

【4】：“Facial point annotations” https://ibug:doc:ic:ac:uk/resources/facial-point-annotations/.

【5】：“shape predictor 68 face landmarks.dat.bz2” https://github:com/davisking/dlib-models#shape_predictor_68_face_landmarksdatbz2.

此外，還選擇了廣泛的face protection mask （single-use blue face protection mask）作為映射的參考圖像（見下圖中的示例)。對于后者，已經(jīng)手動注釋了12個關(guān)鍵點(diǎn)，用于描繪遮擋區(qū)域（多邊形區(qū)域）。

在此階段，針對目標(biāo)情況定義了四種mask-to-face映射（見下圖）即覆蓋鼻子、嘴和下巴，口罩只覆蓋鼻子和嘴，口罩只覆蓋嘴和下巴，口罩只覆蓋嘴以下。

對于每種類型的mask-to-face映射(CMFD、IMFD1、IMFD2或IMFD3)，從自動檢測到的68個位置中保留12個面部關(guān)鍵點(diǎn)的子集；然后與12個遮擋關(guān)鍵點(diǎn)匹配。通過這種方式，遮擋可以適合每個目標(biāo)病例的面部的特定區(qū)域。因此，創(chuàng)建了一個mask-to-face deformable model來生成MaskedFace-Net。此外，每個目標(biāo)情況最多可以有2個關(guān)鍵點(diǎn)（在12個關(guān)鍵點(diǎn)中），它們的位置在有限的周長內(nèi)隨機(jī)移位。因此，MaskedFace-Net也包含了各種各樣的遮擋定位。

最后，應(yīng)用了基于遮擋圖像和人臉圖像之間位置所定義的點(diǎn)對點(diǎn)對應(yīng)關(guān)系變換來映射目標(biāo)人臉區(qū)域上的口罩像素。圖中顯示每種類型的人臉位置實(shí)例和對應(yīng)的口罩映射。

*博客內(nèi)容為網(wǎng)友個人發(fā)布，僅代表博主個人觀點(diǎn)，如有侵權(quán)請聯(lián)系工作人員刪除。

博客專欄

MaskedFace-Net | 新冠疫情中的口罩檢測（附論文及源代碼）

相關(guān)推薦

技術(shù)專區(qū)