Trans論文 | Proposal Learning用于半監(jiān)督的目標檢測
這次分享的以半監(jiān)督目標檢測為研究對象,通過對有標簽和無標簽數(shù)據(jù)的訓練,提高了基于候選的目標檢測器(即two-stages目標檢測器)的檢測精度。然而,由于真值標簽的不可用性,在未標記的數(shù)據(jù)上訓練目標檢測器是非常重要的。
概要
為了解決這個問題,于是就提出了一個 proposal learning方法從標記和未標記的數(shù)據(jù)中學習候選的特征和預測。該方法由自監(jiān)督候選學習模塊和基于一致性的候選學習模塊組成。在自監(jiān)督候選學習模塊中,分別提出了一個候選位置損失和一個對比損失來學習上下文感知和噪聲魯棒的候選特征;在基于一致性的候選學習模塊中,將一致性損失應用于候選的邊界框分類和回歸預測,以學習噪聲穩(wěn)健的候選特征和預測。
最后,在COCO數(shù)據(jù)集上對所有可用的有標簽和無標簽數(shù)據(jù)進行了實驗。結果表明,新方法一致地提高了全監(jiān)督基線的精度。特別是在結合了數(shù)據(jù)蒸餾之后,新方法與全監(jiān)督基線和數(shù)據(jù)蒸餾基線相比,平均提高AP約2.0%和0.9%。
新框架
Problem Definition
在半監(jiān)督目標檢測( Semi-Supervised Object Detec-
tion (SSOD) )中,一組標記數(shù)據(jù)D_l={(I,G)}和一組給出了未標記數(shù)據(jù)的D_u={I},其中I和G分別表示圖像和真值標簽。在目標檢測中,G由一組具有位置和目標類的對象組成。SSOD的目標是訓練目標檢測器,包括標記數(shù)據(jù)D_l和未標記數(shù)據(jù)D_u。
The Overall Framework
對于每一個標記數(shù)據(jù)(I,G)∈D_l,根據(jù)標準的全監(jiān)督損失定義訓練目標檢測器是簡單的,如下公式:
其中第二項分別表示RPN損失和R-CNN損失。該損失在反向傳播過程中優(yōu)化θb、θrpn、θr-cnn、θcls、θreg去訓練目標檢測器。有關損失函數(shù)的更多詳細信息,請參見:
Shaoqing Ren, Kaiming He, Ross Girshick, and Jian Sun. Faster R-CNN: Towards real-time object detection with region proposal networks. IEEE transactions on pattern analysis and machine intelligence, 39(6):1137–1149, 2017
將上面公式中定義的標準全監(jiān)督損失應用于標記數(shù)據(jù)dL,將自監(jiān)督候選學習損失Lself和基于一致性的候選學習損失Lcons應用于未標記數(shù)據(jù)dU。通過優(yōu)化反向傳播過程中的損失方程中的θb,θrpn,θr-cnn,θcls,θreg,θself,對目標檢測器進行了訓練:
然后將總損失寫成如下:
Self-Supervised Proposal Learning
為了計算對比損失,使用instance discrimination作為pretext task:
結合上面的兩個公式中的候選位置損失以及對比損失,自監(jiān)督的候選學習損失寫為:
Consistency-Based Proposal Learning
為了進一步訓練抗噪聲目標檢測器,應用一致性損失來確保噪聲候選預測與其原始候選預測之間的一致性。更準確地說,將一致性損失應用于邊界框分類和回歸預測。對于邊界框分類預測C的一致性損失,使用KL散度作為損失,以強制噪聲候選的類預測及其原始候選一致。
為了進一步確保候選預測的一致性,在下列公式中計算一致性損失,以強制來自噪聲候選的目標位置預測及其原始候選一致:
結合上面的兩個公式,基于一致性的候選學習損失如下:
實驗
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權請聯(lián)系工作人員刪除。