NeurIPS 2021 | 尋MixTraining: 一種全新的物體檢測訓(xùn)練范式
來源:專知
MixTraining: 一種全新的物體檢測訓(xùn)練范式
論文鏈接:
https://www.zhuanzhi.ai/paper/b52468c0ddce3d49f7740cfd1528a7a0
代碼鏈接(即將開源):
https://github.com/MendelXu/MixTraining
物體檢測是計(jì)算機(jī)視覺中的基礎(chǔ)課題。經(jīng)典的物體檢測器通常采用單一的數(shù)據(jù)增強(qiáng)策略,并簡單地使用人工標(biāo)注的物體包圍盒來進(jìn)行訓(xùn)練,這種訓(xùn)練策略也被稱為 SiTraining 范式。在本篇論文中,微軟亞洲研究院的研究員們提出了一種全新的物體檢測訓(xùn)練范式:MixTraining。該范式通過引入 Mixed Training Targets(混合訓(xùn)練目標(biāo))與 Mixed Data Augmentation(混合數(shù)據(jù)增廣),可以有效提升現(xiàn)有物體檢測器性能,并且不會在測試階段增加任何額外的開銷。如表4所示,MixTraining 能夠?qū)⒒?ResNet-50 的 Faster R-CNN 的檢測精度從41.7mAP 提升至44.3 mAP,并將基于 Swin-S 的 Cascade R-CNN 的檢測精度從 50.9mAP 提升至 52.8mAP。
表4:MixTraining 可以有效提升多種現(xiàn)有檢測器的檢測性能
除了良好的系統(tǒng)級性能提升以外,研究員們還對該范式為何有效進(jìn)行了深入詳盡的分析與研究。研究員們首先對 Mixed Training Targets (混合訓(xùn)練目標(biāo))的工作機(jī)理進(jìn)行了分析。Mixed Training Targets (混合訓(xùn)練目標(biāo))采用了老師-學(xué)生 (Teacher-Student)架構(gòu)來生成高質(zhì)量的檢測結(jié)果,并將這些檢測結(jié)果作為偽標(biāo)注(Pseudo ground-truth)再與真實(shí)的人類標(biāo)注 (Human-annotated ground-truth)結(jié)合起來共同作為網(wǎng)絡(luò)的訓(xùn)練標(biāo)注。研究員們發(fā)現(xiàn)這種使用混合標(biāo)注有兩種好處:1)可以避免漏標(biāo)的物體(missing label) ;2)可以降低標(biāo)注中的定位噪聲(box loc noise) 。分析結(jié)果如表5所示。
表5:對混合訓(xùn)練目標(biāo)的消融實(shí)驗(yàn)
其次,研究員們還對 Mixed Data Augmentation(混合數(shù)據(jù)增廣)進(jìn)行了進(jìn)一步的研究。研究員們猜測不同的訓(xùn)練實(shí)例可能需要不同強(qiáng)度的數(shù)據(jù)增廣,而不能一概而論地對所有訓(xùn)練示例使用統(tǒng)一的簡單或者過強(qiáng)的數(shù)據(jù)增廣,否則反而有可能會損害訓(xùn)練性能,結(jié)果如表6所示。
表6:對混合數(shù)據(jù)增廣的消融實(shí)驗(yàn)
與此同時(shí),研究員們還發(fā)現(xiàn) MixTraining 可以在更長的訓(xùn)練輪數(shù)中獲得更大的收益,結(jié)果如表7所示。
表7:MixTraining 可以在更長的訓(xùn)練輪數(shù)中獲得更大的收益
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請聯(lián)系工作人員刪除。