博客專欄

EEPW首頁 > 博客 > NeurIPS 2021 | 尋MixTraining: 一種全新的物體檢測訓(xùn)練范式

NeurIPS 2021 | 尋MixTraining: 一種全新的物體檢測訓(xùn)練范式

發(fā)布人:數(shù)據(jù)派THU 時(shí)間:2021-12-18 來源:工程師 發(fā)布文章

來源:專知

MixTraining: 一種全新的物體檢測訓(xùn)練范式

1.png

論文鏈接:

https://www.zhuanzhi.ai/paper/b52468c0ddce3d49f7740cfd1528a7a0

代碼鏈接(即將開源):

https://github.com/MendelXu/MixTraining

物體檢測是計(jì)算機(jī)視覺中的基礎(chǔ)課題。經(jīng)典的物體檢測器通常采用單一的數(shù)據(jù)增強(qiáng)策略,并簡單地使用人工標(biāo)注的物體包圍盒來進(jìn)行訓(xùn)練,這種訓(xùn)練策略也被稱為 SiTraining 范式。在本篇論文中,微軟亞洲研究院的研究員們提出了一種全新的物體檢測訓(xùn)練范式:MixTraining。該范式通過引入 Mixed Training Targets(混合訓(xùn)練目標(biāo))與 Mixed Data Augmentation(混合數(shù)據(jù)增廣),可以有效提升現(xiàn)有物體檢測器性能,并且不會在測試階段增加任何額外的開銷。如表4所示,MixTraining 能夠?qū)⒒?ResNet-50 的 Faster R-CNN 的檢測精度從41.7mAP 提升至44.3 mAP,并將基于 Swin-S 的 Cascade R-CNN 的檢測精度從 50.9mAP 提升至 52.8mAP。

2.png

表4:MixTraining 可以有效提升多種現(xiàn)有檢測器的檢測性能

除了良好的系統(tǒng)級性能提升以外,研究員們還對該范式為何有效進(jìn)行了深入詳盡的分析與研究。研究員們首先對 Mixed Training Targets (混合訓(xùn)練目標(biāo))的工作機(jī)理進(jìn)行了分析。Mixed Training Targets (混合訓(xùn)練目標(biāo))采用了老師-學(xué)生 (Teacher-Student)架構(gòu)來生成高質(zhì)量的檢測結(jié)果,并將這些檢測結(jié)果作為偽標(biāo)注(Pseudo ground-truth)再與真實(shí)的人類標(biāo)注 (Human-annotated ground-truth)結(jié)合起來共同作為網(wǎng)絡(luò)的訓(xùn)練標(biāo)注。研究員們發(fā)現(xiàn)這種使用混合標(biāo)注有兩種好處:1)可以避免漏標(biāo)的物體(missing label) ;2)可以降低標(biāo)注中的定位噪聲(box loc noise) 。分析結(jié)果如表5所示。

3.png

表5:對混合訓(xùn)練目標(biāo)的消融實(shí)驗(yàn)

其次,研究員們還對 Mixed Data Augmentation(混合數(shù)據(jù)增廣)進(jìn)行了進(jìn)一步的研究。研究員們猜測不同的訓(xùn)練實(shí)例可能需要不同強(qiáng)度的數(shù)據(jù)增廣,而不能一概而論地對所有訓(xùn)練示例使用統(tǒng)一的簡單或者過強(qiáng)的數(shù)據(jù)增廣,否則反而有可能會損害訓(xùn)練性能,結(jié)果如表6所示。

4.png

表6:對混合數(shù)據(jù)增廣的消融實(shí)驗(yàn)

與此同時(shí),研究員們還發(fā)現(xiàn) MixTraining 可以在更長的訓(xùn)練輪數(shù)中獲得更大的收益,結(jié)果如表7所示。

5.png

表7:MixTraining 可以在更長的訓(xùn)練輪數(shù)中獲得更大的收益

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請聯(lián)系工作人員刪除。



關(guān)鍵詞: AI

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉