GPT理解的CV:基于Yolov5的半監(jiān)督目標(biāo)檢測(cè)
主要貢獻(xiàn)是提出了一種名為“Efficient Teacher”的半監(jiān)督目標(biāo)檢測(cè)算法。與傳統(tǒng)的監(jiān)督學(xué)習(xí)算法不同,Efficient Teacher利用無(wú)標(biāo)簽數(shù)據(jù)進(jìn)行訓(xùn)練,并且在訓(xùn)練過(guò)程中使用了半監(jiān)督學(xué)習(xí)的方法。這種方法可以有效地利用無(wú)標(biāo)簽數(shù)據(jù),減少過(guò)擬合的風(fēng)險(xiǎn),并且可以提高模型的泛化能力。
注意:本文主要是GPT解讀,如有差異請(qǐng)?jiān)诹粞灾赋觯?/span>
01
概要
半監(jiān)督目標(biāo)檢測(cè)(SSOD)已經(jīng)成功地提高了R-CNN系列和無(wú)錨檢測(cè)器的性能。然而,一級(jí)基于錨的檢測(cè)器缺乏生成高質(zhì)量或靈活偽標(biāo)簽的結(jié)構(gòu),導(dǎo)致SSOD中存在嚴(yán)重的不一致性問(wèn)題。在今天分享中,提出了一個(gè)高效的教師框架,用于可擴(kuò)展和有效的基于單階段錨的SSOD訓(xùn)練,該框架由密集檢測(cè)器、偽標(biāo)簽分配器和Epoch適配器組成。Dense Detector是一個(gè)基線模型,它以YOLOv5為靈感,使用密集采樣技術(shù)擴(kuò)展了RetinaNet。高效教師框架引入了一種新的偽標(biāo)簽分配機(jī)制,稱(chēng)為偽標(biāo)簽分配器,它更精細(xì)地利用了密集檢測(cè)器中的偽標(biāo)簽。
Epoch Adaptor是一種為密集探測(cè)器提供穩(wěn)定高效的端到端SSOD訓(xùn)練計(jì)劃的方法。偽標(biāo)簽分配器防止了在師生相互學(xué)習(xí)機(jī)制期間由大量低質(zhì)量偽標(biāo)簽引起的可能干擾密集檢測(cè)器的偏差的發(fā)生,并且Epoch適配器利用域和分布自適應(yīng)來(lái)允許密集檢測(cè)器學(xué)習(xí)全局分布的一致特征,使得訓(xùn)練與標(biāo)記數(shù)據(jù)的比例無(wú)關(guān)。我們的實(shí)驗(yàn)表明,高效教師框架在VOC、COCO標(biāo)準(zhǔn)和COCO附加方面取得了最先進(jìn)的結(jié)果,使用的FLOP比以前的方法更少。據(jù)我們所知,這是將SSOD應(yīng)用于YOLOv5的第一次嘗試。
02
新框架
高效教師(Efficient Teacher)是一種新穎高效的半監(jiān)督目標(biāo)檢測(cè)框架,它顯著提高了基于單級(jí)錨點(diǎn)的檢測(cè)器的性能。該框架基于師生相互學(xué)習(xí)的方法,如下圖所示,靈感來(lái)自以前的工作。提出的偽標(biāo)簽分配器方法根據(jù)偽標(biāo)簽的得分將其分為可靠和不確定的偽標(biāo)簽,其中可靠的偽標(biāo)簽用于默認(rèn)監(jiān)督訓(xùn)練,不確定的用于指導(dǎo)軟損失學(xué)生模型的訓(xùn)練。Epoch-Adaptor方法通過(guò)在標(biāo)記數(shù)據(jù)和未標(biāo)記數(shù)據(jù)之間進(jìn)行域自適應(yīng),并計(jì)算每個(gè)歷元中偽標(biāo)簽的閾值,來(lái)加速收斂。在整個(gè)培訓(xùn)過(guò)程中,教師模型采用指數(shù)移動(dòng)平均(EMA)技術(shù)進(jìn)行更新。
比較RetinaNet和檢測(cè)聚類(lèi)器的偽指標(biāo)分布圖,發(fā)現(xiàn):
(a)RetinaNet使用了更少的輸入數(shù)據(jù),產(chǎn)生了更高的分辨率,暗色表示分?jǐn)?shù)較低;
(b)檢測(cè)聚類(lèi)器利用更多的輸入數(shù)據(jù),根據(jù)物體特征和分類(lèi)結(jié)果產(chǎn)生了更強(qiáng)健和更密集的反應(yīng)。
偽標(biāo)簽過(guò)濾是 SSOD 中常用的一種方法,閾值設(shè)置太低會(huì)產(chǎn)生錯(cuò)誤的偽標(biāo)簽,而閾值設(shè)置太高則可能排除可靠的偽標(biāo)簽,從而導(dǎo)致分配不佳,進(jìn)而影響網(wǎng)絡(luò)訓(xùn)練的效果。為了解決這個(gè)問(wèn)題,我們提出了偽標(biāo)簽分配器方法,該方法根據(jù)高低閾值將偽標(biāo)簽分為可靠和不可靠的類(lèi)別,分別為目標(biāo) L 提高單目標(biāo) SSOD 中偽標(biāo)簽的質(zhì)量。
Main epoch 表示整個(gè)訓(xùn)練期間不中斷,并且在執(zhí)行期間沒(méi)有任何新權(quán)重的加載。有效教師的訓(xùn)練策略:(a)在標(biāo)記數(shù)據(jù)上進(jìn)行監(jiān)督訓(xùn)練,然后在未標(biāo)記數(shù)據(jù)上進(jìn)行基于標(biāo)記的 SSOD 訓(xùn)練;(b)在標(biāo)記數(shù)據(jù)上進(jìn)行監(jiān)督訓(xùn)練,并在未標(biāo)記數(shù)據(jù)上進(jìn)行基于標(biāo)記的 SSOD 訓(xùn)練以外的額外基于標(biāo)記的 SSOD 訓(xùn)練;(c)在標(biāo)記數(shù)據(jù)和未標(biāo)記數(shù)據(jù)上進(jìn)行端到端訓(xùn)練,并使用適應(yīng)域和分布的 Epoch 適配器以改進(jìn)收斂和特征分布。
03
實(shí)驗(yàn)
Experimental results on COCO-standard (AP50:95)
PASCAL-VOC的實(shí)驗(yàn)結(jié)果。?表示使用ImageNet預(yù)訓(xùn)練骨干來(lái)初始化高效教師
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。