GPT理解的CV：基于Yolov5的半監(jiān)督目標(biāo)檢測(cè)

發(fā)布人：CV研究院時(shí)間：2023-05-20 來源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

主要貢獻(xiàn)是提出了一種名為“Efficient Teacher”的半監(jiān)督目標(biāo)檢測(cè)算法。與傳統(tǒng)的監(jiān)督學(xué)習(xí)算法不同，Efficient Teacher利用無標(biāo)簽數(shù)據(jù)進(jìn)行訓(xùn)練，并且在訓(xùn)練過程中使用了半監(jiān)督學(xué)習(xí)的方法。這種方法可以有效地利用無標(biāo)簽數(shù)據(jù)，減少過擬合的風(fēng)險(xiǎn)，并且可以提高模型的泛化能力。

注意：本文主要是GPT解讀，如有差異請(qǐng)?jiān)诹粞灾赋觯?/span>

概要

半監(jiān)督目標(biāo)檢測(cè)（SSOD）已經(jīng)成功地提高了R-CNN系列和無錨檢測(cè)器的性能。然而，一級(jí)基于錨的檢測(cè)器缺乏生成高質(zhì)量或靈活偽標(biāo)簽的結(jié)構(gòu)，導(dǎo)致SSOD中存在嚴(yán)重的不一致性問題。在今天分享中，提出了一個(gè)高效的教師框架，用于可擴(kuò)展和有效的基于單階段錨的SSOD訓(xùn)練，該框架由密集檢測(cè)器、偽標(biāo)簽分配器和Epoch適配器組成。Dense Detector是一個(gè)基線模型，它以YOLOv5為靈感，使用密集采樣技術(shù)擴(kuò)展了RetinaNet。高效教師框架引入了一種新的偽標(biāo)簽分配機(jī)制，稱為偽標(biāo)簽分配器，它更精細(xì)地利用了密集檢測(cè)器中的偽標(biāo)簽。

Epoch Adaptor是一種為密集探測(cè)器提供穩(wěn)定高效的端到端SSOD訓(xùn)練計(jì)劃的方法。偽標(biāo)簽分配器防止了在師生相互學(xué)習(xí)機(jī)制期間由大量低質(zhì)量偽標(biāo)簽引起的可能干擾密集檢測(cè)器的偏差的發(fā)生，并且Epoch適配器利用域和分布自適應(yīng)來允許密集檢測(cè)器學(xué)習(xí)全局分布的一致特征，使得訓(xùn)練與標(biāo)記數(shù)據(jù)的比例無關(guān)。我們的實(shí)驗(yàn)表明，高效教師框架在VOC、COCO標(biāo)準(zhǔn)和COCO附加方面取得了最先進(jìn)的結(jié)果，使用的FLOP比以前的方法更少。據(jù)我們所知，這是將SSOD應(yīng)用于YOLOv5的第一次嘗試。

新框架

高效教師（Efficient Teacher）是一種新穎高效的半監(jiān)督目標(biāo)檢測(cè)框架，它顯著提高了基于單級(jí)錨點(diǎn)的檢測(cè)器的性能。該框架基于師生相互學(xué)習(xí)的方法，如下圖所示，靈感來自以前的工作。提出的偽標(biāo)簽分配器方法根據(jù)偽標(biāo)簽的得分將其分為可靠和不確定的偽標(biāo)簽，其中可靠的偽標(biāo)簽用于默認(rèn)監(jiān)督訓(xùn)練，不確定的用于指導(dǎo)軟損失學(xué)生模型的訓(xùn)練。Epoch-Adaptor方法通過在標(biāo)記數(shù)據(jù)和未標(biāo)記數(shù)據(jù)之間進(jìn)行域自適應(yīng)，并計(jì)算每個(gè)歷元中偽標(biāo)簽的閾值，來加速收斂。在整個(gè)培訓(xùn)過程中，教師模型采用指數(shù)移動(dòng)平均（EMA）技術(shù)進(jìn)行更新。

比較RetinaNet和檢測(cè)聚類器的偽指標(biāo)分布圖，發(fā)現(xiàn)：

（a）RetinaNet使用了更少的輸入數(shù)據(jù)，產(chǎn)生了更高的分辨率，暗色表示分?jǐn)?shù)較低；
（b）檢測(cè)聚類器利用更多的輸入數(shù)據(jù)，根據(jù)物體特征和分類結(jié)果產(chǎn)生了更強(qiáng)健和更密集的反應(yīng)。

偽標(biāo)簽過濾是 SSOD 中常用的一種方法，閾值設(shè)置太低會(huì)產(chǎn)生錯(cuò)誤的偽標(biāo)簽，而閾值設(shè)置太高則可能排除可靠的偽標(biāo)簽，從而導(dǎo)致分配不佳，進(jìn)而影響網(wǎng)絡(luò)訓(xùn)練的效果。為了解決這個(gè)問題，我們提出了偽標(biāo)簽分配器方法，該方法根據(jù)高低閾值將偽標(biāo)簽分為可靠和不可靠的類別，分別為目標(biāo) L 提高單目標(biāo) SSOD 中偽標(biāo)簽的質(zhì)量。

Main epoch 表示整個(gè)訓(xùn)練期間不中斷，并且在執(zhí)行期間沒有任何新權(quán)重的加載。有效教師的訓(xùn)練策略：（a）在標(biāo)記數(shù)據(jù)上進(jìn)行監(jiān)督訓(xùn)練，然后在未標(biāo)記數(shù)據(jù)上進(jìn)行基于標(biāo)記的 SSOD 訓(xùn)練；（b）在標(biāo)記數(shù)據(jù)上進(jìn)行監(jiān)督訓(xùn)練，并在未標(biāo)記數(shù)據(jù)上進(jìn)行基于標(biāo)記的 SSOD 訓(xùn)練以外的額外基于標(biāo)記的 SSOD 訓(xùn)練；（c）在標(biāo)記數(shù)據(jù)和未標(biāo)記數(shù)據(jù)上進(jìn)行端到端訓(xùn)練，并使用適應(yīng)域和分布的 Epoch 適配器以改進(jìn)收斂和特征分布。

實(shí)驗(yàn)

Experimental results on COCO-standard (AP50:95)

PASCAL-VOC的實(shí)驗(yàn)結(jié)果。?表示使用ImageNet預(yù)訓(xùn)練骨干來初始化高效教師

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀點(diǎn)，如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。

博客專欄

GPT理解的CV：基于Yolov5的半監(jiān)督目標(biāo)檢測(cè)

相關(guān)推薦

技術(shù)專區(qū)