目標(biāo)檢測新框架:大幅度提升檢測精度
目標(biāo)檢測中,點特征使用方便,但可能缺乏精確定位的明確邊界信息。
1 簡述
密集物體檢測器依賴于滑動窗口范式,可以在規(guī)則的圖像網(wǎng)格上預(yù)測物體。同時,采用網(wǎng)格點上的特征圖來生成邊界框預(yù)測。點特征使用方便,但可能缺乏精確定位的明確邊界信息。
在今天分享中,有研究者提出了一種簡單高效的算子,稱為 Border-Align,從邊界的極值點提取“邊界特征”以增強(qiáng)點特征?;贐orderAlign,研究者設(shè)計了一種稱為BorderDet的新型檢測架構(gòu),它明確利用邊界信息進(jìn)行更強(qiáng)的分類和更準(zhǔn)確的定位。
2 背景
Sliding Window
滑窗法作為一種經(jīng)典的物體檢測方法,個人認(rèn)為不同大小的窗口在圖像上進(jìn)行滑動時候,進(jìn)行卷積運(yùn)算后的結(jié)果與已經(jīng)訓(xùn)練好的分類器判別存在物體的概率。選擇性搜索(Selective Search)是主要運(yùn)用圖像分割技術(shù)來進(jìn)行物體檢測。
通過滑窗法流程圖可以很清晰理解其主要思路:首先對輸入圖像進(jìn)行不同窗口大小的滑窗進(jìn)行從左往右、從上到下的滑動。每次滑動時候?qū)Ξ?dāng)前窗口執(zhí)行分類器(分類器是事先訓(xùn)練好的)。如果當(dāng)前窗口得到較高的分類概率,則認(rèn)為檢測到了物體。對每個不同窗口大小的滑窗都進(jìn)行檢測后,會得到不同窗口檢測到的物體標(biāo)記,這些窗口大小會存在重復(fù)較高的部分,最后采用非極大值抑制(Non-Maximum Suppression, NMS)的方法進(jìn)行篩選。最終,經(jīng)過NMS篩選后獲得檢測到的物體。
3 新框架分析
滑動窗口目標(biāo)檢測器通常在密集的、規(guī)則的特征圖網(wǎng)格上生成邊界框預(yù)測。如上圖所示,網(wǎng)格每個點上的特征一般用于預(yù)測目標(biāo)的類別和位置。這種基于點的特征表示很難包含有效的邊界特征,并且可能會限制目標(biāo)檢測器的定位能力。對于兩階段目標(biāo)檢測器,目標(biāo)由從整個邊界框中提取的區(qū)域特征來描述,如上圖(b)所示。這種基于區(qū)域的特征表示能夠為目標(biāo)分類和定位提供比基于點的特征表示更豐富的特征。
在上表中,研究者對邊界框的特征表示進(jìn)行了更深入的分析。首先,采用一個簡單的密集目標(biāo)檢測器(FCOS)作為新框架的基線來生成粗邊界框預(yù)測。
Border Align
受R-FCN的啟發(fā),新框架的BorderAlign以具有(4 + 1)C通道的邊界敏感特征圖I作為輸入。特征圖的4C通道對應(yīng)四個邊界(左、上、右、下)。
border-sensitive特征圖可視化
邊界上的橙色圓圈表示極值點。'Single Point', 'Left Border', 'Top Border', 'Right Border' 和 'Bottom Border'的特征圖是邊界敏感特征圖的每個 C 通道的最大特征值。
新方法也可以作為典型的兩級檢測器的更好的候選生成器。 研究者將邊界對齊模塊添加到RPN并將新結(jié)構(gòu)表示為BorderRPN。BorderRPN的架構(gòu)如上圖所示。保留RPN中的回歸分支來預(yù)測粗邊界框位置。RPN中的第一個3 × 3卷積被替換為3 × 3空洞卷積以增加有效感受野。
4 實驗
在NVIDIA 2080Ti GPU上的測試結(jié)果
在某種程度上,可證明BorderAlign確實在提取邊界極限的特征,且邊界極限點的特征對物體的精準(zhǔn)定位確實有一些幫助。
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。