利用先進(jìn)技術(shù)保家衛(wèi)國(guó)：深度學(xué)習(xí)進(jìn)行小目標(biāo)檢測(cè)（適合初學(xué)者入門）

發(fā)布人：CV研究院時(shí)間：2022-01-16 來(lái)源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

論文地址：https://arxiv.org/pdf/2201.03243v1.pdf

一種改進(jìn)且高效的基于深度學(xué)習(xí)的自主系統(tǒng)，該系統(tǒng)可以高精度地檢測(cè)和跟蹤非常小的無(wú)人機(jī)。

整體的介紹都比較基礎(chǔ)簡(jiǎn)單，初學(xué)者可以簡(jiǎn)單了解！

一、前言

如今，無(wú)人機(jī)等被廣泛用于各種用途，例如從航空?qǐng)D像中捕獲和目標(biāo)檢測(cè)等。這些小型ariel車輛輕松進(jìn)入公眾可能會(huì)造成嚴(yán)重的安全威脅。例如，關(guān)鍵地點(diǎn)可能會(huì)被混入公共場(chǎng)所的間諜使用無(wú)人機(jī)監(jiān)控。

Study in hand提出了一種改進(jìn)且高效的基于深度學(xué)習(xí)的自主系統(tǒng)，該系統(tǒng)可以高精度地檢測(cè)和跟蹤非常小的無(wú)人機(jī)。所提出的系統(tǒng)由一個(gè)定制的深度學(xué)習(xí)模型“Tiny YOLOv3”組成，這是一種非常快速的目標(biāo)檢測(cè)模型“You Look Only Once”（YOLO）被構(gòu)建并用于檢測(cè)。目標(biāo)檢測(cè)算法將有效地檢測(cè)無(wú)人機(jī)。與之前的YOLO版本相比，所提出的架構(gòu)顯示出明顯更好的性能。在資源使用和時(shí)間復(fù)雜度方面得到了改進(jìn)。

二、背景

隨著世界在融合最新技術(shù)的同時(shí)不斷進(jìn)步，安全系統(tǒng)也在快速發(fā)展，以利用創(chuàng)新的力量來(lái)應(yīng)對(duì)可能出現(xiàn)的任何安全威脅。在過(guò)去的幾年里，無(wú)人機(jī)的使用量急劇增加，包括對(duì)公眾的可及性，這進(jìn)一步增加了其使用量。隨著無(wú)人機(jī)使用量的增加，安全威脅也隨之增加。我們已經(jīng)看到了一些無(wú)人機(jī)飛越不同建筑物的事件，包括一些需要安全的敏感區(qū)域。

無(wú)人機(jī)還提出了許多威脅，包括無(wú)人機(jī)被用作毒品走私工具、入侵無(wú)人機(jī)導(dǎo)致它們爆炸或使用它們竊取敏感信息，無(wú)人機(jī)還被用于進(jìn)行非法監(jiān)視，造成安全和隱私威脅。這些事件對(duì)安全和隱私構(gòu)成了巨大威脅。因此，解決這些安全問(wèn)題的方法是檢測(cè)和跟蹤這些無(wú)人機(jī)，以便采取反制技術(shù)來(lái)阻止這些無(wú)人機(jī)，以確保安全和隱私。

此外，大多數(shù)安全或防御系統(tǒng)都具有檢測(cè)可能發(fā)生的威脅程度的能力，但是，很少有人能夠深入分析威脅。隨著機(jī)器學(xué)習(xí)和人工智能的進(jìn)步，通過(guò)減少人為干預(yù)使此類系統(tǒng)變得智能化，有效的目標(biāo)檢測(cè)可以幫助提高安全系統(tǒng)的效率并執(zhí)行更好的分析。

三、新框架分析

前期主要介紹了深度學(xué)習(xí)的一些基礎(chǔ)知識(shí)：

Image matrix convolution operation with multiplies filter matrix

Convolution with 3 x3 filter using Stride 2

ReLU operation

Max-Pooling

Fully Connected Layer

如上展示，盡管Tiny YOLOv3比YOLOv3快得多，但它因?yàn)樗?個(gè)尺度上執(zhí)行檢測(cè)，并沒(méi)有提供更好的準(zhǔn)確度。

為了更好地實(shí)現(xiàn)準(zhǔn)確性，研究者引入了一個(gè)修改后的Tiny YOLOv3架構(gòu)。該架構(gòu)總共包括31層：16個(gè)卷積層，3個(gè)檢測(cè)層，其余是用最大池化和ReLU層。以前的YOLOV3微型架構(gòu)由總共24層組成，其中包括13個(gè)卷積層、3個(gè)檢測(cè)層。

研究者修改了Tiny YOLOv3架構(gòu)，通過(guò)使用前幾層的ReLU層提取特征，將在三個(gè)尺度上進(jìn)行檢測(cè)。這意味著3個(gè)yolo層將負(fù)責(zé)檢測(cè)對(duì)象。錨框用于計(jì)算預(yù)測(cè)邊界框的寬度和高度。通常，YOLOv3為每個(gè)單元使用3個(gè)錨點(diǎn)，這些錨點(diǎn)預(yù)測(cè)三個(gè)邊界框，總共9個(gè)錨點(diǎn)框。對(duì)于研究者的自定義目標(biāo)檢測(cè)器，總共使用了6個(gè)錨框。

預(yù)測(cè)特征圖將分別為3個(gè)尺度上的13x13、26x26和52x52。隨著網(wǎng)絡(luò)向前傳播圖像，在第一個(gè)yolo層，得到一個(gè)13x13的輸出特征圖。在放置第一個(gè)yolo層之后，對(duì)下一層進(jìn)行了兩倍的采樣，然后將具有相似大小的前一層的特征圖連接起來(lái)。對(duì)于第二個(gè)yolo層，得到26x26的輸出特征圖，在第三個(gè)yolo層，得到一個(gè)52x52的特征圖。這種架構(gòu)比原始的yolov3架構(gòu)更簡(jiǎn)潔、更小，后者在3個(gè)尺度上進(jìn)行檢測(cè)。此外，研究者的小而輕的架構(gòu)可以檢測(cè)具有高置信度分?jǐn)?shù)的小物體。

四、實(shí)驗(yàn)

Results Evaluated

AVG FPS

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀點(diǎn)，如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。

博客專欄

利用先進(jìn)技術(shù)保家衛(wèi)國(guó)：深度學(xué)習(xí)進(jìn)行小目標(biāo)檢測(cè)（適合初學(xué)者入門）

相關(guān)推薦

技術(shù)專區(qū)