博客專欄

EEPW首頁 > 博客 > 利用先進(jìn)技術(shù)保家衛(wèi)國:深度學(xué)習(xí)進(jìn)行小目標(biāo)檢測(適合初學(xué)者入門)

利用先進(jìn)技術(shù)保家衛(wèi)國:深度學(xué)習(xí)進(jìn)行小目標(biāo)檢測(適合初學(xué)者入門)

發(fā)布人:CV研究院 時間:2022-01-16 來源:工程師 發(fā)布文章

論文地址:https://arxiv.org/pdf/2201.03243v1.pdf

一種改進(jìn)且高效的基于深度學(xué)習(xí)的自主系統(tǒng),該系統(tǒng)可以高精度地檢測和跟蹤非常小的無人機(jī)。

    整體的介紹都比較基礎(chǔ)簡單,初學(xué)者可以簡單了解!

一、前言

如今,無人機(jī)等被廣泛用于各種用途,例如從航空圖像中捕獲和目標(biāo)檢測等。這些小型ariel車輛輕松進(jìn)入公眾可能會造成嚴(yán)重的安全威脅。例如,關(guān)鍵地點可能會被混入公共場所的間諜使用無人機(jī)監(jiān)控。

1.jpg

Study in hand提出了一種改進(jìn)且高效的基于深度學(xué)習(xí)的自主系統(tǒng),該系統(tǒng)可以高精度地檢測和跟蹤非常小的無人機(jī)。所提出的系統(tǒng)由一個定制的深度學(xué)習(xí)模型“Tiny YOLOv3”組成,這是一種非??焖俚哪繕?biāo)檢測模型“You Look Only Once”(YOLO)被構(gòu)建并用于檢測。目標(biāo)檢測算法將有效地檢測無人機(jī)。與之前的YOLO版本相比,所提出的架構(gòu)顯示出明顯更好的性能。在資源使用和時間復(fù)雜度方面得到了改進(jìn)。

二、背景

隨著世界在融合最新技術(shù)的同時不斷進(jìn)步,安全系統(tǒng)也在快速發(fā)展,以利用創(chuàng)新的力量來應(yīng)對可能出現(xiàn)的任何安全威脅。在過去的幾年里,無人機(jī)的使用量急劇增加,包括對公眾的可及性,這進(jìn)一步增加了其使用量。隨著無人機(jī)使用量的增加,安全威脅也隨之增加。我們已經(jīng)看到了一些無人機(jī)飛越不同建筑物的事件,包括一些需要安全的敏感區(qū)域。

2.jpg

無人機(jī)還提出了許多威脅,包括無人機(jī)被用作毒品走私工具、入侵無人機(jī)導(dǎo)致它們爆炸或使用它們竊取敏感信息,無人機(jī)還被用于進(jìn)行非法監(jiān)視,造成安全和隱私威脅。這些事件對安全和隱私構(gòu)成了巨大威脅。因此,解決這些安全問題的方法是檢測和跟蹤這些無人機(jī),以便采取反制技術(shù)來阻止這些無人機(jī),以確保安全和隱私。

此外,大多數(shù)安全或防御系統(tǒng)都具有檢測可能發(fā)生的威脅程度的能力,但是,很少有人能夠深入分析威脅。隨著機(jī)器學(xué)習(xí)和人工智能的進(jìn)步,通過減少人為干預(yù)使此類系統(tǒng)變得智能化,有效的目標(biāo)檢測可以幫助提高安全系統(tǒng)的效率并執(zhí)行更好的分析。

三、新框架分析

前期主要介紹了深度學(xué)習(xí)的一些基礎(chǔ)知識:

3.png

Image matrix convolution operation with multiplies filter matrix

4.png

Convolution with 3 x3 filter using Stride 2

5.png

ReLU operation

6.png

Max-Pooling

7.png

Fully Connected Layer

8.png

如上展示,盡管Tiny YOLOv3比YOLOv3快得多,但它因為它在2個尺度上執(zhí)行檢測,并沒有提供更好的準(zhǔn)確度。

為了更好地實現(xiàn)準(zhǔn)確性,研究者引入了一個修改后的Tiny YOLOv3架構(gòu)。該架構(gòu)總共包括31層:16個卷積層,3個檢測層,其余是用最大池化和ReLU層。以前的YOLOV3微型架構(gòu)由總共24層組成,其中包括13個卷積層、3個檢測層。

研究者修改了Tiny YOLOv3架構(gòu),通過使用前幾層的ReLU層提取特征,將在三個尺度上進(jìn)行檢測。這意味著3個yolo層將負(fù)責(zé)檢測對象。錨框用于計算預(yù)測邊界框的寬度和高度。通常,YOLOv3為每個單元使用3個錨點,這些錨點預(yù)測三個邊界框,總共9個錨點框。對于研究者的自定義目標(biāo)檢測器,總共使用了6個錨框。

預(yù)測特征圖將分別為3個尺度上的13x13、26x26和52x52。隨著網(wǎng)絡(luò)向前傳播圖像,在第一個yolo層,得到一個13x13的輸出特征圖。在放置第一個yolo層之后,對下一層進(jìn)行了兩倍的采樣,然后將具有相似大小的前一層的特征圖連接起來。對于第二個yolo層,得到26x26的輸出特征圖,在第三個yolo層,得到一個52x52的特征圖。這種架構(gòu)比原始的yolov3架構(gòu)更簡潔、更小,后者在3個尺度上進(jìn)行檢測。此外,研究者的小而輕的架構(gòu)可以檢測具有高置信度分?jǐn)?shù)的小物體。

四、實驗

9.png

Results Evaluated

10.png11.png

AVG FPS

*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。



關(guān)鍵詞: 深度學(xué)習(xí)

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉