YOffleNet | YOLO V4 基于嵌入式設(shè)備的輕量化改進設(shè)計

發(fā)布人：計算機視覺工坊時間：2021-08-16 來源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

以下文章來源于集智書童，作者ChaucerG

1簡介

最新的基于CNN的目標檢測模型相當(dāng)精確，但需要高性能GPU實時運行。對于內(nèi)存空間有限的嵌入式系統(tǒng)來說，它們在內(nèi)存大小和速度方面依舊不是很好。

由于目標檢測是在嵌入式處理器上進行的，因此在保證檢測精度的同時，最好盡可能地壓縮檢測網(wǎng)絡(luò)。有幾個流行的輕量級檢測模型，但它們的準確性太低。因此，本文提出了一種新的目標檢測模型 YOffleNet，該模型在壓縮率高的同時，將精度損失降到最小，可用于自動駕駛系統(tǒng)上的實時安全駕駛應(yīng)用。該模型的Backbone架構(gòu)是基于YOLOv4實現(xiàn)，但是可以用ShuffleNet的輕量級模塊代替CSP的高計算負荷的DenseNet，從而大大壓縮網(wǎng)絡(luò)。

在KITTI數(shù)據(jù)集上的實驗表明，提出的YOffleNet比YOLOv4-s壓縮了4.7倍，在嵌入式GPU系統(tǒng)(NVIDIA Jetson AGX Xavier)上可以達到46FPS的速度。與高壓縮比相比，精度略有降低，為85.8% mAP，僅比YOLOv4-s低2.6%。因此，提出的網(wǎng)絡(luò)具有很高的潛力部署在嵌入式系統(tǒng)。

2YOLO V4簡述

在YOLOv4的主干網(wǎng)絡(luò)CSPDarknet-53中，CSP將特征卷積一定次數(shù)后復(fù)制使用與前一層特征cat起來，然后利用DenseNet模塊。

在Neck中，輸入特征圖有3種大小。SPP最大池化后concat技術(shù)提高了各種尺寸輸入的準確性。此外，它通過自底向上的路徑增強技術(shù)平滑特征。

YOLOv4引入PANet以促進信息流和它彌補了權(quán)重帶來的精度損失問題。

YOLO v4的Head依舊采用YOLOv3的物體檢測方法。

3YOLO V4輕量化設(shè)計

YOffleNet

YOLOv4中使用的主要模塊是下圖中的CSP DenseNet；此外為了防止初始特征圖中的信息丟失的問題，作者還設(shè)計了PANet結(jié)構(gòu)，其是通過自下而上的路徑增強特征表達的。它促進信息的流動的同時也增加了特征圖中的通道數(shù)、增加參數(shù)的數(shù)量，這也是YOffleNet模型為它改進了上述YOLOv4模型的缺點。

CSP DenseNet

改進點 1

主干層CSP DenseNet是一種隨著深度增加而不可避免地增加計算量的結(jié)構(gòu)。在本研究中，主干網(wǎng)絡(luò)層被配置為ShuffleNet模塊。

ShuffleNet模塊

改進點 2

YOLOv4網(wǎng)絡(luò)中使用的SPP+PANet結(jié)構(gòu)簡化和減輕模型的大小?，F(xiàn)有YOLOv4模型的PANet從主干網(wǎng)絡(luò)分為3層作為輸入的。然而，常見對象檢測情況與自動駕駛環(huán)境不同，有限類別中的物體檢測（汽車、行人等，更小的目標也就少了）。