博客專欄

EEPW首頁 > 博客 > 單目3D目標檢測之入門(2)

單目3D目標檢測之入門(2)

發(fā)布人:計算機視覺工坊 時間:2023-08-20 來源:工程師 發(fā)布文章

3.發(fā)展情況


Kitti的3D目標檢測排行中,Car類第一的為SFD,Moderate中達到了84.76%,但是Setting中沒有激光點云的符號。排第7的BtcDet使用了該符號,所示直接處理點云的方法至少達到了82%多的AP。


圖片


點云和圖像融合的方法,在Car類的Easy和Moderate類中的AP,其實跟直接處理點云方法的AP差別不是很明顯。


雙目或者說是立體視覺3D目標檢測的方法的AP大概在53%左右。


單目3D目標檢測的AP在16%多吧。


圖片


(更新時間,2021年11月12日)


如果要查找更加詳細的論文和模型精度、建議直接看KITTI關(guān)于3D目標檢測的榜單:The KITTI Vision Benchmark Suite (cvlibs.net)


圖片


這里還有一個純單目3D目標檢測的榜單(包含代碼和論文):


圖片


4. 為什么要做單目的3D目標檢測?


為何最近單目3D目標檢測也成為了一個小熱點領(lǐng)域?起因可能是因為:


  • 偽激光雷達技術(shù)的提出(pseudo-LiDAR),利用圖像模擬出雷達點云圖像;


  • 單目深度估計的逐漸發(fā)展;


  • 純點云,圖像2D,多傳感器融合檢測的研究逐漸成熟,或者說快要達到天花板了。


從傳感這個角度來說,


主動獲取深度信息:如激光雷達、RGB-D相機


  • 價格昂貴,有效的距離小,并且線數(shù)再多的激光雷達獲取的點云也是稀疏的,缺乏紋理信息的。況且激光雷達貴,一輛自動駕駛汽車裝幾個激光雷達、后期怎么維護保養(yǎng),工業(yè)界最看重的是成本問題!!


再說說雙目相機:


  • 誤差較大,要求時間同步,體積較大(基線安裝有要求,如果壞了一個,那就等于報廢)


再說說單目相機:


  • 價格親民


  • 體積小,功耗低;


  • 貼近實際應(yīng)用需求。


并且,單目3D目標檢測也不一定只能用于自動駕駛呀!只要設(shè)備上有攝像頭,有3D檢測的任務(wù)。


這里推薦大家一個單目深度估計的小應(yīng)用場景:https://roxanneluo.github.io/Consistent-Video-Depth-Estimation/;單目3D檢測最重要的一環(huán)就是單目深度估計,而單目深度估計在AR領(lǐng)域是廣泛應(yīng)用滴。


比如AR虛擬試衣間,或者京東淘寶上的一些AR試鞋,你拿手機攝像頭對著自己腳,鞋自動覆蓋到你腳上,這一塊用到的應(yīng)該是目標檢測或者語義分割吧。



二、應(yīng)用場景


推薦點擊在線試鞋,體驗一下AR技術(shù)吧。


單目3D目標檢測的具體應(yīng)用。我隨后會單獨整理在一篇博客中。



三、相關(guān)論文


3D目標檢測綜述:


  • Deep Learning for 3D Point Clouds: A Survey----2020年


  • 3D Object Detection for Autonomous Driving: A Survey—2021年


更多的文獻可查看知乎上的這篇文章:單目3D視覺目標檢測論文總結(jié) - 知乎 (zhihu.com),總結(jié)了100多篇單目3D目標檢測領(lǐng)域的文章。


本專欄下,我將會持續(xù)不斷的更新我讀的一些論文和代碼運行工作。


  1. CaDDN:論文閱讀??代碼調(diào)試



四、相關(guān)數(shù)據(jù)集


這里只列出比較常用的幾個數(shù)據(jù)集的名字。數(shù)據(jù)集的詳細說明在這篇博客中。


  • KITTI Dataset


  • Waymo Open


  • NuScenes Dataset


  • Cityscapes


  • Lyft L5


  • H3D


  • Applloscape


  • Argoverse


圖片



五、自動駕駛領(lǐng)域的相關(guān)企業(yè)


百度華為地平線,小鵬蔚來特斯拉。還挺押韻滴!


國外:Waymo、Cruise、Nuro、Argo;


國內(nèi):百度、華為、AutoX、圖森未來、Pony(小馬智行)、Weride(文遠知行)、Didi(滴滴)、Momenta、縱目科技、智加科技、小鵬、蔚來、理想、嬴徹科技、魔視智能。


每個公司詳細介紹:


國內(nèi):百度、華為、AutoX、圖森未來、Pony(小馬智行)、Weride(文遠知行)、Didi(滴滴)、Momenta、縱目科技、智加科技、小鵬、蔚來、理想、嬴徹科技、魔視智能。


每個公司詳細介紹,我將單獨整理在一篇博客中,包括公司的背景、薪資情況、主要發(fā)展方向。


版權(quán)聲明:本文為CSDN博主「hello689」的原創(chuàng)文章,遵循CC 4.0 BY-SA版權(quán)協(xié)議,轉(zhuǎn)載請附上原文出處鏈接及本聲明。

原文鏈接:

https://blog.csdn.net/jiachang98/article/details/121432839


*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。



關(guān)鍵詞: AI

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉