LiTAMIN2：一種超輕型LiDAR-SLAM（ICRA2021）

發(fā)布人：計(jì)算機(jī)視覺工坊時(shí)間：2021-05-25 來源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

(文獻(xiàn)閱讀) LiTAMIN2: Ultra Light LiDAR-based SLAM using Geometric Approximation applied with KL-Divergence

論文作者：Masashi Yokozuka, Kenji Koide, Shuji Oishi, Atsuhiko Banno

文章來源：ICRA2021論文（點(diǎn)云配準(zhǔn)）

視頻、論文地址：在公眾號(hào)「計(jì)算機(jī)視覺工坊」，后臺(tái)回復(fù)「LiTAMIN2」，即可直接下載。

其中的版本1，LiTAMIN: LiDAR-based Tracking And Mapping by Stabilized ICP for Geometry Approximation with Normal Distributions.

可參考博客：https://blog.csdn.net/Yong_Qi2015/article/details/114528734；

論文鏈接：https://ieeexplore.ieee.org/document/9341341

翻譯：chaochaoSEU

摘要：本文提出了一種可用于500-1000hz處理的3D LiDAR SLAM方法。該方法利用一種新的ICP度量，顯著減少了點(diǎn)云配準(zhǔn)的點(diǎn)數(shù)，同時(shí)保持了配置精度。當(dāng)點(diǎn)數(shù)減少時(shí)，采用ICP法的點(diǎn)云配準(zhǔn)就不那么準(zhǔn)確了，因?yàn)镮CP基于的是點(diǎn)之間的距離最小化。為了避免這一問題，將對稱的KL-散度引入到反映兩個(gè)概率分布之間差異的ICP代價(jià)函數(shù)中。代價(jià)函數(shù)不僅包括點(diǎn)之間的距離，還包括分布形狀之間的差異。在KITTI數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明，該方法具有很高的計(jì)算效率，性能優(yōu)于其他方法，并且與現(xiàn)有最先進(jìn)的SLAM方法具有相似的精度。

1 引言

同時(shí)定位與建圖（SLAM）是移動(dòng)技術(shù)和服務(wù)的一個(gè)基本元素，如自主移動(dòng)機(jī)器人。特別是，LiDAR和深度傳感器已經(jīng)被商業(yè)化，且由于其穩(wěn)定和準(zhǔn)確的性能而正在被應(yīng)用。在不久的將來，不僅是自動(dòng)駕駛的汽車，而且所有類型的移動(dòng)設(shè)備都將配備激光雷達(dá)或深度傳感器。我們預(yù)計(jì)，在這樣一個(gè)世界中，通過SLAM獲取的點(diǎn)云數(shù)據(jù)將被聚合到云端并共享以提供各種服務(wù)。

有必要從全球的設(shè)備中實(shí)時(shí)聚合的大量點(diǎn)云數(shù)據(jù)中有效地生成和更新世界地圖。由于在此過程中使用的服務(wù)器的數(shù)量比設(shè)備的數(shù)量要小得多，因此必須使用超出實(shí)時(shí)性能的SLAM方法。目前LiDAR-SLAM的性能只稍微好于實(shí)時(shí)性能。

除了服務(wù)器之外，操作邊緣設(shè)備也需要加速，而邊緣設(shè)備在計(jì)算資源方面受到了嚴(yán)重的限制。目前LiDAR-SLAM是基于使用CPU和GPU的PC保證實(shí)時(shí)性，提高SLAM方法的計(jì)算效率以確保邊緣設(shè)備的實(shí)時(shí)性。

雖然許多研究已經(jīng)在SLAM基準(zhǔn) [1]和追求精度的方法[2]-[14]上進(jìn)行，但很少有研究已經(jīng)顯著提高了目前的計(jì)算效率。在未來，要集中、高效地處理大量的機(jī)器人和設(shè)備，SLAM方法將更加追求高速。

本文的目的是建立一種與最先進(jìn)方法一樣準(zhǔn)確的方法，同時(shí)實(shí)時(shí)性顯著超過當(dāng)前方法。本文討論了一種3D LiDAR-SLAM，其顯著提高了LiDAR-SLAM的計(jì)算效率，可在500-1000 Hz下運(yùn)行，且提供了與最先進(jìn)方法相同的精度。該方法在保持精度的同時(shí)，使用一種新的ICP度量，顯著減少了用于點(diǎn)云配準(zhǔn)的點(diǎn)數(shù)。采用ICP的點(diǎn)云配準(zhǔn)方法在點(diǎn)云數(shù)較少時(shí)，精度低。為了避免這個(gè)問題，引入了對稱的ICP代價(jià)函數(shù)。實(shí)驗(yàn)結(jié)果（圖1)表明，該方法具有很高的計(jì)算效率，性能優(yōu)于其他方法，并與最先進(jìn)SLAM方法有相似的精度。

圖1 使用LiTAMIN2的KITTI數(shù)據(jù)序列00的示例建圖結(jié)果。右下角圖的顏色表示由主成分分析分解的正態(tài)分布給出的正態(tài)方向，該方向是最小特征值的特征向量。

2 相關(guān)工作

LiDAR-SLAM方法可以分為兩類：基于 ICP的方法[2]-[8]和基于特征的方法[9]-[14]。

對于基于ICP的方法而言，體素化是一種簡單而有效的加速方法。通過將點(diǎn)云劃分為小群，并以正態(tài)分布逼近每個(gè)子點(diǎn)云，可以在一定程度上在保持形狀的同時(shí)顯著減少點(diǎn)的數(shù)量。正態(tài)分布變換(NDT)[15]-[17]和GICP[18]是執(zhí)行體素逼近的最常用的icp方法，但它們之間存在一些區(qū)別。NDT只逼近具有正態(tài)分布的目標(biāo)點(diǎn)，并確定體素對應(yīng)，而GICP對目標(biāo)點(diǎn)云和源點(diǎn)云進(jìn)行正態(tài)分布逼近，并使用KD樹的精確最近鄰搜索尋找相關(guān)性。NDT的計(jì)算效率往往更高，而GICP則往往更準(zhǔn)確。

基于特征的方法是從LiDAR數(shù)據(jù)中提取點(diǎn)、線、面等幾何特征，并有效地確定對應(yīng)關(guān)系。LOAM[9]是第一個(gè)使用特征方法進(jìn)行快速和準(zhǔn)確的LiDAR里程計(jì)。它使用特征匹配顯著減少了定位階段所需的點(diǎn)數(shù)。LeGo-LAOM [11]只依靠良好的性能來執(zhí)行特性選擇，是目前可用的最快方法之一[2]。

為了實(shí)現(xiàn)更快的配準(zhǔn)，一些方法利用GPU的計(jì)算能力，包括SuMa[4]、Elastic-Fusion [6]、Elastic-LiDAR Fusion [5]和Droeschel等的方法[8]。它們將LiDAR數(shù)據(jù)的形狀近似為Surfel (面元)[19]。Surfel是一種基于點(diǎn)的渲染方法[20]，它旨在用點(diǎn)云而不是多邊形網(wǎng)格來渲染三維形狀，并且適用于GPU處理。因此，它允許通過使用硬件支持的投影數(shù)據(jù)關(guān)聯(lián)來實(shí)現(xiàn)快速的點(diǎn)對平面ICP[21]的性能。

基于深度神經(jīng)網(wǎng)絡(luò)的LiDAR里程計(jì)[22]-[24]的方法也已經(jīng)流行起來。LO-Net[22]是一種端到端的LiDAR里程計(jì)。雖然用于訓(xùn)練和測試的數(shù)據(jù)變化較少，但它顯示的精度與傳統(tǒng)方法相似。LO-Net主要是卷積張量運(yùn)算，這使得點(diǎn)對點(diǎn)處理的并行化更加容易，對GPU的未來演化也可擴(kuò)展。然而，端到端里程計(jì)估計(jì)是否可在未學(xué)習(xí)的環(huán)境和運(yùn)動(dòng)下工作尚未得到足夠的研究，因此需要進(jìn)一步的研究。

當(dāng)前的LiDAR SLAM方法大約需要N點(diǎn)數(shù)的O（N）或O（Nlog（N）），并且從理論上講，應(yīng)該引入不同的方法來改進(jìn)算法。本研究中的主張簡單明了：基于ICP的方法所需的點(diǎn)數(shù)應(yīng)該少。通常，基于ICP的方法的準(zhǔn)確性會(huì)隨著點(diǎn)數(shù)的減少而降低；因此，應(yīng)該找到一種方法來解決速度和精度之間的權(quán)衡問題。

3 數(shù)學(xué)模型

在本節(jié)中，我們描述了該方法與LiTAMIN[2]之間的差異；這些差異是用于減少點(diǎn)數(shù)的方法和使用ICP代價(jià)函數(shù)。

A.減少點(diǎn)數(shù)

如圖2所示，LiTAMIN將一組輸入點(diǎn)投****到體素網(wǎng)格中，使用投****點(diǎn)的方法對齊它們，并將點(diǎn)云集成到體素圖中。該方法以類似的方式執(zhí)行SLAM，但不同之處在于，它對輸入點(diǎn)組的投****結(jié)果使用了協(xié)方差，而不僅僅是平均值。而LiTAMIN是一種point-to-normal分布建圖，該方法將其擴(kuò)展到distribution-to-normal分布建圖。這是為了通過考慮分布來提高準(zhǔn)確性。該方法增加了每個(gè)體素的大小，減少了點(diǎn)數(shù)，這大大降低了計(jì)算成本。此外，它通過考慮分布的形狀而不是點(diǎn)來避免了精度的損失。

圖2 我們的方法概述。右圖的顏色表示通過使用主成分分析分解的正態(tài)分布給出的法線方向；顏色類似于圖1中的顏色。

B．應(yīng)用于對稱KL散度的ICP代價(jià)函數(shù)

表1顯示了現(xiàn)有方法和所提方法的ICP代價(jià)函數(shù)。該方法與其他方法的區(qū)別在于，代價(jià)不僅考慮了點(diǎn)之間的距離，還考慮了分布的形狀。雖然其他的方法，如NDT[15]，GICP[18]和LiTAMIN [2]，已經(jīng)考慮了協(xié)方差，但在實(shí)踐中，它們只通過加權(quán)協(xié)方差的倒數(shù)來評(píng)估距離。該方法同時(shí)計(jì)算第一項(xiàng)的加權(quán)距離和第二項(xiàng)的分布形狀差異。例如，如果點(diǎn)之間的距離很小，但分布的形狀不匹配，則代價(jià)函數(shù)被設(shè)計(jì)為很大。這個(gè)代價(jià)來自于兩個(gè)高斯分布p和q[25]的KL-散度DKL(p||q)[26]：

KL-散度是對分布之間差異的一種度量，它不僅代表了平均值之間的差異，而且還代表了分布形狀之間的差異。KL-散度的目的是進(jìn)行一個(gè)考慮到分布形狀的魯棒配準(zhǔn)。

然而，KL-散度DKL(p||q) ≠DKL(q||p)并不對稱：它通常被認(rèn)為不是一個(gè)距離。由于ICP是一種距離最小化算法，需要更合適的度量，因此使用DSymKL(p||q)，本研究引入了以下對稱性：

通過在DSymKL(p||q)中應(yīng)用歸一化，并引入剛體變換R和t，得到了代價(jià)函數(shù)，為了進(jìn)一步解決異常值，ICP誤差EICP和分布形狀誤差ECOV設(shè)置如下：

另外，其權(quán)重如下：

在表1中，考慮到LiTAMIN的兩個(gè)分布的協(xié)方差，所提出的方法的第一項(xiàng)可以看作是ICP代價(jià)。與LiTAMIN主要區(qū)別是第二個(gè)代表分布形狀差異的術(shù)語。在本研究中，引入這個(gè)項(xiàng)，使精度不會(huì)降低，即使點(diǎn)的數(shù)量因?yàn)榇蟮捏w素大小而大大減少。它可以只計(jì)算第一項(xiàng)，即ICP代價(jià)。因此，研究了僅是第一項(xiàng)的情況與實(shí)驗(yàn)中第一項(xiàng)和第二項(xiàng)組合的情況之間的差異。

C.實(shí)現(xiàn)和參數(shù)

本研究利用牛頓方法優(yōu)化了該方法的代價(jià)函數(shù)。由于代價(jià)函數(shù)的第二項(xiàng)不是平方誤差，它需要先求Hessian，并且使用牛頓法，而不是高斯-牛頓方法。這項(xiàng)研究沒有使用LM法[27]的阻尼因數(shù)，因?yàn)闆]有它的計(jì)算是穩(wěn)定的。

σICP和σCov的可接受值分別根據(jù)經(jīng)驗(yàn)設(shè)置為0.5和3。sigmaICP對應(yīng)于到Cqp的Mahalanobis距離，這意味著低于0.5的對應(yīng)點(diǎn)是可信任的。σCov對應(yīng)于ECOV；如果Cq和RCpRT相同，則ECOV = Tr（I）+ Tr（I）-6應(yīng)該為0。在DSymKL(p||q)中，-2d是使DSymKL的最小值為0的項(xiàng)。將σCov= 3設(shè)置為允許在沒有該術(shù)語的情況下允許的大約一半的誤差。如在LiTAMIN中一樣，F(xiàn)robenius歸一化的參數(shù)lambda設(shè)置為10-6。

LiTAMIN使用權(quán)重w的占用概率[28]，而所提出的方法使用wICP和wCov代替。對于閉環(huán)檢測，使用了建議的ICP代價(jià)。其他元素使用與LiTAMIN中相同的參數(shù)和實(shí)現(xiàn)。除LiTAMIN外，還使用KD樹搜索了ICP的相應(yīng)點(diǎn)。關(guān)于圖的表示，除了LiTAMIN以外，還使用了體素圖。體素貼圖用于減少構(gòu)成貼圖的正態(tài)分布的數(shù)量。

4 實(shí)驗(yàn)分析

A．對比

幾種最先進(jìn)的方法被選擇為使用不同加速算法的競爭對手，特別是LiTAMIN、 SuMa、 LeGO-LOAM、 LOAM、 hdl-graph-slam[3], LO-Net 和 DeepLO。在SuMa項(xiàng)目頁面上提供了一個(gè)詳細(xì)的評(píng)估，因此在研究中提到了這個(gè)問題，而計(jì)算時(shí)間是由運(yùn)行開源的研究人員獲得的。在接下來的實(shí)驗(yàn)中，我們還利用LeGO-LOAM、LOAM、hdl-graph-slam的開源來獲得軌跡和測量計(jì)算速度。關(guān)于LO-Net，使用了原論文的結(jié)果。

B.評(píng)價(jià)基準(zhǔn)和標(biāo)準(zhǔn)

實(shí)驗(yàn)中使用了KITTI視覺基準(zhǔn)測試，它包含了Velodyne HDL-64E S2在多個(gè)環(huán)境中獲取的點(diǎn)云。因此，它允許評(píng)估由任何SLAM方法獲得的軌跡。所提供的點(diǎn)云已經(jīng)被分解，因此它們被直接輸入到所提出的方法和競爭對手中。

根據(jù)以下三個(gè)標(biāo)準(zhǔn)評(píng)估每種方法的性能：

1） KITTI stats。KITTI Vision Benchmark [1]統(tǒng)計(jì)數(shù)據(jù)，即KITTI統(tǒng)計(jì)數(shù)據(jù)，用于準(zhǔn)確性評(píng)估。這些標(biāo)準(zhǔn)使得能夠使用相對于地面真實(shí)情況的相對關(guān)系來評(píng)估估計(jì)軌跡的質(zhì)量。在這項(xiàng)研究中，以這種方式針對不同的長度（特別是每100 m至800 m）計(jì)算了平移和旋轉(zhuǎn)誤差，并計(jì)算了誤差的平均值。基準(zhǔn)提供的代碼用于計(jì)算KITTI統(tǒng)計(jì)信息。

2）Absolute Trajectory Error（ATE）：為了評(píng)估每種方法的閉環(huán)性能，還計(jì)算了ATE [29]。ATE是相對于地面真實(shí)情況的絕對位置和姿態(tài)誤差的指示器。KITTI統(tǒng)計(jì)信息是子軌跡誤差的平均值，可能會(huì)低估閉環(huán)的影響；但是，ATE允許基于絕對誤差評(píng)估比較由閉環(huán)修改的軌跡的整個(gè)形狀。

3）Total time and frame rate：作為計(jì)算效率的指標(biāo)，計(jì)算了處理KITTI Vision Benchmark的所有序列（包括閉環(huán)）所花費(fèi)的總時(shí)間。還介紹了里程計(jì)的幀頻，以評(píng)估位置估計(jì)的速度，這對于某些實(shí)時(shí)應(yīng)用可能很重要。

C. Ablation study

所提出的方法將在每個(gè)體素中投****的子點(diǎn)云近似為正態(tài)分布。由于體素大小會(huì)顯著影響性能，因此針對不同體素大小對提議的方法進(jìn)行了全面評(píng)估，如表2所示。此外，表2顯示了使用體素化處理從原始掃描點(diǎn)開始的平均減少百分比。從KITTI統(tǒng)計(jì)數(shù)據(jù)來看，體素越精細(xì)，準(zhǔn)確性就越不總是這種情況。請注意，在以下實(shí)驗(yàn)中，體素大小固定為3米，因?yàn)槭褂么酥悼色@得最佳性能。

D.對比分析

表3顯示了KITTI統(tǒng)計(jì)數(shù)據(jù)的比較。對于SuMa，比較了從作者的項(xiàng)目頁面獲得的軌跡數(shù)據(jù)集，幀到幀，幀到模型以及帶循環(huán)閉合的幀到模型。對于LeGO-LOAM和hdl-graph-slam，實(shí)現(xiàn)了閉環(huán)，但是由于在我們的實(shí)驗(yàn)中未進(jìn)行閉環(huán)檢測，因此結(jié)果未在表3中列出。對于LOAM，考慮了在他們的論文中使用開源的測量結(jié)果以及原始論文的結(jié)果。原始序列中列出了各個(gè)序列的統(tǒng)計(jì)信息，但最終的KITTI統(tǒng)計(jì)數(shù)據(jù)未在表3中列出，因?yàn)樗鼈兾丛谠颊撐闹辛谐?。LO-Net未在表3中列出，因?yàn)樵赱22]中提供了各個(gè)序列的統(tǒng)計(jì)信息，但未提供所有最終誤差值的平均值。

表4表示ATE的比較。除表2外，還對SuMa的結(jié)果進(jìn)行了評(píng)估，分析了從作者的項(xiàng)目頁面獲取的軌跡。對于LOAM，將顯示開源軟件的結(jié)果。LO-Net被排除在表4中，因?yàn)锳TE的結(jié)果未包含在原始論文中。表5顯示了使用KITTI的每個(gè)序列和測距法過程的平均幀速率創(chuàng)建地圖所花費(fèi)的處理時(shí)間。所提出的方法LiTAMIN和SuMa顯示了包括循環(huán)閉合在內(nèi)的處理時(shí)間，因?yàn)檫@些方法中的循環(huán)閉合對所有序列都是成功的 SuMa結(jié)果是在本研究使用的計(jì)算機(jī)上使用開放源代碼獲得的，因?yàn)镾uMa原始論文中的計(jì)算機(jī)規(guī)格不同。圖3顯示了每種方法的軌跡比較。左起的第二和第四幅圖顯示了所提出的方法和SuMa的閉環(huán)結(jié)果，但未顯示其他無法檢測到環(huán)路的方法。

總結(jié)

在這項(xiàng)研究中，提出了一種使用對稱KL散度的ICP方法來顯著提高LiDAR-SLAM的速度，并將其與其他最新的SLAM方法進(jìn)行了比較。所提出的方法在里程計(jì)幀速率上實(shí)現(xiàn)了500 fps至1000 fps的計(jì)算速度，并且具有與其他方法相同的準(zhǔn)確度，這證實(shí)了所提出的方法是從傳統(tǒng)方法向前邁出的一大步。這是因?yàn)橥ㄟ^將點(diǎn)云從LiDAR投****到每個(gè)體素網(wǎng)格并將投****的子點(diǎn)云近似為一個(gè)正態(tài)分布，從而大大減少了用于配準(zhǔn)的點(diǎn)數(shù)。盡管所提出的方法大大減少了點(diǎn)數(shù)，但是所提出的對稱KL散度的ICP成本允許在不降低準(zhǔn)確性的情況下處理數(shù)據(jù)。這些結(jié)果基于KITTI Vision Benchmark數(shù)據(jù)集，我們認(rèn)為我們需要研究當(dāng)使用環(huán)境發(fā)生變化時(shí)如何確定適當(dāng)?shù)捏w素大小。

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀點(diǎn)，如有侵權(quán)請聯(lián)系工作人員刪除。

博客專欄

LiTAMIN2：一種超輕型LiDAR-SLAM（ICRA2021）

相關(guān)推薦

技術(shù)專區(qū)