視覺(jué)/視覺(jué)慣性SLAM最新綜述：領(lǐng)域進(jìn)展、方法分類與實(shí)驗(yàn)對(duì)比（2）

發(fā)布人：計(jì)算機(jī)視覺(jué)工坊時(shí)間：2021-07-26 來(lái)源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

4.3. Mapping

建圖塊是指完全初始化新檢測(cè)到的特征位置所需的操作，以便它可以位于環(huán)境的 3D 重建中，即地圖。實(shí)際上，在位姿跟蹤部分，我們假設(shè)地圖上存在 3D 定位地標(biāo)。然而，單目相機(jī)不能僅使用一次觀察來(lái)確定特征的深度，而是需要幾幀。與相機(jī)軌跡類似，我們可能希望估計(jì)地標(biāo)位置的不確定性，以在初始化后對(duì)其進(jìn)行細(xì)化或?qū)⑺鼈儼谌謨?yōu)化中。使用僅“部分初始化”的地標(biāo)也很有趣，因?yàn)樗鼈円呀?jīng)包含一些信息，例如在 PTAM [27] 中。直接方法本身不映射特征，但它們將捕獲幀的每個(gè)像素（像素深度圖）建圖。

建圖塊可以用 3D 地標(biāo)參數(shù)化來(lái)描述。可以使用笛卡爾坐標(biāo) (XYZ)，但這種選擇會(huì)導(dǎo)致嚴(yán)重的非高斯概率密度函數(shù)，并且會(huì)降低準(zhǔn)確性和一致性?；蛘?，齊次點(diǎn) (HP)、錨定齊次點(diǎn) (AHP) 和逆深度參數(shù)化 (IDP) 可抑制非線性并縮短初始化周期 [42]。

如 [42] 中所述，IDP 通過(guò) 6 維向量對(duì)反距離點(diǎn) p 進(jìn)行編碼，該向量包含對(duì)應(yīng)于“錨點(diǎn)” p0=(x0,y0,z0) 的初始化時(shí)間的歐幾里得光學(xué)中心，即仰角和方位角，它們定義了初始光線 (e,a) 的方向和從 p0 到 3D 點(diǎn) p 的歐幾里得距離 d 的倒數(shù) p。IDP 點(diǎn)可以通過(guò)使用矢量 V=(u,v,w) 和距離 p=||v||/d 的光線方向直接編碼來(lái)參數(shù)化，從而避免對(duì)角度（e，a）。這對(duì)應(yīng)于 AHP 參數(shù)化（7 個(gè)參數(shù)）。HP 類似于 AHP，但不需要錨點(diǎn)；相反，使用相機(jī)的原點(diǎn)，導(dǎo)致只有 4 個(gè)參數(shù) V 和 p。假設(shè)相機(jī)位置的不確定性很小，使用這種參數(shù)化可以獲得類似的結(jié)果。[42] 中的研究詳細(xì)介紹了這些參數(shù)化，并給出了它們對(duì) EKF-SLAM 結(jié)果影響的基準(zhǔn)。

三角化的 3D 點(diǎn)是通過(guò)將來(lái)自至少兩幀的 2D 圖像對(duì)應(yīng)關(guān)系的反向投影光線相交來(lái)確定的。實(shí)際上，它們從未真正相交，這導(dǎo)致地標(biāo)位置存在不確定性區(qū)域?？梢酝ㄟ^(guò)兩種方式減少這種不確定性?？梢允褂酶嗟挠^測(cè)值，或者來(lái)自更遠(yuǎn)距離的光線可以改善定位。理想情況下，光線應(yīng)以 90° 角相交以到達(dá)一個(gè)小的不確定圓，而不是一個(gè)拉伸的橢圓?？梢蕴^(guò)幀，直到 3D 點(diǎn)位置的平均不確定性降低到給定閾值以下以緩解此問(wèn)題。選定的幀通常對(duì)應(yīng)于關(guān)鍵幀。另請(qǐng)注意，遠(yuǎn)距離點(diǎn)更難以準(zhǔn)確建圖。

建圖過(guò)程與 DTAM [34] 等直接方法略有不同。目標(biāo)是通過(guò)為每個(gè)像素分配深度值，將捕獲的幀變成“深度圖”。它再次基于多視圖重建。對(duì)于關(guān)鍵幀中的每個(gè)像素，都會(huì)跟蹤一條像素射線，它對(duì)應(yīng)于該像素的可能深度范圍。與該關(guān)鍵幀重疊的所有幀池用于“觀察”像素射線。能量函數(shù)最小化，例如用于空間正則化的光度誤差和先驗(yàn)數(shù)據(jù)的 L1 范數(shù)和估計(jì)實(shí)際像素深度。RGB-D vSLAM 方法的建圖過(guò)程更直接，因?yàn)樯疃仁侵苯痈袘?yīng)的。在每一幀中輸入深度圖。然后通過(guò)融合所有深度圖來(lái)詳細(xì)闡述環(huán)境的 3D 模型。這可以通過(guò)重疊掃描或通過(guò)執(zhí)行融合方法來(lái)完成。

許多 SLAM 方法使用與環(huán)境中檢測(cè)到的特征相對(duì)應(yīng)的稀疏表示來(lái)重建場(chǎng)景。稠密貼圖更常見于雙目和 RGB-D 相機(jī)或激光掃描。最近的一項(xiàng)工作 [43] 創(chuàng)建了稠密結(jié)構(gòu)的稠密地圖建模。

4.4. Loop Closure

閉環(huán)是 SLAM 的支柱。它通過(guò)將先前訪問(wèn)過(guò)的位置的位姿與當(dāng)前位姿重新連接來(lái)消除自上次閉環(huán)以來(lái)累積的漂移。優(yōu)化和增量方法比基于粒子濾波和卡爾曼濾波等更成功，因?yàn)樗鼈冊(cè)谲壽E估計(jì)上向后傳播閉環(huán)數(shù)據(jù)。關(guān)鍵幀圖經(jīng)典地用于在并行方法中使用集束調(diào)整 (BA) 來(lái)校正姿勢(shì)。在 [44] 中，作者綜合了 BA 的 vSLAM 方法技術(shù)，并在附錄中給出了集束調(diào)整主要發(fā)展的歷史概述。最先進(jìn)的 SLAM 系統(tǒng)通常用[45] 解決非線性最小二乘問(wèn)題或 [46] 來(lái)優(yōu)化 BA 中基于圖的非線性誤差函數(shù)。但是這些系統(tǒng)使用一些最后的測(cè)量值來(lái)實(shí)時(shí)估計(jì)位姿。為了使用先前的優(yōu)化并減少計(jì)算，增量求解器（例如 [47]）以實(shí)時(shí)方法解決非線性估計(jì)問(wèn)題。每次使用底層因子圖的稀疏結(jié)構(gòu)添加新的測(cè)量值時(shí)，它們都會(huì)更新環(huán)境的估計(jì)模型。

閉環(huán)是一個(gè)兩步過(guò)程。首先，它從閉環(huán)檢測(cè)開始，也稱為位置識(shí)別。位置識(shí)別過(guò)程可以用來(lái)解決軌道丟失恢復(fù)的問(wèn)題，一般采用閉環(huán)線程。大多數(shù)方法使用詞袋方法將新關(guān)鍵幀與先前獲取的視圖數(shù)據(jù)庫(kù)進(jìn)行比較。“詞袋”是指一組描述符，用于識(shí)別圖像中的補(bǔ)丁，如 [48] 提出的 DBoW2 方法，基于 FAST [31] 和稍加修改的 BRIEF 特征 [49]?？蚣芎蛿?shù)據(jù)庫(kù)之間相似詞的目錄搜索非?？焖俸透咝?。一旦發(fā)現(xiàn)潛在的相似性，多個(gè)驗(yàn)證步驟會(huì)驗(yàn)證它是否對(duì)應(yīng)于一個(gè)閉環(huán)。其次，閉環(huán)校正地圖和位姿。計(jì)算兩個(gè)視圖之間的轉(zhuǎn)換并融合 3D 點(diǎn)。然后使用（局部）BA 沿著整個(gè)位姿圖和地圖分布關(guān)閉回環(huán)所需的計(jì)算。閉環(huán)過(guò)程的計(jì)算量可能很大。它通常在專用線程中完成。

5. vSLAM 方法的歷史回顧

圖 3 顯示了 vSLAM 發(fā)展的年表，包括三個(gè)時(shí)期。第一個(gè)時(shí)期，這里標(biāo)記為“經(jīng)典時(shí)期”，專注于解決 SLAM 問(wèn)題。提出了幾個(gè)數(shù)學(xué)公式，首次有效地應(yīng)用了SLAM。第二個(gè)時(shí)期，SLAM 研究的重點(diǎn)轉(zhuǎn)向了基于視覺(jué)的方法。提出了幾種 vSLAM 設(shè)計(jì)，并將新硬件（例如 GPU、RGB-D 相機(jī)和雙目相機(jī)）集成到該過(guò)程中。這個(gè)“vSLAM 時(shí)期”與 [14] 所說(shuō)的 SLAM 的“算法分析”時(shí)期一致。研究了 vSLAM 的基本特性，例如收斂性和一致性。vSLAM 成為開發(fā) SLAM 方法的核心?！暗谌龝r(shí)期”致力于提高vSLAM的魯棒性。目標(biāo)是提高 vSLAM 的可靠性，以支持越來(lái)越多的現(xiàn)實(shí)生活應(yīng)用程序（例如，無(wú)人機(jī)）。特別是，這個(gè)“第三時(shí)期”引入了 viSLAM 方法。

圖3 具有里程碑和三個(gè)時(shí)期的 vSLAM 歷史概述：從 SLAM 問(wèn)題到 vSLAM，vSLAM 算法發(fā)展，以及 viSLAM 的出現(xiàn)。

5.1. The Classical Age

定位的歷史始于 1960 年卡爾曼濾波的引入 [50]，并在 1979 年由 Mayeck 通過(guò)擴(kuò)展卡爾曼濾波(EKF) [51] 擴(kuò)展到非線性系統(tǒng)。SLAM 問(wèn)題在 1980 年代提出 [1, 2, 52]，并在 1995 年證明收斂 [53]。在此期間，制定了一些 SLAM 方法，主要使用激光遙測(cè)儀、從不同來(lái)源計(jì)算的里程計(jì)并使用 EKF 實(shí)現(xiàn)，例如 Smith 等人早在 1988 年提出的方法（EKF-SLAM [38]）。直到 2003 年戴維森等人提出 MonoSLAM [21] 之前，單目相機(jī)的使用非常罕見。他們僅使用一個(gè)網(wǎng)絡(luò)攝像頭、一臺(tái)通用計(jì)算機(jī)就實(shí)現(xiàn)了它，并且沒(méi)有里程計(jì)測(cè)量。這是第一個(gè)使用單個(gè)低成本視覺(jué)傳感器的實(shí)時(shí) SLAM 方法。定位和建圖在 3D 中執(zhí)行，而 SLAM 基于 EKF。為了解決初始化新點(diǎn)的問(wèn)題，Davison 等人提出了一種基于粒子濾波器的新方法，以減少新檢測(cè)到的視覺(jué)地標(biāo)的景深不確定性。MonoSLAM 為所謂的 vSLAM 鋪平了道路。

每個(gè) EKF-SLAM，甚至是著名的 MonoSLAM，都存在復(fù)雜性，地圖特征的數(shù)量是二次的。為緩解該問(wèn)題進(jìn)行了許多嘗試，尤其是通過(guò)將地圖劃分為多個(gè)部分并在優(yōu)化過(guò)程中僅使用活動(dòng)子地圖。它們都沒(méi)有提供令人滿意的一致性與計(jì)算成本的折衷。2002 年，在 Montemerlo 等人 [23] 提出的 FastSLAM 中，使用 Rao-Blackwellized 粒子濾波器代替 EKF。這種方法有效地降低了對(duì)數(shù)縮放的復(fù)雜性，并成功轉(zhuǎn)換為單目 vSLAM，即 Eade 和 Drummond 在 2006 年提出的可擴(kuò)展單目 SLAM [22]。

5.2. The Golden Age of vSLAM

即使 FastSLAM 方法的最小復(fù)雜度也嚴(yán)重限制了 SLAM 應(yīng)用，尤其是捕獲大量特征的 vSLAM。vSLAM 的最大突破是 Klein 等人在 2007 年引入了具有并行跟蹤和建圖 (PTAM) 的基于關(guān)鍵幀的解決方案 [27]。在其他改進(jìn)中，這種新方法實(shí)現(xiàn)了任務(wù)并行化、更好地利用全局優(yōu)化、減少了跟蹤漂移，更重要的是一種具有自由可擴(kuò)展性的存儲(chǔ)特征的新方法。如今，幾乎所有 vSLAM 算法都基于 PTAM 的概念。

vSLAM 通過(guò)集成高效的閉環(huán)方法、全局優(yōu)化和基于關(guān)鍵幀和剔除的內(nèi)存管理，以及多線程并行化實(shí)時(shí)執(zhí)行過(guò)程，變得越來(lái)越可靠。因此，可以提出新的設(shè)計(jì)和硬件選擇，擴(kuò)大 SLAM 的可能性。由用例需求驅(qū)動(dòng)的 vSLAM 開發(fā)成為可能。在此期間提出的主要 vSLAM 實(shí)現(xiàn)在第 6 節(jié)中有詳細(xì)說(shuō)明。

5.3. The Third Age: Improving the Robustness

在第三個(gè)時(shí)期，vSLAM 繼續(xù)發(fā)展，尤其是針對(duì)特定場(chǎng)景提高魯棒性。相機(jī)和 IMU 的耦合（viSLAM）成為一個(gè)重要的研究課題。在 2010 年代初期，考慮了現(xiàn)有 vSLAM 方法中 IMU 數(shù)據(jù)的松耦合 [54]。但混合濾波器迅速演變?yōu)椤熬o耦合”視覺(jué)慣性方法的設(shè)計(jì)，現(xiàn)在在配備 IMU 和相機(jī)的系統(tǒng)中非常流行。緊耦合 viSLAM 的一個(gè)重要改進(jìn)是 2007 年由 Mourikis 和 Roumeliotis [25] 提出的 MSCKF（多態(tài)約束卡爾曼濾波器），在 2013 年通過(guò) MSCKF 2.0 改進(jìn) [24]，引入了新版本的卡爾曼濾波器，該濾波器在一個(gè)外感受器中結(jié)合了超時(shí)觀察更新。還創(chuàng)造了其他非凡的方法。其中包括使用線而不是點(diǎn)特征來(lái)避免與運(yùn)動(dòng)模糊相關(guān)的問(wèn)題，自 PTAM 以來(lái)仍在使用。其他作品使用 RGB-D 相機(jī)并在應(yīng)用 SLAM 算法之前過(guò)濾與移動(dòng)物體相關(guān)的數(shù)據(jù)以提高魯棒性 [55, 56]。其他方法使用基于光流的方法來(lái)檢測(cè)和丟棄動(dòng)態(tài)特征[57]來(lái)緩解動(dòng)態(tài)問(wèn)題。一個(gè)結(jié)合 SLAM 和深度學(xué)習(xí)技術(shù)的新研究領(lǐng)域正在這個(gè)領(lǐng)域上出現(xiàn)。深度學(xué)習(xí)技術(shù)檢測(cè)移動(dòng)物體并支持 ORB-SLAM2 算法來(lái)構(gòu)建準(zhǔn)確的地圖并在動(dòng)態(tài)環(huán)境中定位移動(dòng)機(jī)器人 [58]。在 [59] 中，作者出于相同目的使用語(yǔ)義分割和 RGB-D 相機(jī)。Rosinol 等人和 Yang 等人 [60, 61] 發(fā)表了使用語(yǔ)義分割和 SLAM 算法的最新作品。

當(dāng)可以多次訪問(wèn)同一地點(diǎn)時(shí)，MapLab [62] 的工作允許大規(guī)模合并不同會(huì)話的不同地圖。輸出地圖可用于從一個(gè)會(huì)話到另一個(gè)會(huì)話。

也許最近最有趣的趨勢(shì)之一是使用事件相機(jī)，即仿生相機(jī)，以避免運(yùn)動(dòng)模糊的影響。由于事件攝像機(jī)的使用還很晚，因此不包括在我們的分類中。然而，Rosinol 等人于 2018 年發(fā)表的結(jié)果。關(guān)于 Ultimate SLAM [63] 混合使用基于事件的相機(jī)和視覺(jué)慣性里程計(jì)似乎非常有前途，并渴望為 vSLAM 開辟新的可能性。

最近的一項(xiàng)工作 [64] 優(yōu)化局部和全局集束調(diào)整給出了可用于 viSLAM 算法以提高全局一致性的有希望的結(jié)果。

6. 建議的分類方法

幾種方法推動(dòng)了我們的分類工作。6.1 節(jié)根據(jù)輸入對(duì) vSLAM 方法進(jìn)行分組。第 6.2 節(jié)根據(jù)耦合級(jí)別對(duì) viSLAM 方法進(jìn)行分組。最后，第 6.3 節(jié)根據(jù)硬件要求、算法類型和實(shí)現(xiàn)特征比較了主要的 v/viSLAM 方法。它通過(guò)根據(jù)應(yīng)用程序要求對(duì) v/viSLAM 性能進(jìn)行交叉分析來(lái)完成。

6.1. Classification of vSLAM Methods

vSLAM 方法根據(jù)輸入的性質(zhì)分為三類：基于特征的、直接的和基于 RGB-D 的，如第 4 節(jié)所述。由于基于 RGB-D 的方法涉及特定的硬件，因此被視為一個(gè)完整的類別。圖 4 顯示了選擇一些主要識(shí)別方法的分類結(jié)果。

圖4 主要 vSLAM 方法的時(shí)間順序分類

6.1.1. Feature-Based Methods

單目 EKF-SLAM MonoSLAM [21] 和粒子濾波器可擴(kuò)展單目 SLAM [22]，即單目 FastSLAM，屬于基于特征的方法。突破性的并行跟蹤和建圖 (PTAM) [27] 屬于同一類別。提出了對(duì) PTAM 的幾種改編。例如，[65] 中介紹了邊緣特征的使用。另一個(gè)重要的方法是 ORB-SLAM [37]。

6.1.2. Direct Methods

第一個(gè)重要的直接方法是 2011 年的稠密跟蹤和建圖 (DTAM) [34]。它是稠密單目 vSLAM 方法的先驅(qū)，并于 2015 年通過(guò) MobileFusion [66] 應(yīng)用于智能手機(jī)。從 2016 年開始，一種更新的方法是直接稀疏里程計(jì) (DSO) [33]：一種視覺(jué)里程計(jì)方法，它提出直接輸入處理但稀疏建圖以進(jìn)行更輕量的處理。另一個(gè)主要的 vSLAM 方法是 2013 年和 2017 年的半直接視覺(jué)里程計(jì)（SVO）[67]，它結(jié)合了 VO 框架中直接和間接輸入搜索的優(yōu)點(diǎn)。2014 年的大規(guī)模直接單目 SLAM（LSD-SLAM）[35] 是最早使用半稠密建圖來(lái)解決大型環(huán)境的方法之一。

6.1.3. RGB-D Methods

RGB-D 方法還包括幾種主要算法。2011 年，KinectFusion [68] 旨在使用 Microsoft Kinect 構(gòu)建干凈、準(zhǔn)確的環(huán)境 3D 重建。2013 年的稠密 vSLAM [69] 側(cè)重于利用密集地圖進(jìn)行精確定位。2015 年的 ElasticFusion [70] 是一種“以地圖為中心”的方法，它更側(cè)重于構(gòu)建的 3D 模型的幾何精度，而不是位姿圖的構(gòu)建。

6.2. Classification of viSLAM Methods

直接和間接特征可用于對(duì) viSLAM 方法進(jìn)行分類。其他綜述也根據(jù)它們是基于濾波器還是基于優(yōu)化的方法對(duì) viSLAM 方法進(jìn)行了分類 [15]。但大多數(shù)主要的 viSLAM 方法實(shí)際上都是基于特征的方法，而 viSLAM 主要處理混合問(wèn)題。因此，圖 5 所示的分類是基于視覺(jué)和慣性數(shù)據(jù)的耦合水平。我們區(qū)分兩個(gè)層次：松耦合和緊耦合。

圖5 主要視覺(jué)-慣性 SLAM 方法的時(shí)間分類。

6.2.1. Loose Coupling

松耦合方法分別處理 IMU 和圖像測(cè)量，并使用這兩種信息來(lái)跟蹤位姿。Weiss 等人 [54] 處理圖像以計(jì)算連續(xù)位姿之間的 VO，然后將后者與慣性測(cè)量融合。還可以過(guò)濾 IMU 測(cè)量值以估計(jì)在基于圖像的估計(jì)算法中融合的旋轉(zhuǎn)。松耦合的視覺(jué)慣性里程計(jì)方法是 2014 年 [71] 提出的全局多傳感器融合（磁力計(jì)、壓力高度計(jì)、GPS 、激光掃描儀等）的一部分。松耦合的 IMU-相機(jī)融合早在 2000 年代初就已經(jīng)開始了。SOFT-SLAM 算法 [72] 是一種松耦合的 viSLAM 方法，它實(shí)際上使用 IMU 數(shù)據(jù)來(lái)減少可用的計(jì)算時(shí)間。它實(shí)時(shí)構(gòu)建稠密地圖并在 MAV 上運(yùn)行。

6.2.2. Tight Coupling

緊耦合方法不是融合基于視覺(jué)和慣性的算法的輸出，而是直接融合視覺(jué)和慣性原始數(shù)據(jù)，以提高準(zhǔn)確性和魯棒性。MSCKF [25] 和 MSCKF 2.0 [24] 既健壯又非常輕便，與 ROVIO [26] 一起屬于這一類，后者是一種基于 EKF 的直接 VIO 方法。Open Keyframe-Based Visual Inertial System (OKVIS) [73] 和 S-MSCKF [17] 是著名的雙目 VIO 方法，而 Vins-Mono [74] 是真正的 viSLAM 而不僅僅是 VIO 方法。Kimera [60] 也基于 VIO 方法，但它還包括一個(gè)位姿圖優(yōu)化器，在不同的線程中，用于全局軌跡估計(jì)、一個(gè) 3D 網(wǎng)格重建模塊和一個(gè) 3D 度量語(yǔ)義重建模塊。VIORB [75] 基于 ORB-SLAM [76]。它的前端使用 ORB 提取特征，而其后端運(yùn)行圖形優(yōu)化。但它的主要興趣在于一種新的 IMU 初始化方法，首先估計(jì)陀螺儀的偏差，近似尺度和重力（不考慮加速度計(jì)偏差），然后估計(jì)加速度計(jì)偏差（經(jīng)過(guò)尺度和重力方向細(xì)化），最后是速度矢量，它包括并行方法中的全局優(yōu)化和閉環(huán)。大多數(shù)最近的 viSLAM 方法都是緊耦合的 [15]，如 [77] 提出的方法，它使用前向和后向光流來(lái)處理圖像特征。

6.3. Comparison of vSLAM and viSLAM from the Usage Point of View

根據(jù)硬件要求、算法類型和實(shí)現(xiàn)特點(diǎn)，主要v/viSLAM方法在表2中進(jìn)行了比較。表 3 展示了每種方法在描述常見用例性質(zhì)的五個(gè)關(guān)鍵特征方面的最新性能。表 3 是通過(guò)閱讀引用的出版物并使用以下標(biāo)準(zhǔn)對(duì)其性能評(píng)估結(jié)果進(jìn)行分類而編制的。

(i) 長(zhǎng)期實(shí)驗(yàn)特征評(píng)估該方法如何處理長(zhǎng)時(shí)間實(shí)驗(yàn)。即使在小環(huán)境中，vSLAM 也會(huì)不斷收集新的關(guān)鍵幀，這意味著長(zhǎng)期實(shí)驗(yàn)可能會(huì)導(dǎo)致關(guān)鍵幀和地圖特征的數(shù)量不斷增加。定義一個(gè)好的關(guān)鍵幀選擇策略和內(nèi)存管理方法很重要；

(ii) 大尺度環(huán)境特征判斷該方法對(duì)大環(huán)境的擴(kuò)展能力（即積累的特征越多，地標(biāo)越遠(yuǎn)）。為了評(píng)估這方面，重要的標(biāo)準(zhǔn)是減少漂移、有效的全局優(yōu)化（例如，關(guān)鍵幀的選擇和關(guān)鍵幀圖的類型）以及有效的位置識(shí)別和閉環(huán)框架；

(iii) 低紋理環(huán)境對(duì)應(yīng)于紋理很少的表面，例如可能成為問(wèn)題的大墻，特別是對(duì)于特征提取。面向低紋理空間的最佳性能方法可能會(huì)使用邊緣和附加硬件等特殊功能進(jìn)行定位（IMU），甚至更好地用于建圖（RGB-D 方法的深度傳感器）；

(iv) 室外環(huán)境：這類環(huán)境增加了光線變化等困難。使用深度傳感器、良好的特征描述符或簡(jiǎn)單的強(qiáng)大位置識(shí)別方法（通過(guò)閉合循環(huán)來(lái)糾正錯(cuò)誤）與室外空間相關(guān)。該分析還基于每種算法的戶外測(cè)試結(jié)果；

(v) 運(yùn)動(dòng)：在處理相機(jī)時(shí)對(duì)高速運(yùn)動(dòng)引起的運(yùn)動(dòng)模糊的魯棒性對(duì)于為正確的應(yīng)用選擇正確的方法很重要。使用稠密地圖或邊緣特征的方法通常更穩(wěn)健。然而，如前文第 4 節(jié)所述，我們發(fā)現(xiàn)視覺(jué)慣性系統(tǒng)更健壯。

添加其他方法來(lái)完成之前執(zhí)行的 v/viSLAM 分類。兩個(gè)有趣的 PTAM 派生算法是 PTAM [78] 的雙目版本和雙窗口優(yōu)化 (DWO) [79] 框架。CD-SLAM [80] 是首次嘗試以更穩(wěn)健的方法將 PTAM 的原理擴(kuò)展到大規(guī)模間接 vSLAM。CD-SLAM 的一些特性啟發(fā)了流行的 ORB-SLAM。后者結(jié)合了最高效的 vSLAM 功能（雙模型初始化、高效的關(guān)鍵幀和地圖點(diǎn)剔除、ORB 功能和詞袋回環(huán)閉合）以及關(guān)鍵幀的“基本圖”。ORB-SLAM2 [76] 使 ORB-SLAM 適應(yīng)雙目和 RGB-D 相機(jī)。Edge-SLAM [81] 是最近嘗試以邊緣為特征構(gòu)建強(qiáng)大的 vSLAM。還包括直接方法“半稠密視覺(jué)里程計(jì)”[5] 和 Kintinuous [82]。第一個(gè)側(cè)重于使用智能手機(jī)將半稠密 vSLAM 應(yīng)用于增強(qiáng)現(xiàn)實(shí)。最后一個(gè)是 KinectFusion 算法針對(duì)更大規(guī)模環(huán)境的擴(kuò)展。

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀點(diǎn)，如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。

LCD顯示屏相關(guān)文章:lcd顯示屏原理

lcd相關(guān)文章:lcd原理

博客專欄

視覺(jué)/視覺(jué)慣性SLAM最新綜述：領(lǐng)域進(jìn)展、方法分類與實(shí)驗(yàn)對(duì)比（2）

相關(guān)推薦

技術(shù)專區(qū)

博客專欄

視覺(jué)/視覺(jué)慣性SLAM最新綜述：領(lǐng)域進(jìn)展、方法分類與實(shí)驗(yàn)對(duì)比（2）

相關(guān)推薦

技術(shù)專區(qū)

視覺(jué)/視覺(jué)慣性SLAM最新綜述：領(lǐng)域進(jìn)展、方法分類與實(shí)驗(yàn)對(duì)比（2）