博客專欄

EEPW首頁(yè) > 博客 > TRO新文:用于數(shù)據(jù)關(guān)聯(lián)、建圖和高級(jí)任務(wù)的對(duì)象級(jí)SLAM框架(2)

TRO新文:用于數(shù)據(jù)關(guān)聯(lián)、建圖和高級(jí)任務(wù)的對(duì)象級(jí)SLAM框架(2)

發(fā)布人:計(jì)算機(jī)視覺(jué)工坊 時(shí)間:2023-07-17 來(lái)源:工程師 發(fā)布文章
3 對(duì)象描述子

為了描述不同物體間的關(guān)系,文章構(gòu)建了語(yǔ)義拓?fù)鋱D和基于此的隨機(jī)游走描述子。

  1. 拓?fù)鋱D:通過(guò)物體的語(yǔ)義標(biāo)簽、位置、姿態(tài)和尺寸信息,構(gòu)建不同物體及物體與情景的關(guān)系圖:

圖片表示物體節(jié)點(diǎn),編碼物體信息

圖片表示邊,編碼兩個(gè)物體的距離d和角度α

  1. 描述子:基于拓?fù)鋱D中不同物體間的關(guān)系,采用隨機(jī)游走的方式構(gòu)建物體描述子υ:

r是一個(gè)隨機(jī)行走路徑,起始于被描述的物體,最多到達(dá)i個(gè)物體。每行重復(fù)j次隨機(jī)行走。

  1. 多維度信息:為了提高魯棒性,描述子中考慮物體標(biāo)簽l、尺寸s、距離d和角度α四個(gè)維度:

4. 場(chǎng)景匹配:基于多個(gè)物體對(duì)的描述子匹配,求解兩個(gè)情景的轉(zhuǎn)換矩陣T:

·  生成兩個(gè)情景T1和T2的描述子V1和V2。

·  對(duì)每個(gè)對(duì)象v1在V1中找到在V2中的最佳匹配v2。

·  根據(jù)多個(gè)物體對(duì),利用奇異值分解(SVD)求解轉(zhuǎn)換矩陣T。

  1. 魯棒性:采用RANSAC算法去除誤匹配物體對(duì),提高匹配的魯棒性??偟膩?lái)說(shuō),基于拓?fù)鋱D實(shí)現(xiàn)的物體描述子充分利用了物體的語(yǔ)義、尺寸和相對(duì)關(guān)系,能有效實(shí)現(xiàn)不同視角下的場(chǎng)景匹配。考慮更多非物體的語(yǔ)義特征可能進(jìn)一步提高魯棒性和準(zhǔn)確性。
4 實(shí)驗(yàn)結(jié)果
  1. 數(shù)據(jù)關(guān)聯(lián):實(shí)驗(yàn)結(jié)果表明,集成不同統(tǒng)計(jì)模型超過(guò)單一方法。表明點(diǎn)云和質(zhì)心確實(shí)呈現(xiàn)非高斯分布和高斯分布。

圖片2. 對(duì)象參數(shù)化: 實(shí)驗(yàn)結(jié)果表明, iForest和線段對(duì)齊有效實(shí)現(xiàn)精確的6DOF姿態(tài)估計(jì)。并構(gòu)建了基于形狀的通用對(duì)象模型

圖片

圖片3. 對(duì)象地圖構(gòu)建:可在不同數(shù)據(jù)集上構(gòu)建語(yǔ)義對(duì)象地圖,處理不同類、數(shù)量、尺寸和方位角的物體。實(shí)驗(yàn)表明系統(tǒng)的魯棒性。

圖片4. 增強(qiáng)現(xiàn)實(shí):基于精確的物體姿態(tài)信息,實(shí)現(xiàn)虛擬模型與實(shí)物精準(zhǔn)配準(zhǔn)??紤]遮擋和碰撞效果,提高虛擬可信度。

圖片5. 場(chǎng)景匹配:基于物體描述子,可在不同視角和照明條件下實(shí)現(xiàn)場(chǎng)景匹配和多地圖融合。具有魯棒性。

圖片6. 主動(dòng)地圖構(gòu)建:通過(guò)信息熵量化物體觀測(cè)完整度,驅(qū)動(dòng)主動(dòng)建設(shè)語(yǔ)義對(duì)象地圖。實(shí)驗(yàn)表明比隨機(jī)探索和全面覆蓋策略更高效和更準(zhǔn)確。

圖片7. 機(jī)器人抓取:基于語(yǔ)義對(duì)象地圖信息,實(shí)現(xiàn)機(jī)器人抓握。在虛擬環(huán)境和實(shí)際環(huán)境下的成功率分別達(dá)到86%和81%。

圖片

局限性:數(shù)據(jù)關(guān)聯(lián)在極端情況下存在問(wèn)題;對(duì)象姿態(tài)估計(jì)受離群點(diǎn)影響而不準(zhǔn)確;場(chǎng)景匹配依賴精確的對(duì)象建模。改進(jìn)方向:優(yōu)化數(shù)據(jù)關(guān)聯(lián)魯棒性;采用機(jī)器學(xué)習(xí)提高姿態(tài)估計(jì)精度;構(gòu)建更通用的物體描述子;采用多源感知實(shí)現(xiàn)全景對(duì)象地圖。

總的來(lái)說(shuō),實(shí)驗(yàn)結(jié)果充分證明了對(duì)象SLAM框架在不同應(yīng)用上的有效性和潛力。同時(shí)指出了當(dāng)前的局限性和未來(lái)的改進(jìn)方向。這對(duì)促進(jìn)對(duì)象SLAM技術(shù)的發(fā)展至關(guān)重要。


*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。



關(guān)鍵詞: AI

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉