窝窝看一夜七次郎在线视频,色综合天天色,中文字幕第一页在线视频

Motivations:

用粗略模型(長方體或橢球體)表示的對象可能不夠精確，無法改善相機的位姿跟蹤。

目前SOTA目標檢測器對視角和光照變化具有很強的魯棒性，這對于從大量不同視角恢復相機姿態(tài)非常有利。

缺乏用于構(gòu)建面向?qū)ο蟮貓D的全自動系統(tǒng)，都有著一定的假設(shè)。

Contributions:

結(jié)合對象和點的優(yōu)點，提出了一種改進的重定位方法，能夠從大量不同的視角中估計相機位姿。

提出了一種全自動的SLAM系統(tǒng)，能夠在飛行中識別、跟蹤和重建對象。

Background and Related Works:

1. 對象建圖

Crocco使用簡化相機模型，提出了一種封閉形式的公式來估計來自多視圖目標檢測的對偶二次曲面。Rubino將其拓展到針孔相機模型。Chen等人解決了前向移動中初始化對象估計問題。

2. 基于對象的定位

Weinzaepfel等人利用查詢圖像中出現(xiàn)的對象與參考圖像中出現(xiàn)的對象之間的稠密2D-3D對應關(guān)系來計算相機的位姿，但該方法僅限于平面對象。

一些工作使用了更通用的對象，用橢球表示。然而這些方法僅從對象估計相機姿態(tài)，并假設(shè)一個預構(gòu)建的對象地圖。[11]只估計相機的位置，假設(shè)方向已知。[38]專注于3D感知橢圓對象檢測。

3. 基于對象的SLAM

Bao等人在定位和建圖中引入了對象，在一個SfM框架中識別和定位對象。McCormac等人和Sünderhauf等人將RGB-D SLAM和語義分割和對象檢測相融合，獲得具有語義注釋的稠密點云。

QuadricSLAM使用對偶二次曲面作為3D地標，共同估計相機位姿和對偶二次曲面參數(shù)。EAO-SLAM在半稠密的SLAM中集成對象，利用不同的統(tǒng)計信息來提高數(shù)據(jù)關(guān)聯(lián)的魯棒性。Hosseinzadeh將點、平面和二次曲面聯(lián)合為基于因子圖的SLAM。SO-SLAM中，Liao等人使用手工提取的平面為對象添加支撐約束，以及語義尺度先驗和對象約束。ROSHAN利用邊界框檢測、圖像紋理、語義知識和對象形狀先驗來推斷橢球模型，并解決前向平移車輛運動下的可觀察性問題。CubeSLAM使用長方體來表示對象，使用2D邊界框和消失點采樣從單圖中生成對象候選。Frost等人用球體建模對象，并使用它們解決SLAM中的尺度不確定和漂移問題。

4. 基于對象的SLAM重定位

只有Dudek等人利用SLAM中的語義地圖進行重定位。Mahattansin等人利用對象檢測改進了視覺SLAM的重定位，但對象檢測知識用來更好地篩選候選關(guān)鍵幀，相機位姿仍使用與最相似的關(guān)鍵幀的點匹配估計得到。

Methodology:

1. 橢球體對象表示

9DoF表示，3DoF表示軸長，3DoF表示方向，3DoF表示位置。其方程可以用對偶空間的封閉形式表示。橢球體定義為4×4矩陣Q*,橢圓定義為3×3矩陣C*。

2. 目標檢測與關(guān)聯(lián)

目標檢測器：YOLO (只考慮評分高于0.5的檢測)

2.1 基于box的對象追蹤

在重建之前，基于邊界框重疊和標簽一致性在2D幀中跟蹤對象在兩幀之間的運動相對較小和平滑時短期有效。

考慮3D重建來獲得長期的跟蹤，將其橢球模型投影到當前幀中，并利用該幀中與目標檢測的重疊來尋找關(guān)聯(lián)。

結(jié)合以上兩種情況，使用匈牙利算法找到最優(yōu)關(guān)聯(lián)，該最大化匹配總分，以便在N次檢測和M個對象之間找到最佳的可能分配。

2.2 基于點的對象追蹤

在相機位姿估計過程中，將圖像關(guān)鍵點與地圖地標進行魯棒匹配，這些匹配可以用于鏈接檢測框和對象橢球：

1）在圖像中，如果一個關(guān)鍵點位于邊界框內(nèi)，它就與一個檢測相鏈接

2）在地圖中，如果一個點地標位于橢球體內(nèi)，則與該對象相鏈接

如果檢測和地圖對象之間至少存在τ個基于點的匹配，則關(guān)聯(lián)。

3. 初始對象重建

當通過相機中心的光線與對象檢測中心的光線之間的角度變化為10°以上時，創(chuàng)建其3D橢球的初始估計。為了盡快地獲得對象的3D估計，對象最初被重建為球體，然后隨著視角的增加，細化為橢球體的形式。

球體的位置是從邊界框的中心進行三角測量，半徑被確定為邊界框的平均大小。

其中，為在第i個相機坐標系中的對象中心z坐標，和為第i幀檢測框的寬度和高度，和為相機內(nèi)參，n為對象被追蹤到的幀數(shù)。

然后將該球體細化為橢球體，更新其軸長和位姿，以最小化重投影誤差的形式進行改進。當經(jīng)過足夠幀數(shù)(通常為40幀)重構(gòu)和細化對象，3D IoU超過閾值時，將對象集成到地圖中。

4. 局部對象建圖

4.1 對象優(yōu)化

與ORB-SLAM2的局部束調(diào)節(jié)類似，對象模型也會定期進行優(yōu)化，每當一個新的關(guān)鍵幀觀察到地圖中存在的對象時，就會通過最小化重投影誤差來優(yōu)化對象。

其中，為第j次檢測框的內(nèi)切橢圓，為第i個對象的對偶矩陣，為第j個關(guān)鍵幀的投影矩陣，為第j個關(guān)鍵幀的目標檢測評分，N為對象觀測數(shù)量。

4.2 對象合并

系統(tǒng)定期檢查重復的對象，如果它們的3D IoU超過0.2，并且一個橢球體的中心位于另一個橢球體的內(nèi)部或者共享超過個3D點，則合并這兩個對象。

對關(guān)鍵幀中的兩個對象跟蹤的檢測框進行組合，并初始化一個新的橢球。

5. 使用對象重定位

當重構(gòu)地圖上的點與關(guān)鍵幀顯著不同時，基于BoW的方法經(jīng)常失敗。因此采用基于對象的方法增強重定位，對視角改變更加魯棒。

由于PnP計算出的位姿比從對象對應關(guān)系中得到的位姿更準確，主要思想是引導點與從對象對應關(guān)系中計算出的姿態(tài)進行匹配。然后采用點對應關(guān)系使用PnP進行定位。

基于對象的方法：根據(jù)橢圓-橢球的類別建立了橢圓-橢球?qū)Γ看蔚辽龠x擇三對組合，在中心使用P3P算法計算相機位姿。對于P3P解出的四種解，橢球體被投影并且基于重疊關(guān)聯(lián)檢測，代價計算為每個關(guān)聯(lián)對的(1-IoU)之和，選擇四種解中代價最小的相機位姿。

然后將基于對象方法得到的位姿通過ORB-SLAM2的局部匹配步驟來識別關(guān)鍵點-地標對應關(guān)系，選擇最小代價且超過30個關(guān)鍵點-地標匹配的位姿，在點上進行優(yōu)化。

Experiments:

1. 對象建圖

與EAO-SLAM的對比

2. 對象vs點

2.1 重定位

2.2 在束調(diào)整中集成對象

3. AR應用

3.1 重新初始化3D追蹤

3.2 SLAM恢復

1-4）在3D中跟蹤相機，并建立點和對象的地圖

5-6）由于相機的突然運動，跟蹤丟失了

7-9）當重構(gòu)的場景再次可見時，重定位模塊從對象中估計相機姿態(tài)，建立點匹配，并使跟蹤和建圖繼續(xù)進行。

4. 按部分建模

相機重定位需要足夠數(shù)量的對象（3），當相機靠近時，可能只有一到兩個對象可見。解決方法：微調(diào)檢測器網(wǎng)絡，以檢測對象的可區(qū)分部分。

近距離情況下，雕像的部分(頭、肩膀和底部)被用于重新定位，當遠距離情況下，只使用完整的對象檢測。

Discussion and Future work:

考慮將基于對象的推理與靜態(tài)/動態(tài)識別相結(jié)合。

審核編輯：李倩

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

檢測器

檢測器

+關(guān)注

關(guān)注
1

文章
865

瀏覽量
47717
相機

相機

+關(guān)注

關(guān)注
4

文章
1358

瀏覽量
53694
SLAM

SLAM

+關(guān)注

關(guān)注
23

文章
425

瀏覽量
31860

原文標題：OA-SLAM：在視覺SLAM中利用對象進行相機重新定位

文章出處：【微信號：3D視覺工坊，微信公眾號：3D視覺工坊】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

用于任意排列多相機的通用視覺里程計系統(tǒng)

如何讓多相機視覺SLAM系統(tǒng)更易于部署且對環(huán)境更具魯棒性？本文提出了一種適用于任意排列多相機的通用視覺里程計系統(tǒng)。

發(fā)表于 12-13 11:22 ?250次閱讀

用于任意排列多<b class='flag-5'>相機</b>的通用<b class='flag-5'>視覺</b>里程計系統(tǒng)

利用VLM和MLLMs實現(xiàn)SLAM語義增強

語義同步定位與建圖（SLAM）系統(tǒng)在對鄰近的語義相似物體進行建圖時面臨困境，特別是在復雜的室內(nèi)環(huán)境中。本文提出了一種面向

發(fā)表于 12-05 10:00 ?197次閱讀

<b class='flag-5'>利用</b>VLM和MLLMs實現(xiàn)<b class='flag-5'>SLAM</b>語義增強

探索 SLAM 技術(shù)賦能的 MR 混合現(xiàn)實應用場景 #可視化 #MR #混合現(xiàn)實 #SLAM

SLAM

阿梨是蘋果

發(fā)布于 :2024年12月02日 14:18:29

激光雷達在SLAM算法中的應用綜述

一、文章概述 1.1 摘要即時定位與地圖構(gòu)建（simultaneous localization and mapping，SLAM）是自主移動機器人和自動駕駛的關(guān)鍵技術(shù)之一，而激光雷達則是支撐

發(fā)表于 11-12 10:30 ?770次閱讀

激光雷達<b class='flag-5'>在</b><b class='flag-5'>SLAM</b>算法<b class='flag-5'>中</b>的應用綜述

MG-SLAM：融合結(jié)構(gòu)化線特征優(yōu)化高斯SLAM算法

同步定位與地圖構(gòu)建 (SLAM) 是計算機視覺中的一個基本問題，旨在在同時跟蹤相機姿勢的同時對環(huán)境進行

發(fā)表于 11-11 16:17 ?349次閱讀

從算法角度看 SLAM（第 2 部分）

作者： Aswin S Babu 正如我們在[第 1 部分]中所討論的，SLAM 是指在無地圖區(qū)域中估計機器人車輛的位置，同時逐步繪制該區(qū)域地圖的過程。根據(jù)使用的主要技術(shù)，SLAM 算法可分為三種

發(fā)表于 10-02 16:39 ?345次閱讀

一種適用于動態(tài)環(huán)境的實時視覺SLAM系統(tǒng)

既能保證效率和精度，又無需GPU，行業(yè)第一個達到此目標的視覺動態(tài)SLAM系統(tǒng)。

發(fā)表于 09-30 14:35 ?507次閱讀

機器人高效導航定位背后SLAM專用芯片的崛起

。 ? SLAM技術(shù)是定位與地圖構(gòu)建技術(shù)，其重要的理論與應用價值被認為是實現(xiàn)自動駕駛和全自主移動機器人的關(guān)鍵技術(shù)。小到掃地機器人，大到自動駕駛汽車，無人自主移動設(shè)備近些年的快速發(fā)展加速了SLAM行業(yè)的發(fā)展，為了

發(fā)表于 05-28 00:20 ?3587次閱讀

深度解析深度學習下的語義SLAM

隨著深度學習技術(shù)的興起，計算機視覺的許多傳統(tǒng)領(lǐng)域都取得了突破性進展，例如目標的檢測、識別和分類等領(lǐng)域。近年來，研究人員開始在視覺SLAM算法中

發(fā)表于 04-23 17:18 ?1316次閱讀

工程實踐中VINS與ORB-SLAM的優(yōu)劣分析

ORB-SLAM是一種基于特征的單目視覺SLAM系統(tǒng)，廣泛用于實時三維地圖構(gòu)建和機器人定位。該系統(tǒng)使用ORB特征進行高效的

發(fā)表于 04-08 10:17 ?2967次閱讀

什么是SLAM？SLAM算法涉及的4要素

SLAM技術(shù)可以應用在無人駕駛汽車、無人機、機器人、虛擬現(xiàn)實等領(lǐng)域中，為這些領(lǐng)域的發(fā)展提供了支持。SLAM技術(shù)的發(fā)展已經(jīng)逐漸從單純的定位和地圖構(gòu)建轉(zhuǎn)向了基于場景理解的功能。

發(fā)表于 04-04 11:50 ?2491次閱讀

什么是SLAM？基于3D高斯輻射場的SLAM優(yōu)勢分析

基于NeRF的SLAM算法采用全局地圖和圖像重建損失函數(shù)，通過可微分渲染捕獲稠密的光度信息，具有高保真度。

發(fā)表于 04-01 12:44 ?756次閱讀

從基本原理到應用的SLAM技術(shù)深度解析

LSD-SLAM 即 Large-Scale Direct SLAM，兼容單目相機和雙目相機。LSD-SLAM是一種基于光流跟蹤的直接法

發(fā)表于 02-26 09:41 ?9399次閱讀

動態(tài)環(huán)境中基于神經(jīng)隱式表示的RGB-D SLAM

神經(jīng)隱式表示已經(jīng)被探索用于增強視覺SLAM掩碼算法，特別是在提供高保真的密集地圖方面。

發(fā)表于 01-17 10:39 ?913次閱讀