摘要
同步定位和建圖 (SLAM) 技術在過去幾十年取得了驚人的進步,并引起了自動駕駛社區的極大興趣。憑借其在導航和地圖繪制的概念根源,SLAM 優于一些傳統的定位和定位技術,因為它可以支持更可靠和穩健的定位、規劃和控制以滿足自動駕駛的一些關鍵標準。在這項研究中,作者首先概述了不同的 SLAM 實現方法,然后針對不同的駕駛場景、車輛系統組件和 SLAM 方法的特點討論了 SLAM 在自動駕駛中的應用。然后,作者討論了將 SLAM 應用于自動駕駛時的一些具有挑戰性的問題和當前的解決方案。綜述了評估SLAM系統的特性和性能以及監控SLAM估計風險的一些定量質量分析方法。
此外,本研究還描述了一個真實世界的道路測試,以展示用于自動駕駛的基于多傳感器的現代化 SLAM 程序。數值結果表明,結合激光雷達和 GNSS/INS 的 SLAM 程序可以生成高精度 3D 點云地圖?;诖祟A生成地圖和在線激光雷達掃描與緊密融合的慣性系統匹配,可以實現在線四到五厘米精度定位解決方案。本研究描述了一個真實世界的道路測試,以展示用于自動駕駛的基于多傳感器的現代化 SLAM 程序。數值結果表明,結合激光雷達和 GNSS/INS 的 SLAM 程序可以生成高精度 3D 點云地圖。
基于此預生成地圖和在線激光雷達掃描與緊密融合的慣性系統匹配,可以實現在線四到五厘米精度定位解決方案。本研究描述了一個真實世界的道路測試,以展示用于自動駕駛的基于多傳感器的現代化 SLAM 程序。數值結果表明,結合激光雷達和 GNSS/INS 的 SLAM 程序可以生成高精度 3D 點云地圖。基于此預生成地圖和在線激光雷達掃描與緊密融合的慣性系統匹配,可以實現在線四到五厘米精度定位解決方案。
一、簡介
自主(也稱為自動駕駛、無人駕駛或機器人)車輛操作是一個重要的學術和工業研究課題。據預測,全自動駕駛汽車將成為未來幾十年汽車總銷量的重要組成部分。自動駕駛汽車的推廣引起了人們對許多優勢的關注,例如為殘疾人或老年人提供服務、減輕駕駛員壓力和成本、減少道路事故、消除對傳統公共交通服務的需求等。[ 1 , 2 ] .
典型的自動駕駛汽車系統包含四個關鍵部分:定位、感知、規劃和控制(圖 1)。定位是獲?。ㄒ苿踊蜢o態)對象相對于給定坐標系的坐標的過程。坐標系可以是局部坐標系或大地基準,例如WGS84。定位是估計載體相對于參考系或地圖的姿態(位置和姿態)的過程。感知系統監測本車周圍的道路環境,識別感興趣的對象,如行人、其他車輛、紅綠燈、指示牌等。
圖 1. 自動駕駛系統的功能組件。
通過確定周圍環境中物體的坐標,可以生成地圖。此過程稱為建圖。
路徑規劃是利用定位、建圖和感知信息來確定后續駕駛時期的最佳路徑,將自動駕駛車輛從一個位置引導到另一個位置的步驟。然后使用控制系統組件將該計劃轉化為行動,例如,在檢測到交通燈之前進行制動控制等。
所有這些部分都是密切相關的。車輛和道路實體的位置信息可以通過結合位置、感知和地圖信息來獲得。相比之下,定位和建圖可用于支持更好的感知。準確的定位和感知信息對于正確的規劃和控制至關重要。
為實現全自動駕駛,定位和感知步驟需要考慮一些關鍵要求。首先是準確性。對于自動駕駛,有關道路位置和車輛在車道內位置的信息支持規劃和控制步驟。為了實現這些,并確保車輛安全,對車道級別甚至“where-in-lane”級別(即子車道級別)的位置估計有嚴格的要求。識別范圍很重要,因為規劃和控制步驟需要足夠的處理時間讓車輛做出反應 [ 3]. 魯棒性意味著定位和感知應該對駕駛時的任何變化具有魯棒性,例如駕駛場景(城市、高速公路、隧道、鄉村等)、照明條件、天氣等。
傳統的車輛定位和感知技術無法滿足上述所有要求。例如,由于信號可能被樹木、城市峽谷、隧道等扭曲甚至阻擋,因此會出現 GNSS 誤差。慣性導航系統 (INS) 通常用于在 GNSS 信號中斷期間支持導航,以繼續提供位置、速度和高度信息。然而,慣性測量偏差需要經常估計校正或校準,最好使用 GNSS 測量來實現。然而,集成的 GNSS/INS 系統仍然不夠,因為高度自動化駕駛不僅需要宿主車輛的定位信息,還需要周圍環境中物體的空間特征。因此,感知傳感器,例如激光雷達和相機,通常用于定位和感知。激光雷達可以直接獲取 3D 點云,并借助 GNSS 和 INS 繪制環境地圖,在城市道路行駛條件下精度可達厘米級 [4 ]。然而,高昂的成本限制了激光雷達系統在車輛中的商業應用。此外,其準確性受天氣(例如下雨)和照明條件的影響。與激光雷達相比,攝像頭系統的精度較低,但也會受到眾多誤差源的影響 [ 5、6 ]。然而,它們更便宜、體積更小、需要更少的維護并且使用更少的能源?;谝曈X的系統可以提供豐富的環境信息,類似于人眼可以感知的信息,并且數據可以與其他傳感器融合以確定檢測到的特征的位置。
具有豐富道路環境信息的地圖對于上述傳感器實現準確和穩健的定位和感知至關重要。預先存儲的道路信息使自動駕駛對不斷變化的環境和道路動態具有魯棒性。由于車載地圖可以及時提供路網信息,因此可以滿足識別范圍要求。已經使用不同類型的地圖信息研究了基于地圖的定位和導航。谷歌地圖就是一個例子,因為它提供全球地圖信息,包括圖像、地形細節和衛星圖像 [ 7 ],并且可以通過手機和車輛應用程序獲得。但是,地圖的使用將受到地圖精度的限制,并且在某些選定區域中,地圖的分辨率可能不足。在 [ 8],作者通過結合來自其他傳感器的數據來考慮用于導航的低精度地圖。他們使用激光雷達數據檢測移動物體,并使用帶有粗略開源 GIS 地圖的 GNSS/INS 系統。他們的結果表明他們的融合技術可以成功地檢測和跟蹤移動物體。[ 9 ]中提出了一種使用 3D 激光雷達傳感器和高精度地圖的基于路緣地圖的精確定位方法。但是,當路緣信息缺失或受阻時,此方法將失敗。
最近,所謂的“高清”(HD) 地圖在自動駕駛的背景下受到了極大的關注,因為它們包含非常準確且大量的道路網絡信息 [10 ]。據商業高清地圖市場的一些主要參與者稱,已經達到 10-20 厘米的精度[ 11、12】,預計在下一代高精地圖中,精度將達到幾厘米。此類地圖包含大量道路特征信息,不僅包括靜態道路實體和道路幾何形狀(曲率、坡度等),還包括交通管理信息,如交通標志、紅綠燈、限速、道路標記等。自動駕駛汽車可以使用高精地圖精確定位主車在車道內,并通過將車載傳感器識別的地標與車道內預存信息進行匹配,估計汽車相對于道路物體的相對位置。高清地圖。
因此,地圖,尤其是高清地圖,在支持自動駕駛方面發揮著多種作用,可能能夠滿足準確度、精確度、識別距離、魯棒性和信息豐富度等嚴苛要求。然而,同時定位與建圖(SLAM)等技術也促進了“地圖”在自動駕駛中的應用。SLAM 是移動平臺構建環境地圖并同時使用該地圖推斷其位置的過程。廣泛應用于機器人領域的 SLAM 已被證明 [ 13、14 ] 適用于自動駕駛車輛操作,因為它不僅可以支持精確的地圖生成,還可以在先前生成的地圖中進行在線定位。
通過適當的傳感器信息(感知數據、絕對和航位推算位置信息),可以通過 SLAM 離線生成高密度和精確的地圖。駕駛時,自動駕駛汽車可以通過將傳感器數據與地圖進行匹配,在預先存儲的地圖中定位自己。SLAM 還可用于解決 DATMO(移動物體的檢測和跟蹤)問題 [ 15] 這對于檢測行人或其他移動物體很重要。由于環境的靜態部分由 SLAM 定位和建圖,因此可以同時檢測和跟蹤相對于靜態對象或特征的動態組件。然而,SLAM 在應用于自動駕駛應用時也存在一些具有挑戰性的問題。例如,“閉環”可用于減少室內或城市場景中 SLAM 估計中的累積偏差,但通常不適用于高速公路場景。
本文將回顧SLAM的一些關鍵技術,SLAM在自動駕駛中的應用,以及與應用相關的合適的SLAM技術。第 2 節簡要介紹了一些關鍵 SLAM 技術的原理和特點。第 3 節描述了 SLAM 在自動駕駛中的一些潛在應用。第 4 節討論了將 SLAM 技術應用于自動駕駛的一些具有挑戰性的問題。第 5 節描述了一個真實世界的道路測試,以顯示基于多傳感器的自動駕駛 SLAM 程序的性能。結論在第 6 節中給出。
2. 關鍵SLAM技術
自 1986 年首次推出 [ 16 ] 以來,已經開發了多種 SLAM 技術。SLAM 的概念根源于大地測量學和地理空間建圖 [ 17 ]。
一般來說,有兩種類型的 SLAM 估計方法:基于濾波器和基于優化。兩種方法同時估計車輛姿態狀態和地圖狀態。車輛姿態包括 3D 或 2D 車輛位置,但有時還包括速度、方向或姿態,具體取決于所使用的傳感器和應用程序。
2.1. 在線和離線 SLAM
圖 2和圖 3說明了兩種一般的 SLAM 實現:在線 SLAM 和離線 SLAM(有時稱為全 SLAM)。根據 [ 18 ],全 SLAM 試圖計算整個路徑上的變量以及地圖,而不僅僅是當前位姿,而在線 SLAM 問題是通過從全 SLAM 問題中刪除過去的位姿來解決的。
圖 2. 在線 SLAM 描述
圖 3. 離線 SLAM 描述。
這里,x k代表車輛在時間k的位姿(位置、姿態、速度等) 。m是由存儲的地標 ( f 1 – f 4 ) 及其位置狀態組成的地圖。u k是控制輸入,表示時間段k ? 1 和k之間的車輛運動信息,例如加速度、轉角等,可以從車輪編碼器或慣性傳感器等車輛運動傳感器獲取。在某個時期k,機載傳感器(如 Camera、Lidar 和 Radar)將感知環境并檢測一個或多個地標。車輛和所有觀察到的地標之間的相對觀察表示為z k。有了這些信息,就可以估計變量(包括車輛姿態和地圖狀態)。
圖 2和圖 3中的藍色背景矩形表示在這兩個實現中估計的狀態變量。在大多數情況下,對于在線 SLAM,在生成地圖并使用最新測量值(u k +2和z k +2 )更新地圖時,僅估計當前車輛位姿x k +2,而在離線情況下SLAM實現,車輛的整個軌跡連同整個地圖一起更新。所有可用的控制和觀察測量將一起用于離線 SLAM 實施。
然而,隨著SLAM算法的發展和計算能力的提高,可以使用高效的SLAM算法實時獲得完整的SLAM解決方案,也可以將其視為在線問題。因此,在線或離線實施 SLAM 方法可能取決于它所需的測量輸入(控制和觀察)是來自當前/歷史還是來自未來的時代,以及它的處理時間(實時或非實時)。
2.2. 基于濾波器的 SLAM
基于濾波器的 SLAM 分兩步遞歸地解決 SLAM 問題。首先,使用處理模型和控制輸入來預測車輛和地圖狀態。在下一步中,使用當前傳感器觀測值對預測狀態進行校正。因此,基于濾波器的 SLAM 適用于在線 SLAM。
基于擴展卡爾曼濾波器的 SLAM (EKF-SLAM) 代表了 SLAM 問題的標準解決方案。它源自貝葉斯過濾,其中所有變量都被視為高斯隨機變量。它包括兩個步驟:時間更新(預測)和測量更新(過濾)。在每個時期,測量和運動模型都被線性化(使用當前狀態和一階泰勒展開)。然而,由于線性化不是圍繞狀態向量的真實值進行的,而是圍繞估計值 [ 19 ] 進行的,因此線性化誤差會累積并可能導致估計發散。因此,可能會出現不一致。
與 EKF-SLAM 相關的另一個問題是地圖尺寸的不斷擴大,這使得大規模 SLAM 的二次計算過程變得不切實際。對于自動駕駛來說,復雜的道路環境和較長的行駛周期會引入大量的特征,使得實時計算不可行。為了提高計算效率,人們開發了大量的算法。例如,壓縮擴展卡爾曼濾波器 (CEKF) [ 20 ] 算法可以通過關注局部區域然后將過濾后的信息擴展到全球地圖來顯著減少計算量。具有子圖的算法也已用于解決計算問題[ 21、22、23、24]. 當舊地圖達到預定義的地圖大小時,使用新的空白地圖替換舊地圖。維護更高級別的地圖以跟蹤每個子地圖之間的鏈接。
還有一些其他基于濾波器的 SLAM 方法,例如卡爾曼濾波器的一些變體。其中之一,信息濾波器 (IF),以狀態誤差協方差矩陣的逆形式傳播,這使得該方法更加穩定 [ 25 ]。這種方法在多車 SLAM 中比在單車系統中更受歡迎。
另一類基于濾波器的 SLAM 技術是近年來流行的粒子濾波器 (PF)。PF 通過代表貝葉斯后驗概率的一組隨機點簇(或粒子)執行順序蒙特卡洛(SMC)估計。在 [ 26 ]中提出了 Rao-Blackwellized 粒子濾波器。Fast-SLAM 是一種流行的實現方式,它將機器人位置分布視為一組 Rao-Blackwellized 粒子,并使用 EKF 來維護局部地圖。這樣一來,SLAM的計算復雜度就大大降低了。Fast-SLAM [ 27 ]可以實現實時應用,使自動駕駛的在線 SLAM 成為可能。與 EKF 相比的另一個優勢是粒子濾波器可以處理非線性運動模型 [ 28]. 然而,根據 [ 29、30 ],Fast-SLAM 由于無法忘記過去而遭受退化。如果邊緣化地圖并在執行重采樣時,統計準確性就會丟失。
2.3. 基于優化的 SLAM
Full SLAM 使用整個傳感器數據估計所有車輛姿態和地圖狀態,并且主要基于優化。與基于濾波器的 SLAM 類似,基于優化的 SLAM 系統由兩個主要部分組成:前端和后端。在前端步驟中,SLAM系統通過傳感器數據提取問題的約束條件,例如,通過執行特征檢測和匹配、運動估計、閉環檢測等。然后應用非線性優化來獲得最大似然估計在后端。
圖 SLAM 是全 SLAM 的主要類別之一,它使用圖形結構來表示貝葉斯 SLAM。所有平臺沿整個軌跡構成,所有檢測到的特征都被視為節點。姿勢之間的空間約束被編碼在節點之間的邊緣中。這些約束來自觀察、里程計測量和閉環約束。圖構建后,應用圖優化以優化整個軌跡和地圖的圖模型。為了求解全優化和計算后驗的高斯近似,可以使用多種方法,例如 Gauss–Newton 或 Levenberg–Marquardt [31 ]。
對于基于圖的 SLAM,其協方差矩陣的大小和更新時間在生成圖后是恒定的,因此圖 SLAM 已成為構建大規模地圖的流行方法。降低優化步驟的計算復雜度已成為實際實現高維 SLAM 問題的主要研究課題之一。有效解決優化步驟的關鍵是法線矩陣的稀疏性。每個測量僅與非常有限數量的變量相關聯的事實使得矩陣非常稀疏。利用Cholesky分解和QR分解方法,可以有效地分解信息矩陣和測量雅可比矩陣,從而顯著降低計算成本。已經提出了幾種算法,例如TORO和g2o。32、33、34、35、36 ]。_ _ _ _ _ _ _ 子地圖可以獨立優化并與局部坐標系相關。子地圖坐標可以被視為姿勢節點,與運動約束或閉環約束相關聯。因此,生成了全局位姿圖。以這種方式,計算復雜度和更新時間將得到改進。
Smoothing and Mapping (SAM) 是另一種基于優化的 SLAM 算法,是一種非線性最小二乘問題。這樣的最小二乘問題可以通過增量平滑和建圖 (iSAM) [ 37 ] 和 iSAM2 [ 38 ] 逐步解決。在線 SLAM 可以通過增量 SAM 獲得,因為它們避免了對整個協方差矩陣進行不必要的計算。iSAM2 更高效,因為它使用貝葉斯樹來獲得增量變量重新排序和流體重新線性化。
SLAM++ 是另一種基于非線性最小二乘優化的 SLAM 增量解決方案,非常高效。此外,對于在線 SLAM 實現,快速狀態協方差恢復對于數據關聯、獲得簡化狀態表示、主動決策和下一個最佳視圖非常重要 [39、40 ]。SLAM++ 有一個優勢,因為它允許增量協方差計算,這比其他實現更快[ 40 ]。
表 1總結了一些典型的 SLAM 技術的特征。請注意,Graph SLAM 利用所有可用的觀察和控制信息,可以實現非常準確和穩健的估計結果。它適用于離線應用,其性能依賴于良好的初始狀態猜測。Filter-based SLAM 用于在線估計時更適合小規模環境,但對于復雜環境,傳統的 EKF-SLAM 可能難以進行實時計算。應考慮其他變體或 fastSLAM。增量優化方法可以進行增量更新,從而以非常高的效率實時地提供大比例尺地圖的最優估計。
表 1. 一些典型 SLAM 技術的特征
2.4. SLAM 的傳感器和融合方法
由于傳感器和計算技術的進步,出現了新的 SLAM 方法。這些方法在后端估計步驟也是基于優化或基于過濾的,而前端步驟高度依賴于不同傳感器模式的應用。用于 SLAM 的兩個主要傳感器是激光雷達和相機。與其他傳感器相比,激光雷達方法因其簡單性和準確性而變得流行 [ 52 ]。基于激光雷達的定位和建圖的核心是掃描匹配,恢復兩個掃描或點云的相對位置和方向。流行的掃描匹配方法包括迭代壁櫥點 (ICP) 算法及其變體[ 53、54、55],以及正態分布變換 (NDT) [ 56 ]。這些方法高度依賴于良好的初始猜測,并受到局部最小值 [ 57、58 ]的影響。其他一些匹配方法包括概率方法,例如相關掃描匹配 (CSM) [ 59 ]、基于特征的方法 [ 57、60 ]等。許多掃描匹配方法專注于初始免于初始化錯誤或對初始化錯誤具有魯棒性,但它們仍然面臨計算效率的挑戰。
一些可用于 SLAM 估計的距離傳感器是雷達和聲納/超聲波傳感器。雷達的工作方式與激光雷達類似,但該系統發射無線電波而不是光來測量到物體的距離。此外,由于雷達可以使用測量的多普勒頻移 [ 61 ]來觀察傳感器與物體之間的相對速度,因此適用于區分靜止物體和運動物體,并可用于在建圖過程中丟棄運動物體 [ 62 ]。在[ 42 , 62 , 63 , 64 , 65 , 66中可以找到一些關于將雷達用于 SLAM 的研究]. 與激光雷達相比,低價格、低功耗和對大氣條件的敏感性較低,使其非常適合戶外應用。然而,雷達的測量分辨率較低,其檢測比激光雷達更稀疏。因此,很難匹配雷達數據和處理數據關聯問題,這導致其 3D 建圖不太準確。
聲納/超聲波傳感器還通過發送和接收聲波來測量飛行時間 (TOF) 以確定到物體的距離?;诼暭{的 SLAM 最初用于水下 [ 67、68 ] 和室內 [ 69 ]應用。由于其低成本和低功耗,它已變得流行。它不受能見度限制的影響,可用于多種表面類型 [ 70]. 然而,與雷達類似,它獲取的信息稀疏,并且存在特征提取不準確和處理時間長的問題。因此,它在高速車輛應用中的用途有限。此外,聲納/超聲波傳感器的感應范圍有限,可能會受到環境噪聲和其他使用相同頻率超聲波的平臺的影響[ 71 ]。
相機是另一種流行的 SLAM 傳感器。已經開發了不同的技術,例如單目[ 72、73 ] 、立體[ 74、75、76、77 ]和多攝像頭[ 78、79、80、81 ] 。這些技術可用于各種環境,包括室內和室外。單攝像頭系統易于部署,但存在規模不確定性[ 82 ]。立體相機系統可以克服比例因子問題,并且可以通過從兩個不同的角度比較同一場景來檢索 3D 結構信息 [ 61]]. 多相機系統受到越來越多的關注,特別是當它們實現大視野 [ 78 ] 或者甚至能夠實現全景視覺 [ 81 ] 時。該系統在復雜環境中更加穩健,而單傳感器系統可能非常容易受到環境干擾[ 81 ]。然而,相機的集成需要額外的軟件和硬件,并且需要更多的校準和同步工作[ 71、83 ]。另一種特殊的相機,RGB-D 相機,已經被 SLAM 和計算機視覺社區研究 [ 84 , 85 , 86 , 87 , 88 , 89, 90 , 91 ] 因為它可以直接獲取深度信息。然而,該系統主要適用于室內環境,因為它使用紅外光譜光,因此對外部照明敏感[ 70 ]。
根據測量的使用方式,視覺 SLAM 也可以分為基于特征的或直接的 SLAM。基于特征的 SLAM 反復檢測圖像中的特征,并利用描述性特征進行跟蹤和深度估計 [ 92 ]。這種基于特征的系統的一些基本框架包括 MonoSLAM [ 72、93 ]、PTAM [ 94 ] 、 ORB -SLAM [ 95 ] 和 ORB-SLAM2 [ 96 ]。直接 SLAM 方法不使用任何特征檢測器和描述符,而是使用整個圖像。直接 SLAM 的示例包括 DTAM [ 97 ]、LSD-SLAM [ 73 ] 和 SVO [ 98]]. 這些方法可以獲得密集或半密集的環境模型,這使得它們比基于特征的方法對計算的要求更高。恩格爾等。[ 74 ] 將 LSD-SLAM 從單眼模型擴展到立體模型,而 Caruso 等人。[ 99 ] 將 LSD-SLAM 擴展到全向模型。視覺SLAM的詳細回顧可以在 [ 5 ]和[ 70、92、100、101 ]中找到。
這些感知傳感器中的每一個都有其優點和局限性。激光雷達方法可以提供精確和遠距離的觀測,但存在一些局限性,例如對大氣條件敏感、價格昂貴且目前相當笨重。雷達系統成本相對較低,但比 3D 建圖更適合對象檢測。聲納/超聲波傳感器不適合高速平臺應用。相機成本低,即使使用多個相機也是如此。相機還可以提供豐富的視覺信息。然而,它們對環境紋理和光線敏感,并且通常具有很高的計算要求。因此,一種流行的策略是組合多種傳感器,使 SLAM 系統更加魯棒。
有幾種策略可以為 SLAM 集成來自不同傳感器的數據。一種是融合獨立處理的傳感器結果,然后獲得最終解決方案。在[ 102 ]中,提出了一種將激光和立體相機測量分別生成的兩個網格圖合并為單個網格圖的建圖方法。在這種方法中,需要將不同傳感器的測量值建圖到一個聯合參考系統。在 [ 103],一種多傳感器 SLAM 系統,結合了激光讀數的 3-DoF 姿態估計、單目視覺系統的 6-DoF 姿態估計以及基于慣性的導航估計結果,使用提出了EKF處理方案。對于這種類型的策略,傳感器可以提供冗余,并且系統將對可能的單傳感器故障具有魯棒性??赡苄枰粋€決策步驟來識別來自每個傳感器的數據是否可靠,并決定是采用來自該傳感器模式的估計還是忽略它。另一種融合策略是使用輔助傳感器來提高其他基于傳感器的 SLAM 算法的性能。主傳感器可以是激光雷達或攝像頭,而輔助傳感器可以是任何其他類型的傳感器。在這個策略中,輔助傳感器用于克服主傳感器的局限性。在[工作104 ] 結合視覺信息為剛體變換提供良好的初始猜測,然后使用該初始變換為 ICP 框架播種。黃等。[ 105 ] 從激光雷達數據中提取基于點和基于線的地標的深度。所提出的系統使用此深度信息來指導相機跟蹤,并支持后續的點線束調整以進一步提高估計精度。
以上兩種策略可以結合使用。在[ 106 ]的工作中,融合由兩個模型組成,一個處理特征融合,利用圖像中的線特征信息去除激光段中由動態物體產生的任何“偽段”。另一個是改進的 EKF SLAM 框架,它結合了從單個單目和激光 SLAM 獲得的狀態估計,以減少姿態估計協方差并提高定位精度。這種改進的 SLAM 框架即使在一個傳感器發生故障時也可以運行,因為傳感器 SLAM 過程是相互并行的。
在文獻中也可以找到一些更緊密融合的例子。[ 107 ]的工作結合了激光點云數據和圖像特征點數據作為約束,并使用特定的成本函數對這兩個約束進行了圖形優化。此外,該系統還添加了基于圖像特征的閉環以消除累積誤差。
慣性 SLAM 包含一個慣性測量單元 (IMU) 作為輔助傳感器。IMU 可以與 Camera 或 Lidar 融合,支持位姿(位置、速度、姿態)估計。使用 IMU,可以觀察到姿態,尤其是航向 [ 108 ]。IMU 測量的集成還可以提高觀察間隙期間的運動跟蹤性能。例如,對于視覺 SLAM,光照變化、無紋理區域或運動模糊將導致視覺軌跡丟失 [ 108 ]。對于激光雷達系統,原始激光雷達掃描數據可能會因高速運動(例如快速移動或突然搖晃)而產生傾斜,從而導致難以解釋的傳感誤差 [109 ]。[ 110的工作] 使用 IMU 傳感器來處理快速速度變化,并初始化運動估計以進行掃描匹配激光雷達里程計,以支持他們的 LOAM 系統。兩次激光雷達掃描之間的高頻 IMU 數據可用于消除激光雷達點云的偏移并提高其精度 [ 109 ]。
慣性傳感器的融合可以作為一個簡單的助手 [ 111 , 112 ] 或更緊密的耦合 [ 108 , 113 , 114 , 115 ]。對于簡單的輔助情況,IMU 主要用于提供方向信息,例如支持系統初始化。IMU 用作整個系統的先驗,IMU 測量不用于進一步優化。對于緊耦合情況,IMU數據與相機/激光雷達狀態融合建立測量模型,然后進行狀態估計并反饋給慣性導航系統以提高導航性能[ 116]. 因此,前一種方法比后者更有效,但準確性較低 [ 117 ]。對于緊密耦合的情況,卡爾曼濾波器可用于校正 IMU 狀態,即使在 GNSS 中斷期間也是如此 [ 118 ]。
2.5. 基于深度學習的 SLAM
前面提到的大多數SLAM方法都是基于幾何模型的,它建立了基于幾何的平臺運動和環境模型。這些方法在過去十年中取得了巨大的成功。然而,他們仍然面臨許多具有挑戰性的問題。例如,視覺 SLAM (VSLAM) 在極端光照條件下受到限制。對于大規模應用,基于模型的方法需要處理大量信息,例如特征和動態障礙物。最近,深度學習技術,例如在計算機視覺領域開發的數據驅動方法,引起了更多關注。許多研究人員嘗試將深度學習方法應用于 SLAM 問題。
由于深度學習技術在圖像分類、識別、目標檢測和圖像分割領域取得了突破,因此當前的大部分研究活動都集中在利用基于學習的方法來解決 VSLAM 問題 [119 ]。例如,深度學習已成功應用于視覺里程計 (VO) 問題,這是 VSLAM 的重要組成部分。光流估計在一些學習的VO模型中用作輸入[ 120、121、122、123、124 ] 。學習方法的應用可以以端到端的方式應用,而無需在傳統的 VO 管道中采用任何模塊[ 125、126 ]]. 王等。[ 125 ] 通過將 CNN 與 RNN 相結合,引入了一種具有深度遞歸卷積神經網絡 (RCNN) 的端到端 VO 算法。使用這種算法,相機的姿態直接從原始 RGB 圖像中估計出來,既不需要先驗知識也不需要參數來恢復絕對比例 [ 125 ]。李等。[ 127 ] 提出了一種基于無監督深度學習的 VO 系統(UnDeepVO),該系統使用立體圖像對進行訓練,然后使用單目圖像執行姿態估計和密集深度圖估計。與 Wang 等人提出的不同。[ 125 ],UnDeepVO 不需要地面實況,因為它以無人監督的方式運行。
基于學習的方法可以與 VSLAM 系統相結合,以替換或添加傳統 SLAM 的單個或某些模塊,例如圖像深度估計 [128, 129, 130] ,姿態估計[ 131 , 132 , 133 ] ,以及閉環[ 134、135、136、137 ]等,對傳統方法進行改進。李等。[ 138] 提出了一種完全無監督的基于深度學習的 VSLAM,它包含幾個組件,包括 Mapping-net、Tracking-net、Loop-net 和圖形優化單元。這種 DeepSLAM 方法可以實現準確的姿態估計,并且在一些具有挑戰性的場景中具有魯棒性,將重要的幾何模型和約束結合到網絡架構和損失函數中。
環境的語義感知和語義分割是當前計算機視覺領域的研究課題。它們可以提供對環境的高層次理解,對于自主應用程序極為重要。深度學習的快速發展可以協助將語義信息引入 VSLAM [ 139 ],用于語義分割 [ 140、141、142 ] 、定位和建圖 [ 143、144、145、146、147 ],以及動態對象移除[ 148 , 149 , 150 , 151]. 一些基于深度學習的VSLAM的詳細評論可以在[ 92、139、152、153、154 ]中找到。
與慣性傳感器的融合也可以受益于深度學習技術,尤其是 RNN,它在整合時間信息和幫助建立相鄰幀之間的一致性方面具有優勢 [139 ]。視覺和慣性數據與 RNN 或長短期記憶 (LSTM) 的集成,RNN 的一種變體,允許 RNN 學習長期趨勢 [155],已被證明比傳統融合更有效和方便 [ 156 ] , 157 , 158 ]。根據 Clark 等人的說法。[ 157],數據驅動的方法消除了相機和 IMU 手動同步的需要,以及相機和 IMU 之間手動校準的需要。它優于傳統的融合方法,因為它對校準誤差具有魯棒性并且可以減輕傳感器漂移。然而,為了解決漂移問題,仍然需要研究將基于學習的視覺慣性里程計系統進一步擴展到更大的具有閉環檢測和全局重定位的類 SLAM 系統。
與基于視覺的 SLAM 相比,激光掃描儀或基于激光雷達的 SLAM 的深度學習技術的應用仍處于早期階段,可以被認為是一個新的挑戰 [159 ]。維拉斯等人。[ 160 ]通過使用 IMU 傳感器支持旋轉參數估計,將 CNN 用于激光雷達里程計估計。結果與 LOAM 等最先進的方法具有競爭力。李等。[ 161 ]介紹了一種端到端的激光雷達里程計LO-Net,它具有高效率和高精度,并且可以處理動態物體。然而,這種方法是用地面實況數據訓練的,這限制了它在大規模戶外場景中的應用。李等。[ 162] 設計了一個視覺-激光雷達里程計框架,它是自我監督的,不使用任何地面實況標簽。結果表明,這種 VLO 方法優于當前其他自監督視覺或激光雷達里程計方法,并且比完全監督的 VO 表現更好。數據驅動的方法還使激光雷達數據的語義分割更加準確和快速,使其適用于支持自動駕駛汽車 [ 163、164、165 ] 。LMNet 可以將運動物體與靜態物體區分開來[ 166] 基于 3D 激光雷達掃描的 CNN。在具有挑戰性的動態環境中自動駕駛的一些具有成本效益的 3D 激光雷達應用的一個限制是其相對稀疏的點云。為了克服這個缺點,Yue 等人使用了高分辨率相機圖像。[ 167] 來豐富原始 3D 點云。ERFNet 用于借助稀疏激光雷達數據對圖像進行分割。同時,采用稀疏不變CNN(SCNN)來預測密集點云。然后,可以使用多層卷積神經網絡 (MCNN) 組合這兩個輸出來細化豐富的點云。最后,可以使用這個豐富的點云執行激光雷達 SLAM。使用這種激光雷達數據豐富神經網絡方法可以實現更好的目標分割。然而,由于訓練數據集較小,與原始稀疏點云相比,該方法在豐富點云的 SLAM 精度上沒有提高。可能需要對動態對象進行更多培訓和進一步調查,以滿足自動駕駛應用要求 [ 167 ]。
復雜的深度學習架構的產生有助于實現更準確、穩健、自適應和高效的計算機視覺解決方案,證實了它們在 SLAM 問題中應用的巨大潛力。大規模數據集的可用性仍然是推動這些應用程序發展的關鍵。此外,由于不需要地面實況,無監督學習更有希望用于自動駕駛中的 SLAM 應用。與傳統的SLAM算法相比,數據驅動的SLAM仍處于發展階段,尤其是激光雷達SLAM。此外,結合多種傳感模式可以克服單個傳感器的缺點,為此基于學習方法的集成系統仍需要進一步研究。
3. SLAM在自動駕駛中的應用
根據 SLAM 技術的不同特性,自動駕駛可能有不同的應用。應用程序的一種分類是它們是離線的還是在線的。滿足高性能要求的地圖通常是離線生成的,例如高清(HD)地圖[ 10 ]。對于這種3D點云地圖,離線地圖生成過程保證了地圖的準確性和可靠性。可以預先生成此類地圖以支持自動駕駛車輛的實時操作。
3.1. 高清地圖生成與更新
如前所述,SLAM 可用于生成用于自動駕駛的數字地圖,例如高清地圖 [ 10]. 由于要求嚴格,因此使用了高質量的傳感器。激光雷達是自動駕駛汽車的核心傳感器之一,因為它可以生成高密度的 3D 點云。高端GNSS和INS技術也被用來提供準確的位置信息。相機可以提供類似于人眼檢測到的信息的信息。傳感器數據的融合和道路信息的分析以生成高清地圖需要相當大的計算能力,這在當前的車載系統中是不可行的。因此,高清地圖是離線構建的,使用基于優化的 SLAM 等技術。離線地圖創建可以通過多次駕駛道路網絡來收集信息,然后將所有收集到的感知傳感器信息和位置信息一起處理,以提高最終地圖的準確性。高清地圖的示例顯示在圖 4 [ 11 ]。
圖 4. 來自高清地圖 ( https://here.com/ ) [ 11 ] 的圖像。
道路環境和道路規則可能會發生變化,例如,道路施工可能會降低限速,建筑開發可能會改變道路基礎設施等。因此高精地圖需要經常更新。此類更新可以利用從任何自動駕駛汽車收集的在線數據。例如,數據被傳輸到執行更新計算的中央(云)計算機。其他汽車可以接收此類基于云的更新,并及時調整駕駛計劃。喬等人。[ 168 ] 提出了一種 SLAM 變化更新(SLAMCU)算法,利用 Rao-Blackwellized PF 方法進行在線車輛位置和(新)地圖狀態估計。在 [ 169],當車輛暫時停止或在停車場時,可以使用Graph SLAM生成一個新的高清地圖特征層。然后可以將來自一輛車的新特征層上傳到地圖云,并與來自其他車輛的特征層集成到地圖云中的新特征層,從而實現更精確和穩健的車輛定位。在張等人的工作中。[ 170 ],結合實時語義分割和視覺SLAM生成道路環境的語義點云數據,然后與預先構建的高清地圖進行匹配,以確認地圖元素沒有發生變化,并在發生變化時生成新的元素。出現,從而促進高清地圖的眾包更新。
3.2. 小型本地地圖生成
SLAM 也可以用于小的局部區域。一個例子是在停車場內。停車場的行駛速度較低,因此視覺技術將比其他高速行駛場景更穩健。停車區域可能是未知的(公共停車場或車庫),或已知的(家庭區域)——這兩種情況都可以從 SLAM 中獲益。由于 SLAM 可以在沒有 GNSS 信號的情況下使用,因此適用于室內或地下停車場的車輛,僅使用感知傳感器和里程計測量(速度、轉角)或 IMU 測量。對于未知的公共停車場,可以同時估計汽車的位置和障礙物,如柱子、側墻等,指導停車系統。對于家庭區域停車,可以將預先生成的地圖和頻繁停車軌跡存儲在自動車輛系統中。每次汽車回家時,可以通過將檢測到的特征與地圖進行匹配,使用存儲的地圖進行重新定位。頻繁軌跡可用于規劃和控制步驟。
[ 171 ]中提出了一種利用多級表面 (MLS) 地圖定位車輛,并計算和規劃室內停車場內車輛路徑的方法。在這項研究中,基于圖形的 SLAM 用于建圖,然后使用 MLS 地圖規劃從起點到目的地的全局路徑,并通過激光測距穩健地定位車輛。在 [ 172 ]的工作中,網格地圖和 EKF SLAM 算法與 W 波段雷達一起用于自主倒車停車。在這項工作中,提出了一種有效的 EKF SLAM 算法以實現實時處理。在 [ 173],作者提出了一種環視監視器(AVM)/激光雷達傳感器融合方法來識別停車道并提供快速閉環性能。上述研究表明,即使沒有 GNSS,基于濾波器的 SLAM 和基于優化的 SLAM 都可以用于支持高效和準確的車輛停車輔助(局部區域建圖和定位)。在秦等人的工作中。[ 174],執行位姿圖優化以獲得優化的軌跡和停車場的全局地圖,具有諸如引導標志、停車線和減速帶等語義特征。這些特征比傳統的幾何特征更(長期)穩定和穩健,尤其是在地下停車場環境中。然后使用 EKF 完成自動駕駛的定位系統。
3.3. 在現有地圖中定位
在基于地圖的定位中,使用迭代最近點 (ICP)、正態分布變換 (NDT) 等方法將“實時”數據與地圖信息進行匹配 [10 , 175 ]。這些算法可以與 SLAM 問題聯系起來,因為 SLAM 使用類似的方法執行閉環和重新定位。對于 SLAM 問題,識別先前建圖的對象或特征并在環境中重新定位車輛的能力對于校正地圖 [ 13 ]至關重要。因此,重用預先生成的地圖來定位車輛可以被認為是 SLAM 算法的擴展。換句話說,預先生成和存儲的地圖可以被視為一種支持定位的“傳感器”。
然而,將實時數據與預先準備好的大規模地圖相匹配需要大量的計算資源。因此,已經提出了一些方法來提高計算效率。一種方法是先用 GNSS 或 GNSS/INS 估計的位置從地圖中縮小可能的匹配區域,然后將檢測到的特征與地圖進行詳細匹配 [176 ]。
由于目前激光雷達系統在商用車上的安裝有限(傳感器價格高、功耗大),在預先生成的高清地圖中使用低成本傳感器(例如視覺傳感器)定位車輛具有相當大的實用性興趣。例如,[ 177 ] 中的工作使用視覺數據在密集的激光雷達生成的地圖中定位了車輛,并證明了與傳統激光雷達定位相似的數量級錯誤率,但使用便宜幾個數量級的傳感器技術。施賴伯等人。[ 178] 建議首先使用高精度 GNSS 單元、Velodyne 激光掃描儀和相機生成帶有道路標記和路緣信息的高精度地圖。然后在定位過程中,使用立體攝像頭系統檢測道路信息,并將其與預先生成的地圖進行匹配,實現車道級實時定位。鄭等人。[ 179 ]利用從相機圖像中獲得的道路標記進行全局定位。生成了包含道路信息(例如 3D 道路標記點)的子地圖,并用于識別重訪地點并支持準確的環路檢測。然后使用基于姿勢圖的方法來消除漂移。秦等。[ 146] 提出語義定位系統,為低成本汽車提供輕量級定位解決方案。在這項工作中,通過結合基于 CNN 的語義分割結果和位姿圖優化后的優化軌跡生成局部語義圖。然后在云服務器中生成(或更新)壓縮的全球地圖,以基于 ICP 方法和 EKF 框架進一步對最終用戶進行定位。語義地圖的平均大小為 36 kb/km。這種基于攝像頭的定位框架對于自動駕駛來說是可靠和實用的。
除了上述應用,道路環境中的移動物體也會導致自動駕駛的感知、定位和建圖漂移。SLAM 可用于解決 DATMO(移動物體的檢測和跟蹤)[ 15 ] 的問題,因為 SLAM 的假設之一是檢測到的特征是靜止的。由于環境的靜態部分由 SLAM 定位和建圖,動態部分可以同時檢測和跟蹤。一些方法已經處理了動態障礙[ 180、181、182 ]。
4. SLAM應用于自動駕駛的挑戰及建議解決方案
4.1. 確保高精度和高效率
自動駕駛車輛的定位和地圖繪制需要對環境中的任何變化都準確且穩健,并高效執行。隨著傳感器技術的快速發展,不同傳感器的組合可以彌補特定傳感器的局限性。示例包括 GNSS/INS + 激光雷達/相機 SLAM、雷達 SLAM 等。有大量與低成本和/或小型化激光雷達傳感器相關的研究和開發。新的激光雷達傳感器概念有望顯著降低激光雷達系統的成本,并有可能在未來的自動駕駛汽車中實時實施。例如,RoboSense 推出了一個新的$200 激光雷達傳感器結合 MEMS 傳感器和基于 AI 的深度學習算法以支持高性能自動駕駛應用 [ 183 ]。
選擇 SLAM 方法應考慮具有不同需求級別的不同應用場景。基于優化的 SLAM 可以提供更準確和穩健的估計,但更適合離線估計。EKF SLAM 存在狀態變量數量呈二次方增長的問題,這限制了其在大規模環境中的在線應用。盡管高分辨率地圖的生成可以是離線的、實時的或近實時的,但解決方案對于地圖更新和基于地圖的本地化應用程序來說是必不可少的。
道路環境的任何變化都應在地圖上快速更新并傳輸給其他道路使用者。新興的 5G 無線技術可以使車對車 (V2V)、車對基礎設施 (V2I) 和車對云之間的通信更加可靠,吞吐量更高 [14 ]。
4.2. 代表環境
有不同類型的地圖可用于表示道路環境。機器人領域中用于 SLAM 應用的三種主要地圖類型是占用網格地圖、基于特征的地圖和拓撲地圖 [ 184 ]。它們也適用于道路環境。對于自動駕駛應用,它們中的每一個都有其自身的優勢和局限性。網格地圖將環境劃分為許多固定大小的單元格,每個單元格包含自己獨特的屬性,例如網格是否被占用、空閑或未知 [ 185、186 ]。障礙物占用信息可以直接提供給規劃算法。這種地圖可以很容易地合并,并且可以靈活地合并來自多種類型傳感器的數據 [ 184]. Mentasti 和 Matteucci [ 185 ] 提出了一種占用網格創建方法,該方法利用來自自動駕駛車輛上所有可用傳感器的數據,包括激光雷達、相機、激光和雷達。網格圖還顯示了檢測移動物體的潛力 [ 187 ]。穆茨等人。[ 188] 比較不同網格地圖的建圖和定位性能,包括占用率、反射率、顏色和語義網格地圖,用于自動駕駛汽車在不同駕駛環境中的應用,包括在具有挑戰性的條件下。GraphSLAM 用于建圖,而定位基于粒子濾波解決方案。根據他們的結果,占用顯示了更準確的定位結果,其次是反射率網格圖。語義網格地圖在大多數情況下保持位置跟蹤沒有損失,但是比前兩種地圖方法有更大的錯誤。彩色網格圖在定位中使用最不一致和不準確,這可能是由于光照條件的影響。189 ]。因此 Li [ 186 ] 建議將此技術應用于具有受控大小的實時局部建圖而不是全局建圖。
基于特征的地圖是一種流行的自動駕駛地圖類型。它用一組從傳感器數據中提取的特征來表示地圖。對于室外道路環境,典型的特征是車道、路緣石、道路標記和標志、建筑物、樹木等。對于室內區域,尤其是停車場,特征主要是停車道、側墻等。這些特征可以是由點、線、面表示,標有坐標信息。點特征將環境表示為密集的點云。使用激光雷達和/或視覺傳感器生成的高密度點云地圖可以提供車輛周圍區域的豐富特征和 3D 結構信息。然而,如此龐大的數據傳輸、更新和處理對于復雜的道路環境來說是一個沉重的負擔。較稀疏的線面特征適用于結構化環境,如室內環境、市區或高速公路,標記清晰。這些特征比點特征更復雜,內存需求更低[186 ],并且不易受噪音影響[ 189 ]。我等人。[ 173 ]提出了一種基于停車線的 SLAM 方法,該方法提取和分析停車線特征,以實現停車區的快速閉環和準確定位。Javanmardi 等人。[ 190 ] 生成了一張城市道路地圖,其中包含 2D 線和 3D 平面,以表示道路沿線的建筑物和地面。然而,對于自動駕駛來說,應用環境是多變的。特定的基于地標的算法可能不適用于其他駕駛場景。此外,在一些農村地區,道路可能未鋪砌,也沒有道路車道標記。因此,由于缺乏道路標記和不規則的道路曲線幾何形狀,相關的基于特征的地圖方法可能不可行 [191].
拓撲圖表示具有一系列節點和邊的環境。節點表示重要的對象,如拐角、交叉點和特征點;而邊表示它們之間的拓撲關系 [ 192 , 193 ]。一種典型的拓撲圖是 OpenStreetMAP (OSM) [ 194 ],它包含要素的坐標以及道路方向、車道數等道路屬性。這種地圖顯著降低了存儲和計算要求。然而,它丟失了一些關于實際環境的性質和結構的有用信息 [ 184 ]。因此,一些方法將拓撲圖與其他類型的圖結合起來。Bernuy 和 Ruiz-del-Solar [ 195] 提出使用基于語義信息的拓撲圖為自動駕駛汽車和 ADAS 系統的大規模室外場景提供穩健高效的建圖和定位解決方案。根據 Bernuy 和 Ruiz-del-Solar [ 195 ] 的研究,基于圖的拓撲語義建圖方法適用于高速公路、鄉村道路和城市地區的大規模駕駛任務,與度量地圖相比計算量更少。本德爾等。[ 196 ] 介紹了一個非常詳細的地圖,Lanelets,它結合了幾何和拓撲表示,并包括有關交通法規和速度限制的信息。
語義地圖在自主領域變得越來越重要,因為它包含語義信息,可以讓機器人或車輛更好地理解環境,并完成更高級別的任務,例如人機交互。對于戶外應用,標記對象可以是統計背景(例如,“建筑物”、“樹”、“交通標志”)或動態實體(例如,“車輛”、“行人”)。因此,這種地圖可以促進自動駕駛車輛的復雜任務,例如規劃和導航 [ 195、197 ]。將語義概念與幾何實體相關聯已成為一個熱門的研究課題,并且已經研究了結合幾何和語義信息的語義 SLAM 方法 [ 139 , 143, 149 ]。語義 SLAM 方法有助于使定位和建圖更加穩健 [ 174 ],支持在重訪區域進行重新定位 [ 143 ],非常重要的是,有助于跟蹤在動態環境中檢測到的移動物體[ 149、151、198 ] 。語義地圖生成和利用面臨的一個關鍵問題是其中的一些模塊,例如語義分割,對計算要求很高,這使得它們不適合實時應用[199],特別是對于大規模的戶外場景。因此,一些研究試圖解決這個問題。羅斯等人。[ 199] 提出了一種離線在線策略,可以在不犧牲準確性的情況下離線生成密集的 3D 語義地圖。之后,可以通過將當前視圖與 3D 地圖進行匹配來進行實時自定位,并相應地檢索相關的幾何和語義。同時,可以在線檢測新的動態物體,支持瞬時運動規劃。隨著深度學習的出現,語義分割和語義 SLAM 的效率和可靠性得到了極大的提高 [ 147 , 200 , 201 , 202 , 203]. 然而,如前所述,在將基于深度學習的語義 SLAM 應用于自動駕駛時,仍然存在一些挑戰,例如需要大量的訓練數據,或者缺乏需要無監督學習方法的 ground truth。
不同的地圖表示對于支持在具有挑戰性和復雜的道路環境中運行的高度自動化車輛至關重要。因此,越來越多地采用包含不同數據層的詳細數字地圖,例如高清地圖。除了最基本的 3D 點云地圖圖層外,高清地圖還可能包含具有道路拓撲、幾何形狀、占用率、車道特征、道路設施、道路規則、實時知識等信息的圖層。在不損失準確性的情況下存儲、更新和利用如此密集的數據是一項挑戰。一些研究人員提出了“道路 DNA”的概念來表示道路環境并處理大數據問題 [ 12 , 204]. Road DNA 在不丟失細節的情況下將 3D 點云道路模式轉換為壓縮的 2D 道路視圖 [ 12 ],目的是降低處理要求。
4.3. 估計偏差問題
SLAM估計漂移可能是由累積線性化誤差、動態障礙物的存在、噪聲傳感器數據、錯誤的數據關聯等引起的。
在大多數 SLAM 算法中,非線性模型用于表示車輛運動模式和環境。由于線性化誤差的累積,EKF SLAM 存在發散問題。當使用遠離真實值的狀態變量值執行線性化時,可能會出現偏差。對于基于優化的 SLAM,變量的初始猜測不佳將導致收斂性能不佳。旋轉可能是非線性的原因,對估計的發散有很大影響[ 205,206 ],因此累積的車輛方向誤差將導致 SLAM 問題的不一致性。線性化挑戰的一種解決方案是 [ 205]中提出的線性 SLAM 算法],修改相對狀態向量,進行“map joining”。子圖連接涉及解決線性最小二乘問題和執行非線性坐標變換,不需要初始猜測或迭代。在 [ 207 ]的工作中,提出了一種以機器人為中心的局部地圖排序方法,該方法可以限制每個局部地圖內的位置不確定性,并通過傳感器不確定性水平約束提高線性化精度。已經提出了經典 EKF-SLAM 的許多變體來克服濾波器的發散。[ 208 ]的研究表明,Unscented SLAM可以提高大規模戶外應用的在線一致性。黃等。[ 209] 為 EKF-SLAM 提出了兩種替代方案,Observability Constrained EKF 和 First-Estimates Jacobian EKF,兩者在準確性和一致性方面都明顯優于 EKF。[ 210 ]中引入了線性時變(LTV)卡爾曼濾波,它通過創建虛擬測量來避免線性化誤差。一些主要基于 PF 的非參數方法,如 fastSLAM [ 28]、Unscented fastSLAM [211、212、213、214 ],表現出比EKF-SLAM 更好的性能。
對于基于非線性優化的 SLAM 方法,計算一個好的初始猜測(解決初始化問題)將導致更快的收斂并降低收斂到局部最小值的風險。奧爾森等人。[ 215 ] 提出了一種使用隨機梯度下降 (SGD) 變體優化位姿圖的快速迭代算法,該算法對局部最小值具有魯棒性,即使初始猜測不佳也能快速收斂。然后在 [ 50],提出了 Olson 算法的擴展,該算法對圖中的節點使用基于樹的參數化。該算法被證明比 Olson 的算法更有效,并且對初始配置更穩健。二維位姿圖的近似解,稱為位姿圖優化的線性近似 (LAGO),可用作精確解或用于引導非線性技術[ 216、217 ]]. 該方法首先解決線性估計問題以獲得次優方向估計,然后用它來估計全局參考系中的相對位置測量。最后,通過求解另一個線性估計問題得到位姿解。然后可以將此解決方案視為高斯-牛頓迭代的初始猜測。這種方法可以提供一個很好的初始猜測,但是,它僅限于 2D 位姿圖,并且對噪聲測量敏感。在[ 218]中提出了一種具有更復雜初始化的算法],它使用 M 估計器,特別是 Cauchy 函數,作為引導技術。類似于使用 M 估計器使估計對異常值具有魯棒性的方法,M 估計器被證明對錯誤的初始猜測也具有魯棒性。與 LAGO 和 TORO 相比,這種方法可以應用于 2D 和 3D 的不同 SLAM 變體(姿勢圖和基于特征的)[218 ]??〉热?。[ 219 ]調查了不同的 3D 旋轉估計技術,并證明了良好的旋轉估計對引導迭代位姿圖求解器的重要性。最近的研究提出了一種稱為多祖先空間近似樹 (MASAT) 的啟發式方法,它具有低復雜性和計算效率,無需初步優化步驟 [220 ]]. 此方法仍然適用于位姿圖。其他研究試圖通過引入慣性測量來支持初始化 [ 221、222 ] 或進行參數校準 [ 223、224、225 ]來獲得良好的初始猜測。
行人、自行車、其他車輛等動態物體可能會導致估計漂移,因為系統可能會將它們錯誤地識別為靜態道路實體。有一些方法可以避免這種情況。[ 226 ]中已經提出了使用概率紅外強度值的概率圖。在這項研究中,GNSS/INS 和 64 光束激光雷達傳感器相結合,以在動態環境中實現 9 cm 的穩健位置 RMS 誤差。然而,該系統具有高成本和高計算負擔。3D對象跟蹤器[ 227 ]可用于在視覺SLAM方法中跟蹤移動對象。[ 228]中提出的另一種算法] 使用 Canny 的邊緣檢測器在樹干的垂直方向上找到優勢邊緣,并選擇這些樹干作為典型的顯著特征。越來越多地研究深度學習方法來處理上述動態環境[ 148、149、150、151、166、198 ] 。
漂移的另一個來源是傳感器觀測值中的異常值。每個傳感器都有自己的誤差源。例如,在相機的情況下,由于高速和光線條件差而導致的模糊圖像可能導致地標的錯誤識別。激光雷達傳感器對天氣條件(如降雨)和道路環境的大變化非常敏感。GNSS 可能會受到信號阻塞。FDI(故障檢測和隔離系統)技術可用于檢測測量異常值并拒絕這些異常值對定位和定位的影響 [ 229 ]。
上述 SLAM 誤差源也可能導致不正確的數據關聯,這是將測量值關聯到特定地標的重要過程。錯誤的數據關聯不僅可能是由于傳感器數據的噪聲、不一致性、動態物體的錯誤檢測等,還可能是由于某些特定的道路環境。例如,高速公路環境有時在視覺上是重復的并且包含許多相似的特征,這使得很難識別以前探索過的區域。
一些研究人員通過使用 RANSAC [ 230 ]直接在 SLAM 的前端步驟避免了錯誤數據關聯的挑戰,RANSAC通常用于視覺 SLAM 以拒絕異常值。在 [ 231 ] 中,作者提出了一個中間層,稱為 Graph-Tinker (GTK),它可以檢測和刪除誤報閉環。當使用 Extended Rauch–Tung–Striebel smoother 框架時,人工閉環然后被注入到位姿圖中。
數據關聯挑戰也可以在后端步驟解決,因為仍然有可能無法完全消除異常值??汕袚Q約束(SC)的概念在[ 232 ]中被引入,這樣一個可切換變量被引入到每個閉環約束中。一旦約束被視為異常值,就可以在優化期間將其關閉。在[ 233 ]中,作者介紹了一種稱為實現、反轉和恢復(RRR)的算法,這是一種基于一致性的閉環驗證方法。最近,Carlone 等人。[ 234 ]使用?1_relaxation來選擇“可靠”測量,Carlone和Calafiore[ 235] 使用凸松弛來解決非凸問題,而不需要對未知姿勢進行初始猜測。表 2總結了 SLAM 漂移的潛在原因和相應的建議解決方案。
表 2. SLAM 漂移的潛在原因和解決方案。
4.4. 缺乏質量控制
SLAM 算法的定量評估是另一個重要的挑戰。有一些評估 SLAM 算法的標準,例如它們的準確性、可擴展性、可用性、恢復性(即在大比例地圖內定位車輛的能力)和可更新性。對 SLAM 算法的性能進行定量分析是必不可少的,因為它們可以提供數值評估和比較不同 SLAM 算法的基礎。
估計精度是一種廣泛使用的質量分析指標,但在自動駕駛實踐中可能很困難。大多數方法通過使用例如精確地圖將結果與地面實況進行比較來評估 SLAM 算法的性能。然而,很少有合適的地面實況圖。有時,估計的地圖是通過將其疊加到平面圖上并搜索差異來評估的[ 238 ],這對于戶外應用來說更難,需要人工干預[ 239 ]。Sturm 等人提出了兩種流行的精度指標,即相對位姿誤差 (RPE) 和絕對軌跡誤差 (ATE)。[ 240] 它通過將估計的相機運動與真實軌跡進行比較來評估視覺 SLAM 系統,而不是進行復雜的地圖比較。RPE 測量固定時間間隔內軌跡的局部精度,而 ATE 比較估計軌跡和地面真實軌跡之間的絕對距離,從而估計全局一致性。這兩條軌跡應首先使用 Horn 方法 [ 240 ]對齊。根據 [ 240],RPE同時考慮平移誤差和旋轉誤差,而ATE只考慮平移誤差。這些指標已被 SLAM 社區廣泛用于評估和比較不同的 SLAM 方法。然而,與地圖類似,車輛軌跡在實際路面上的精確位置可能并不總是可用的。在[ 239 ]中,作者提出了一個框架,通過測量修正軌跡的誤差來分析 SLAM 的準確性。車輛姿態的均方根誤差(RMSE)通常用于指示SLAM軌跡估計結果的準確性。另一種廣泛使用的質量分析方法是卡方 (χ 2 ) 檢驗。根據 [ 241 ],χ 2test 是一種統計測試,用于量化為地標測量和里程計誤差提供的協方差矩陣的質量。當最小的 χ2誤差幾乎等于測量向量的維數與狀態向量的大小之差時,該測量將被認為具有良好的質量[ 241 ]。
一些研究人員 [ 242、243、244 ]已經考慮了他們的 SLAM算法的一致性。根據[ 242 ],SLAM不一致的主要原因是由不正確的里程計模型和SLAM非線性函數的不準確線性化引起的累積誤差。當估計誤差超出不確定性時,可以認為估計結果不一致。EKF-SLAM 會遇到這樣的不一致問題,除非圍繞真實系統狀態評估觀察/里程計函數的雅可比矩陣。在 [ 30 ] 和 [ 245],使用度量指標歸一化估計誤差平方(NEES)定量確定了fastSLAM和EKF-SLAM算法的一致性。在[ 246 ]中,分析了濾波器錯誤狀態模型的可觀測性,以研究 EKF-SLAM 不一致的根本原因。在 [ 247 ]的工作中,通過對測量殘差的加權和應用χ2檢驗來檢查增量圖 SLAM 的一致性。是否可以容忍不一致最終取決于SLAM結果的應用[ 19 ]。
還應檢查定位、制圖和導航系統輸出的可靠性。然而,很少有研究對SLAM的可靠性進行定量分析。其他定位系統(如 GNSS、GNSS/INS)的一些可靠性研究可以作為指導 SLAM 社區的參考。系統可靠性可以被認為具有兩個組成部分:內部可靠性和外部可靠性。前者確定系統檢測故障的能力,該能力由最小可檢測偏差 (MDB) 量化,并由可檢測故障的下限表示。后者估計未檢測到的故障對最終解決方案的影響 [ 175 , 248 , 249 , 250 , 251]. MDB 值越低,系統越可靠。同樣,SLAM系統特征觀測模型和車輛運動模型的可靠性也可以通過這些方法進行評估。
完整性非常重要,因為它是本地化系統提供的信息“可信度”的指標,可以及時警告不準確造成的風險 [252 ]。完整性度量用于量化本地化安全的要求。該概念首先在航空領域確立,也適用于陸地車輛定位[ 253]. 由于自動駕駛對安全性的嚴格要求,自動駕駛研究者對完整性的關注度越來越高。自動駕駛汽車的定位和導航是基于多個傳感器的使用,因此傳統的 GNSS 完整性分析方法應該得到擴展。故障檢測和隔離 (FDI) 是最流行的基于 GNSS定位的警報生成方法之一 [ 229、254、255、256 ]。
5. 基于激光雷達/GNSS/INS 的測繪和定位:案例研究
基于激光雷達的同步定位和建圖 (SLAM) 技術方法在機器人領域得到廣泛研究和應用,因為激光雷達可以生成非常密集的 3D 點云,具有快速傳感速率和高精度。通常 SLAM 系統會經歷隨著行進距離增加而增加的估計誤差,因此需要“閉環”來糾正誤差。然而,在一些大規模的自動駕駛戶外應用中,例如在高速公路上行駛,或者在城市地區進行復雜的軌跡行駛,閉環是很難實現的。此外,僅限激光雷達的 SLAM 將僅提供相對定位信息。因此,GNSS/INS與激光雷達SLAM的結合將有效降低對閉環的依賴,提供絕對定位信息。
此外,當 GNSS 信號不可用時,激光雷達系統還可以支持使用現有的高清地圖進行定位。此處測試了結合激光雷達、GNSS 和 INS 的現代化 SLAM 程序。該程序包含兩部分:基于激光雷達/GNSS/INS 的離線測繪部分,以及基于激光雷達/高清地圖的在線定位和測繪部分。
5.1. 實驗設置
在澳大利亞悉尼的一些市區進行了陸地車輛測試,以測試擬議的 Lidar/GNSS/INS 多傳感器系統。該車輛配備了一個 VLP-16 LiDAR 傳感器、一個戰術級 IMU 傳感器和兩個來自美國加利福尼亞州圣何塞的 PolyExplore, Inc. 的 GNSS 天線(圖 5 )。第二根天線可用于為在線定位系統提供雙天線輔助航向更新。激光雷達的采樣率為 10Hz,GNSS 的采樣率為 1Hz,IMU 為 100Hz。
圖 5.實驗平臺:(a) 多傳感器系統,(b) 安裝在車輛內的系統側視圖。
路試軌跡如圖6a所示。車輛從位于肯辛頓的新南威爾士大學(UNSW)校園開往La Perouse(Section A),然后返回UNSW(Section B)。在本研究中,前向旅程(從 UNSW 到 La Perouse)用于生成道路的高精度 3D 點云地圖,而后向旅程(從 La Perouse 到 UNSW)用于測試激光雷達/基于3D點云地圖的定位方法。
圖 6.(a) 谷歌地圖上的道路測試軌跡(藍色);(b) 局部坐標系中具有 RTK 定位狀態的整個軌跡的 GNSS/INS 定位。
為了對定位性能進行定量分析,選擇了軌跡的三個部分(圖 6 b)。對于行駛軌跡上的每個選定路段,前向行程和后向行程的 GNSS-RTK 狀態均為“整數模糊固定”。因此,離線建圖結果預計在 5 厘米左右的水平上是準確的。對于回程(從 La Perouse 到 UNSW),所選路段將有準確的 GNSS/INS 定位結果作為參考,以評估基于激光雷達/3D 點云地圖的定位方法的性能。
5.2. 激光雷達/GNSS/INS 制圖
獲取的前進旅程數據集(從 UNSW 到 La Perouse)用于生成道路環境的地理參考點云圖。地理參考地圖是使用激光雷達里程計幀到幀匹配和 GNSS/INS 定位/姿態生成的。圖 7顯示了離線地圖系統架構的概覽。
圖 7.激光雷達/GNSS/INS 測繪系統架構概覽。
GNSS/INS系統可以提供大地定位和姿態信息。由于此地圖生成是離線執行的,因此可以獲得最佳 GNSS/INS 軌跡。GNSS/INS 導出的位置和姿態結果用作逐幀匹配的初始值,以將新合并的點云傳輸到參考幀。這樣,點云就可以進行地理配準。當 GNSS 結果不可用時,慣性導航 6-DOF 姿態結果可用于在重新獲取 GNSS 信號之前生成初始轉換。在進行激光雷達測距時,使用正態分布變換 (NDT) 掃描匹配算法將每個當前幀與前一幀進行匹配,初始變換信息由 GNSS/INS 提供。圖8),匹配前通過無損檢測提高配準精度。
圖 8.激光雷達掃描框架的掃描視圖 (a) 原始掃描視圖;(b) 預處理后的視圖。
圖 9顯示了匹配前的兩個掃描視圖??雌饋磉@兩個掃描視圖在特征上略有不同。可以生成來自兩個掃描視圖的匹配點云(圖 10)。
**圖 9.**用于掃描匹配 的兩個有序激光雷達掃描幀((a) 先前掃描幀;(b ) 當前掃描幀)的掃描視圖。
圖 10.匹配兩個排序的激光雷達掃描幀后生成的地圖點云。
通過對所有可用的激光雷達掃描依次進行激光雷達測距,可以將新匹配的點云與先前生成的點云地圖合并,可以獲得整個軌跡的累積地圖并進行地理配準,如圖 11所示。
圖 11.從 UNSW 到 La Perouse 的全球地理參考路線圖(框架:ECEF,單位:米)來自基于 3D 點云的地圖。
通過放大圖 11,可以看到道路地圖的細節,并且可以將其對應的真實世界道路視圖與 Google Earth 圖像進行比較(因為該地圖是地理參考的)。圖 12顯示了此生成地圖的一個放大部分與 Google Earth 中相應視圖的比較。
圖 12. (a) 生成的地圖和 (b) 同一位置的 Google 地球視圖 的一部分。
這張生成的地圖很好地展示了道路環境的結構,包括道路邊緣、建筑物、樹木和沿路停放的車輛。
三個坐標已知的控制點位于 UNSW Scientia Lawn 周圍。這些控制點可用于評估生成的點云的準確性。通過將地圖內已識別控制點的坐標與實際已知位置進行比較,發現 X、Y 和 Z 軸上的差異約為 2-8 厘米。因此,離線生成的地圖精度被認為是5厘米。
5.3. 使用激光雷達掃描和 GeoReferenced 3D 點云地圖匹配進行定位
根據 A 部分(從 UNSW 到 La Perouse 的前向旅程)的數據生成的地理參考 3D 點云地圖可以用于支持 B 部分(從 La Perouse 到 UNSW 的后向旅程)的基于激光雷達的定位,方法是匹配激光雷達掃描到地圖?;谠诰€激光雷達/3D 地圖匹配的定位方法的過程如圖 13所示. INS 用于支持基于激光雷達/3D 地圖的在線定位。為了顯示不同融合級別的性能,研究了兩種融合方法。第一種方法簡單地利用 IMU 作為輔助傳感器,直接使用 INS 解決方案作為掃描/地圖匹配的初始信息。第二種融合方法是一種緊耦合方法,它不僅使用 INS 解決方案來支持匹配,而且還包含一個基于 EKF 的錯誤狀態更新步驟,可增強慣性導航性能。
圖 13.擬議的基于激光雷達/3D 地圖匹配的定位系統架構概述。(a) 方法一:融合IMU作為輔助傳感器;(b) 方法 2:使用基于 EKF 的緊耦合方法融合 IMU。
方法2由兩部分組成:掃描匹配和EKF融合。首先,如果慣性導航信息不可用,可以使用幀到幀激光雷達里程計來支持定位。在初始化錯誤狀態 EKF 后,慣性導航估計的位姿將為當前激光雷達掃描幀提供一個粗略的位姿,并且可以關閉激光雷達里程計以降低計算負荷。利用INS提供的粗略位置,從預先生成的全局地圖中搜索選擇局部地圖,提高匹配效率。當前激光雷達框架和本地地圖之間基于無損檢測的掃描匹配是通過基于慣性的初始變換矩陣進行的。可以獲得激光雷達估計的車輛姿態。如果需要,還可以生成新的實時路線圖。
得到激光雷達位姿后,可以得到激光雷達位姿與慣性傳播位姿的差值,通過誤差狀態EKF估計慣性導航信息內的誤差,然后反饋給慣性系統,改進位姿結果和偏差估計。當有 GNSS 信息時,如 RTK 定位結果,也可用于修正慣性導航信息,以提高定位系統的準確性和可靠性。
對于激光雷達、INS 和GNSS的數據融合,當前的一些工作提出使用基于圖優化的方法來生成最優定位和建圖解決方案[ 179、257、258、259]. 然而,其中一些經過后處理或高度依賴 GNSS 數據來減輕導航漂移,甚至忽略 IMU 偏差。由于對于我們基于在線激光雷達/地圖匹配的定位方法,可靠的慣性導航解決方案對于為掃描/地圖匹配過程提供良好的初始化以及提高本地地圖搜索和選擇的效率和準確性至關重要,及時的 IMU偏差校正至關重要,使用 EKF 更容易實現。由于我們的測試是在 GNSS 信號經常丟失的市區進行的,因此對 IMU 狀態的反饋也應取決于激光雷達數據,尤其是在 GNSS 中斷期間。此外,估計不確定性是分析系統解決方案的重要參數,很少在基于圖的方法中估計,但可以通過 EKF 方法直接估計。因此,在我們當前的方法 2 中,EKF 方法用于融合激光雷達/地圖定位、GNSS 和慣性導航結果。方法 1 和方法 2 的比較還突出了將 IMU 傳感器用作單獨的輔助傳感器和用作緊密耦合的輔助傳感器之間的區別。
5.3.1. 激光雷達/3D 地圖定位系統的估計結果
由于本次城市道路測試沒有地面實況信息,因此將基于激光雷達/地圖匹配的解決方案與三個選定軌跡段內的 GNSS/INS 解決方案進行比較(圖 14),在此期間 RTK 狀態為“模糊固定” ”(圖 6b)。
圖 14.所提出的基于激光雷達/地圖匹配的定位方法與參考 GNSS/INS 定位方法在三個軌跡部分的坐標差異。(a) 方法一:融合IMU作為輔助傳感器;(b) 方法 2:使用基于 EKF 的緊耦合方法融合 IMU。紅色和綠色框表示具有不同時間戳的坐標差異較大的時代。
表 3顯示了基于激光雷達/地圖匹配的定位與參考 GNSS/INS 定位結果之間的比較。對于方法一,結果差異在零附近波動,它們的平均值在厘米到分米級別。所有三個部分的標準偏差都在 0.1-0.2 m 左右,因此我們將大于 0.6 m 的坐標差異視為可能的異常值。具有異常值的 epoch 約占總測試數據的 1.7%,這意味著異常值的存在很少見。異常值的可能原因將在下一節中討論。對于方法 2,結果具有更好的準確性。標準偏差在0.05 m左右,遠低于方法1。從圖14可以看出,在方法 1 顯示可能的異常值期間,方法 2 與參考值的差異較小,這表明緊耦合方法對異常值的魯棒性比簡單地使用 INS 解決方案進行初始化要強。
表 3.對于圖 14 中的軌跡部分 1、2 和 3,基于激光雷達/地圖匹配的定位與參考 GNSS/INS 定位結果之間差異的平均值和標準偏差。(a) 方法一:融合IMU作為輔助傳感器;(b) 方法 2:使用基于 EKF 的緊耦合方法融合 IMU。
5.3.2. 數值結果的質量分析
檢查具有大跳躍的時期(例如圖 14中的“紅色和綠色框”期間)的測量細節,以調查檢測到的異常值的可能原因。對于圖 14中的 Trajectory Section 1 (紅框),通過方法 1 發現在繞環島行駛時,存在一些較大的異常值。Lidar/map 系統和 GNSS/INS 解決方案圍繞該環島的軌跡及其Google 地圖中的視圖如圖 15所示。可以看出,GNSS/INS 解決方案(圖 15黃線)在該區域更平滑,因為 GNSS 整數模糊度是“固定的”,而如果僅使用 IMU 作為簡單助手,激光雷達/地圖解決方案與參考軌跡有一些差異(方法 1,圖 15 藍線)。
圖 15.基于激光雷達/地圖匹配的定位方法 1(藍色)、方法 2(紅色)和 GNSS/INS 定位(黃色)的軌跡:(a) Google 地圖中的視圖;(b) 在環島周圍的局部坐標系中查看。
圖 16顯示了該環島的地圖視圖??梢钥闯?,道路駕駛側的預生成地圖結構不是很清晰,因為它缺少軌跡周圍的特征?;匦幬挥诼糜尉包c的停車場。該地區周圍沒有建筑物,樹木也很少。由于測試是在晚上進行的,因此可以用作特征的停放車輛并不多。因此,匹配步驟的質量可能較差,從而導致定位精度下降。
圖 16. (a) 生成的地圖和 (b) 環島周圍相同位置的 Google Earth 視圖 的一部分。
圖 17顯示了此時距離閾值為 20 m 的激光雷達掃描視圖,可以看出該激光雷達掃描沒有太多可用的特征,尤其是在預處理之后。當軌跡部分 1(綠色框)中出現另一組異常值時,可以找到具有較少特征的類似道路環境,如圖14所示。在這種情況下,擴展范圍閾值可以通過包含更多特征來提高準確性,但是,它會增加計算負擔并受到更多異常源的影響。通過更緊密地融合 IMU 來合并慣性運動模型可能會使定位系統對這種無特征的條件更加穩?。▓D 15紅線)。
圖 17.環島周圍軌跡部分 1 中具有大異常值的紀元 40,647 s 的掃描幀((a) 原始掃描視圖;(b) 預處理后的視圖)。
異常值的另一個主要來源是主車輛周圍的其他移動實體。圖 18、圖 19和圖 20顯示了在定位階段存在較大異常值時的激光雷達視圖。
圖 18.軌跡部分 2 中具有大異常值的歷元 40,854 s 的掃描幀:后面的車輛正在駛向另一條道路,(a) 激光雷達掃描;(b) 谷歌地球視圖。
圖 19.軌跡部分 2 中具有大異常值的歷元 40,888 s 的掃描幀,檢測到對向駕駛車輛,(a) 激光雷達掃描;(b) 谷歌地球視圖。
圖 20.軌跡第 3 節中具有大離群值的歷元 41,103 s 的掃描幀,一輛高大的公共汽車駛過 (a) 激光雷達掃描;(b) 谷歌地球視圖。
無論其他移動車輛是在道路的同一側還是在道路的另一側,這樣的移動車輛都會影響基于激光雷達/地圖匹配的定位的質量。當移動車輛與本車在道路同一側時,最初檢測到或與本車速度不同,或轉彎行駛到另一條道路時,都會導致錯誤估計。這將使該車輛不再被檢測到(圖 14軌跡部分 2 和圖 18中的紅色框)。
一旦宿主車輛檢測到對面行駛的車輛,定位估計誤差可能達到 1-1.5 m(圖 14軌跡部分 2 和圖 19中的綠色框)。
移動元素的類型也會影響異常值的存在。大多數時候,垂直位置估計受移動元素的影響較小。但是,勾選Trajectory Section 3(圖14 )中的紅框,可以發現垂直方向的差異遠高于其他部分。通過查看激光雷達視圖的細節,發現在那個路段,一輛高大的公共汽車從主車輛旁邊駛過(圖 20 ),這意味著當前激光雷達掃描和預先生成的地圖之間的垂直差異可能導致一些系統的垂直偏差。
道路環境中的移動物體將是測量異常值的主要來源,因為系統將預先生成的地圖視為固定參考地圖。因此,如果有任何移動物體導致預生成地圖和當前掃描幀的結構不同,就會出現異常值。移動物體,例如其他車輛,可能存在于先前的道路測繪階段和當前的道路掃描中以用于定位。對于離線高清地圖生成步驟,應仔細識別并從靜態 3D 點云地圖中刪除此類移動對象。對于在線步驟,可以基于清潔的預生成地圖來識別和刪除移動對象,或者直接使用傳感器數據實現語義分割。166 ] 可以區分基于 CNN 的運動和靜止物體。因此,可以去除可能檢測到的移動物體,或者可以將可能的道路環境變化更新到全局地圖中,以提高未來在同一道路路徑上行駛的準確性。這些方法可以在感知步驟中進行。一些數值質量控制方法的幫助也可能有助于在定位和建圖步驟中完成這項任務,例如 FDI 方法,或離群點檢測和識別方法,它可以直接估計和減輕來自各種資源的離群點的影響,不僅是移動異常值,還有其他傳感器或模型故障。
一些FDI方法或完整性監測方法[ 255 , 256 ]已經成功應用于EKF框架下的GNSS/INS集成系統。由于在本案例研究中,EKF 方法用于融合激光雷達/地圖定位結果和 INS 姿勢以生成高頻精確姿勢解決方案,因此這些質量控制方法也表明了該定位系統的潛力。這將是未來的研究課題。
6、結論
本文簡要回顧了不同的 SLAM 方法及其特點。SLAM 已成為自動駕駛中定位、建圖、規劃和控制的關鍵方法。它顯示了在為自動駕駛和道路環境中的車輛定位生成高分辨率地圖方面取得了可喜的進展。已經確定了不同 SLAM 技術的優點和缺點,并討論了它們在自動駕駛中的應用。
定位和導航算法的可信度是自動駕駛的一個重要問題。有許多挑戰限制了 SLAM 技術的性能,從而影響定位和導航結果的安全性。本綜述中提到了這些具有挑戰性的問題和可能的解決方案。此外,為了確保安全性,應從準確性、一致性、精確性、可靠性和完整性等方面對算法的性能進行定量評估。簡要討論了評估這些質量的方法。
進行了真實世界的道路測試,以演示 SLAM 在具有多傳感器集成的自動駕駛中的應用。數值結果表明,GNSS/INS 輔助激光雷達系統可以生成地理參考高密度點云地圖。這張預先生成的地圖可以用來支持在線定位,已經達到了厘米級的精度。這種基于激光雷達/地圖匹配的定位方法也可用于在 GNSS 信號不可用期間支持自動駕駛系統,這使其適用于市區駕駛。IMU 測量值的更緊密耦合融合將使基于激光雷達/地圖的定位比簡單地利用慣性解決方案作為輔助信息更準確和對異常值更穩健。
未來的研究應該集中在如何檢測移動實體并減輕它們在 3D 點云建圖和定位過程中的影響。此外,應研究此類基于激光雷達/GNSS/INS 的車輛定位和繪圖系統的完整性監控程序。
-
SLAM
+關注
關注
23文章
425瀏覽量
31860 -
激光雷達
+關注
關注
968文章
3984瀏覽量
190054 -
自動駕駛
+關注
關注
784文章
13845瀏覽量
166574
原文標題:用于自動駕駛的同步定位和建圖 (SLAM):概念和分析
文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論