目前,機械旋轉激光雷達的高成本是一個限制因素,但是隨著基于 MEMS 的反射鏡、光學相控陣等新技術的出現,價格正在下降。近期禾賽、Ouster、Innoviz 紛紛推出高性能雷達。
本文介紹了最新的汽車激光雷達技術和與這些技術一起使用的感知算法。首先分析了激光雷達系統的主要組成部分,從激光發射機到光束掃描機構。比較了各種解決方案的優缺點和現狀。對于激光雷達的數據處理,回顧了模型驅動方法和新興的深度學習解決方案。最后,對汽車激光雷達和感知系統的局限性、挑戰和發展趨勢做了分析。
據悉近日,Hesai 發布了新的 32 通道(也提供 16 通道版本)中檔激光雷達。PandarXT 基于整合了 Hesai 自主開發的 LiDAR ASIC 的新系統架構,是一種經濟高效的解決方案,專為多種應用而設計,包括無人物流,機器人,測量,安全,制圖和中低速自動駕駛。
基于 Hesai 自主開發的 LiDAR ASIC 的新系統架構提供了額外的性能增強。PandarXT 的最小范圍為零,即使物體直接觸摸傳感器的外殼,它也會輸出有效的點云。它還具有毫米級的測距精度和卓越的精度。此外,其提高的反射率精度和更大的動態范圍使得能夠準確,一致地檢測回射器,低反射率目標以及反射率突然變化的物體邊界。
而成立不到五年的以色列創業公司 Innoviz 已經擁有一個稱為 InnovizOne 的汽車級傳感器,該傳感器將于 2021 年在 BMW 上首次批量生產,他們縮小了設計規模,以保持與原始系統相似或更好的性能。
與 InnovizOne 一樣,InnovizTwo 傳感器具有 256 行垂直分辨率和 0.1 度角分辨率。封裝尺寸小于電流傳感器。對于具有 10%反射率的目標,檢測范圍預計將超過 200 m,其聲稱新型激光雷達傳感器便宜 70%,計劃在 2021 年第三季度開始向客戶交付樣品,并有望在 2023 年秋季為批量生產應用做好準備。
在自主駕駛的環境中,激光雷達是一種主動傳感器,通過發射激光照亮周圍環境。通過處理從反射面接收到的激光回波,可以精確測量距離。另一方面,基于激光雷達的算法也進入了快車道。對于自主車輛,激光雷達主要用于感知和定位。感知系統提供了一種機器可解釋的車輛周圍環境的表示。
從用戶的角度來看,感知系統的輸出包括三個層次的信息:
?物理描述:姿勢、速度、物體形狀。
?語義描述:對象的類別。
?意圖預測:物體行為的可能性。
因此,激光雷達的輸出用于目標檢測、分類、跟蹤和意圖預測,對應于各個層次的信息。由于激光雷達在測距精度上的優越性,所提供的物理信息具有很高的可靠性。而激光雷達所攜帶的語義信息要比攝像機獲得的要少,甚至更難。
在實際應用中,激光雷達和攝像機是相輔相成的:攝像機的距離估計能力差,而激光雷達對目標的識別效果不理想。精確的物理和語義信息,加上地圖信息,將毫無疑問地提高意向預測。經過多年的發展,以激光雷達為中心的感知系統對于基于模型的處理算法已經趨于成熟。深度學習(DL)正在改變這個領域的學習方法。傳統的基于模型的激光雷達數據處理方法具有計算友好、可解釋性強等特點。而數據驅動的 DL 方法在提供語義信息方面表現出了超常的能力,這是傳統方法的弱點。
圖 1:Groupe RENAULT 為 EVAPS 項目開發的自主車原型。
最明顯的傳感器是上面的 Velodyne UltraPuck 激光雷達。
1. 激光雷達技術原理和現狀分析
典型的激光雷達是用一束或幾束激光掃描其視場。通過這一系統,設計了精密的光束控制系統。激光束是由一個振幅調制的半導體激光器產生的,它在近紅外波段發射。激光束被環境反射回掃描儀,光電探測器接收返回信號。
快速電子過濾信號,并測量發送和接收信號之間的差,與距離成正比。基于此差異,從傳感器模型中估計距離。通過信號處理,補償了由表面材料引起的反射能量變化的差異以及發射器和接收器之間的環境狀態。
激光雷達輸出包括與掃描環境相對應的三維點云和與反射激光能量相對應的強度。圖 2 顯示了這個工作原理的概念表示。
圖 2:ToF 激光測距儀的一個例子。測距儀采用直接法或相干法測量由掃描系統控制的某一方向的距離。
激光雷達系統可以分為:激光測距系統和掃描系統。激光測距儀包括通過調制波照亮目標的激光發射器;通過光學處理和光電轉換后從反射光子產生電子信號的光電探測器;將發射的激光準直并將反射信號聚焦到光電探測器和信號處理電子設備,根據接收到的信號估計激光源和反射面之間的距離。掃描系統通常會以不同的方位角和垂直角控制激光束,用 i 表示,其中 i 是確定光束指向的方向的索引。
A、 激光測距原理
用激光束測量物體距離的測距儀被稱為激光測距儀。它們的工作方式取決于激光束中使用的信號調制類型。脈沖激光被用來測量飛行時間(ToF),這些被稱為直接探測激光測距儀。激光信號也可以是一種調頻連續波(FMCV),利用多普勒效應間接測量距離和速度。這些被稱為相干探測激光測距儀。
飛行時間(ToF):ToF 激光測距儀通過計算發射和接收激光之間的時差來測量距離:ToF 激光雷達以其結構簡單、信號處理方法簡單等優點,在目前的汽車激光雷達市場上占據主導地位。然而,由于眼睛的安全要求,增加其最大射程的潛力受到有限發射功率的限制。在 ToF 激光雷達中,返回信號可以是來自強太陽光的干擾,也可以是來自其他 ToF 激光雷達的激光束的干擾。
相干檢測:通過將本機載波信號與接收信號混合,可以對接收信號進行解調,從而獲得激光信號的相位和頻移,從而獲得距離反射面的距離和速度。這可以看作是 FMCW(調頻連續波)雷達的光學版本,這是目前流行的乘用車 ADAS 系統。
圖 3:相干探測原理:通過混合發射和接收的光波產生的中頻(紅色跡線)來估計距離。
因為 FMCW 激光雷達連續不斷地使用較少的發射功率來照明物體,從而符合眼睛安全要求,并且可以使用更多的功率來擴大視野。
FMCW 激光雷達可以同時直接測量距離和速度,而對于 ToF 激光雷達,速度是通過幾個連續的傳感器讀數間接估計得到的。通過使用 FMCW 激光信號,可以減少來自其他激光源和強光的干擾效應。然而,FMCW 激光雷達需要具有長相干距離的高質量激光發生器。
B、 激光發射和接收
激光信號的產生和發射以及反射信號的接收電子設備也反映了激光測距儀的性能和成本。
1) 激光源:ToF 激光雷達需要脈沖(調幅)激光信號。這是用脈沖激光二極管或光纖激光器產生的。半導體激光器通過向二極管的結處通電而引起激光振蕩。
半導體激光器可分為兩類:邊緣發射激光器(EEL)和表面發射半導體激光器(VCSEL)。EEL 在電信行業的應用由來已久。VCSEL 輸出圓形光束,而 EEL 發射橢圓激光束,需要額外的光束整形光學元件。
在 VCSEL 中,在單個芯片上形成二維激光陣列比 EEL 更容易,這一點很重要,因為它可以提高激光雷達的分辨率。相比之下,由于功率限制,VCSEL 的范圍更短。汽車用脈沖激光二極管是一種混合型器件。
也就是說,激光芯片上安裝了由 MOSFET 晶體管觸發的電容器。因此,在每次柵極打開時,電容器中積累的電荷將被釋放到芯片中,這將以可控的方式發射光脈沖。這些光源具有成本效益,因為它們的 905nm 輸出可以通過經濟高效的硅探測器檢測。
然而,這些二極管的脈沖重復率有限,峰值功率較低,可能需要冷卻。用于 3DFlash 激光雷達的激光二極管光源采用二極管堆疊技術,將多個邊緣發射棒組裝成一個垂直堆疊。散熱成為一個問題,因此需要散熱片以及累積超過眼睛安全要求的發射功率。
光纖激光器可以有更高的輸出功率,這在工作在高波長時非常有用。它們的輸出光束可以使用光纖進行分割和路由到多個傳感器位置,它們具有更好的脈沖重復頻率、更好的光束質量等。但是,它們可能體積龐大,從而導致難以集成到車輛中的非緊湊系統。
2) 激光波長:選擇合適的激光波長應綜合考慮大氣窗、眼睛安全要求和成本。850-950nm(近紅外)和 1550nm(短波紅外)激光器因其在工業上的廣泛應用而得到了廣泛的應用。無論是價格低廉的二極管激光器,還是波長 850-950nm 或 1550nm 的更強大的光纖激光器,都很容易從市場上買到。
1550nm 激光的眼睛安全標準允許的最大功率高于 850-950nm 的激光,這意味著可以獲得更大的射程。然而,昂貴的 InGaAs 基光電二極管需要探測 1550nm 的激光回波。InGaAs 基光電二極管的效率低于成熟的硅基光電二極管。另外,大氣對 1550nm 的吸收比 850-950nm 強。因此,近紅外波段(例如 905nm)的激光雷達系統仍然是主流。
3) 光電探測器:光電探測器通過光電效應將光功率轉換為電能。光敏感度是描述光電探測器接收光子時的響應的最關鍵特性之一。光敏性取決于接收激光的波長。因此,激光雷達系統中光電探測器的選擇與激光波長的選擇密切相關。最常用的探測器有 PIN 光電二極管、雪崩光電二極管(APD)、單光子雪崩二極管(SPAD)、硅光電倍增管(SiPM)。
PIN 光電二極管:是由 p-i-n 結形成的一個沒有移動電荷載流子的耗盡區。通過對光電二極管施加反向偏置,吸收光子將在反向偏置光電二極管中產生電流。
雪崩光電二極管(APD):是一種通過雪崩效應施加反向電壓來倍增光電流的光電二極管。與 PIN 光電二極管相比,APD 倍增信號的能力降低了噪聲的影響,獲得了更高的內部電流增益(約 100)和信噪比。因此,apd 在當代激光雷達系統中相當普遍。硅基 apd 是敏感的通過可見光譜區直到近紅外約 1000nm。InGaAs 的 apd 波長可長至 1700nm,但成本較高。
單光子雪崩二極管(SPAD):是一種 APD,設計用于在高于擊穿電壓(Geiger 模式)的反向偏壓下工作,允許在非常短的時間內檢測到極少數光子。SPAD 可以獲得 106 的增益,這明顯高于 APD。這一特性使 SPAD 能夠在遠距離探測到極弱的光。此外,可用于 SPAD 制造的 CMOS 技術使得在一個芯片上集成光電二極管陣列。這對于提高激光雷達的分辨率,同時降低成本和功耗是很有必要的。
硅光電倍增管(SiPM):基于 SPAD,同時啟用光子計數。SPAD 工作的 Geiger 模式是一種光子觸發模式,SPAD 無法分辨接收到的光通量的大小。為了克服這個問題,SiPM 集成了一個密集的“微電池”陣列(一對 SPAD 和一個失超電阻),它們工作相同且獨立。SiPM 的輸出本質上是從每個微單元檢測到的光電流的組合。在這種方法中,SiPM 能夠給出關于瞬時光子通量大小的信息。
C、 掃描系統
掃描系統(或光束控制系統)是為了使發射的激光能夠快速探測大面積區域而設計的。現有的掃描方法通常分為機械旋壓或固態掃描。
前者通常包含一個龐大的旋轉鏡系統,如早期自主駕駛史上的 Velodyne HDL64。后來的“固態”指的是沒有運動部件的掃描系統(甚至有些仍然由微鏡控制),這是汽車工業的首選。機械旋轉:目前最流行的汽車激光雷達掃描解決方案是機械旋轉系統,該系統通過由電機控制的旋轉組件(如鏡子、棱鏡等)來控制激光束,從而產生大視場(FoV)。
傳統上,點頭鏡系統和多邊形鏡系統是主要的應用類型。例如,如圖 4(a)所示的機械旋轉方案,嵌入式點頭鏡系統傾斜激光器以產生垂直視場。然后,旋轉激光雷達基座,獲得 360°水平視場。最先進的激光雷達使用多光束來減少移動機構。
圖 4:按掃描方法分類的激光雷達系統。
例如,Velodyne VLP 系列使用激光二極管和光電二極管陣列來增加點云密度。與寬視場相比,機械旋壓系統具有高信噪比(SNR)的優勢。然而,在汽車內部這種復雜的振動環境中,旋轉機構是很常見的。典型的產品示例:Velodyne 的 HDL64 如圖 5(A)所示。
圖 5:激光雷達產品示例:
(a)來自 Velodyne 的機械旋轉 905nm 激光雷達,(b)來自 Luminar 的 1550nm MEMS 激光雷達、(c)大陸公司的 Flash 激光雷達。
MEMS 微掃描:MEMS(Micro-Electro-Mechanical Systems)技術允許使用硅制造技術制造微型機械和機電設備。從本質上講,MEMS 反射鏡是嵌入芯片上的反射鏡。
MEMS 反射鏡通過平衡兩種相反的力來旋轉:
一種是由繞在反射鏡周圍的導電線圈產生的電磁力(Lorentz 力),另一種是來自扭桿的彈性力(作為旋轉軸)。這一原理如圖 4(b)所示。MEMS 反射鏡可以是一維運動的單軸,也可以是二維運動的雙軸。
同時,MEMS 反射鏡可以在其固有振蕩頻率下以諧振模式工作,從而獲得大偏轉角和高工作頻率。在非諧振模式下,可以控制 MEMS 掃描鏡,使其跟隨程序化的掃描軌跡。
例如,對于基于 MEMS 的 AEYE 激光雷達,激光雷達可以動態地改變視場和掃描路徑,以聚焦于某些關鍵部件。雖然 MEMS 激光雷達仍然包含運動部件,但由于 IC 工業中成熟的技術能夠滿足嚴格的成本要求,這種近固態技術仍然具有廣闊的應用前景。Luminar 的 MEMS 1550nm 激光雷達示例如圖 5(b)所示。
Flash:最初用于航天器自主著陸和與衛星對接,3DFlash 激光雷達完全移除掃描系統內的旋轉部件。因此,它們是真正的固態。Flash 激光雷達的行為就像照相機。一種由光學擴散器傳播以同時照亮整個場景的單個激光器。
然后,它使用一個 2D 光電二極管陣列(類似于用于照相機的 CMOS/CCD)來捕捉激光回波,最后對其進行處理以形成 3D 點云,如圖 4(c)所示。由于 Flash 激光雷達的所有像素同時測量距離,避免了平臺運動引起的運動補償問題。此外,基于半導體的 3DFlash 激光雷達有助于大規模生產的制造和封裝,從而降低成本。
然而,3DFlash 激光雷達的一個關鍵問題是它的探測范圍有限(通常小于 100 米),這是因為為了保護眼睛的安全,在一個小功率閾值下,一個擴散激光就負責探測整個區域。另一個缺點是視野有限,因為它不能像掃描式激光雷達那樣旋轉和掃描周圍環境。大陸集團用于中程感知的商用閃光激光雷達產品的典型示例如圖 5 所示
光學相控陣(OPA):作為一種真正的固態激光雷達,光學相控陣(OPA)激光雷達不包含運動部件。與相控陣雷達類似,OPA 能夠引導激光束通過各種類型的相位調制器。
如圖 4(d)所示,當激光通過透鏡時,光速可以通過光學相位調制器改變。因此,不同路徑中的不同光速允許控制光波陣面形狀,從而控制轉向角。雖然 OPA 作為一種很有前途的技術被寄予厚望,但目前市場上還沒有商業化的產品。
D、 汽車激光雷達的現狀
機械旋壓激光雷達是第一個進入量產車階段的產品。2017 年,奧迪發布了最新的豪華轎車 A8,該車配備了 Valeo 的 Scala 激光雷達以實現自動駕駛功能,這是世界上第一款搭載汽車級激光雷達的商用車。
法雷奧的 scala 3 是一種 4 層機械旋轉激光雷達,類似于它的表兄 IBEO Lux4。通過 Scala 的授權,A8 能夠實現 L3 級別的自動駕駛功能,而不需要手放在方向盤上(需要法律允許)。2019 年,法雷奧從多家汽車制造商那里獲得了下一代激光雷達 Scala2 的 5 億訂單。
同時,為了降低成本,提高系統的魯棒性,很多公司都把目光投向了固態掃描系統。
如表一所示, Innoviz、Continental 和 Quanergy 正在分別開發 MEMS、Flash 和 OPA 激光雷達。2018 年,寶馬宣布與 Innoviz 合作在 2021 年進行系列生產。為了增加最大探測距離,一些人使用了工作在單光子探測模式(蓋革模式)下的 SPAD 陣列。
表一:具有代表性的激光雷達制造商和采用的技術。標有*的制造商使用單光子蓋革模式 SPAD 作為光電探測器。
outster OS-1644 采用 CMOS 基 SPAD 檢測 2D VCSEL 激光器陣列發射的 850nm 激光。豐田制造了一個激光雷達原型,其中包含一個用于接收 905nm 激光的 CMOSSPAD 陣列(202x96 像素)。
Princetion Lightware(收購方阿爾戈艾)還實現了 SPAD 激光雷達原型 5,同時信息披露較少。至于 SiPM,SensL(OmmniVision 收購)已經制造了一個 LiDAR 原型,而商業產品仍在開發中。
由于比近紅外激光允許更高的功率閾值,一些人轉而使用 SWIR 激光器(例如 1550nm),如 Luminar(宣布與豐田合作)、AEYE。基于相干探測的 FMCW 激光雷達受到汽車制造商和投資商的追捧。
Strobe 和 Blackmore 這兩個具有代表性的 FMCW 激光雷達初創公司,分別很快被 Cruise 和 Aurora 收購。在本文中,我們對幾家具有代表性的汽車激光雷達供應商及其公開技術進行了分類和列舉。
激光雷達的另一個發展趨勢是克服惡劣的天氣條件,如雨、霧、雪、灰塵等。根據公式 1,不利的天氣條件增加了傳輸損耗 Tr,并削弱了接收能量變小的物體β的反射率。由于 SWIR 激光器(如 1550nm)可以獲得更高的傳輸功率,因此該波長的激光雷達有望在惡劣天氣下具有更好的性能。
2. 激光雷達感知系統
對于自主車輛,其感知系統根據感知傳感器的輸出、定位和地圖數據,將感知環境解釋為層次化的對象描述(即物理、語義、意圖感知)。
如圖 6 所示,傳統的 LiDAR 數據處理流水線分為 4 個步驟:目標檢測、跟蹤、識別和運動預測。最近興起的深度學習技術正在改變這一經典流程,我們將在經典方法之后介紹它。由于 Velodyne 激光雷達在研究領域的普及,綜述的數據處理方法主要基于這種機械旋轉激光雷達。
圖 6:典型的激光雷達感知系統的管道,每個步驟的輸出示例。示例來自作者的平臺,如圖 1 所示。請注意,在目標檢測后,我們只處理道路內的物體(用黃線表示)。
A、 目標檢測
目標檢測算法提取候選對象并估計其物理信息:被檢測對象的位置和形狀。由于在大多數交通場景中,目標垂直于一個平坦的地面,目標檢測算法通常包括:地面濾波和聚類。地面過濾將點云標記為地面或非地面。然后,利用聚類方法將非地面點劃分為不同的目標。
在早期的研究中,激光雷達的點云被投影到圍繞激光雷達 360°的極坐標網格中。每個網格單元內的點被連續處理以生成一個虛擬掃描,該掃描指定了空閑、占用和遮擋的區域。占用的虛擬掃描被分組到對象簇中。
采用了這種方法,而不是對每個點進行處理,而是采用基于網格的局部平面擬合方法。將能夠擬合為平面的網格劃分為接地網,剩余的非接地網采用連接元件標記(CCL)進行聚類。然而,基于極坐標網格的方法往往需要將三維激光雷達點投影到離散網格中,這會丟失激光雷達測量的原始信息。
在球面坐標系(r,ψ,θ)中處理激光雷達信號提供了一種更好的方法。對于作者所用的 Velo-dyne 超光球,每束激光的垂直角是固定的,方位角由掃描時間和電機轉速決定。因此,每個量程讀數可以用 Pi 表示,j=(ρi,j,?i,θj,),其中 i 表示某一激光束,j 是方位角指數,如圖 7 所示。
圖 7:用于進一步處理的旋轉激光雷達(Velodyne UltraPuck)的距離圖。偽彩色的范圍圖像(32x1800)有助于以下處理。
這種方法自然地將范圍讀數填充到預定義的數據緩沖區(范圍圖像),因此允許快速訪問點及其相鄰點。近幾年來,在距離視角下處理激光雷達數據變得越來越流行。
例如,基于一幅距離圖像,對每一列中的地面點進行了分割。剩余的非地面點通過距離和角度的標準很容易地進行分組。對于 32 束激光雷達來說,在英特爾 i5 處理器中,它們達到了 4 毫秒。逐行處理范圍圖像。他們在每個掃描行(實際上是距離圖像中的行)中應用聚類,然后逐行合并這些簇。
圖 6 顯示了基于距離圖像的地面濾波和聚類的示例結果。綠色點是地面點,非地面點被分組到候選對象中(在藍色多邊形中)。目標檢測提供初始的物理信息,例如物體的位置。以下步驟(如識別和跟蹤)對檢測到的對象補充語義和更多物理信息,如航向、速度。
B、 物體識別
基于機器學習的對象識別方法為檢測到的對象提供語義信息(如行人、車輛、卡車、樹木、建筑物等)。使用的典型識別過程包括計算緊湊對象描述符的特征提取步驟和預訓練分類器基于提取的特征預測對象類別的分類步驟。
文獻中提出的特征可以大致分為兩類:整體對象的全局特征,或每個點的局部特征。物體的大小、半徑、中心矩或最大強度是最基本的全局特征。將主成分分析(PCA)應用于三維點云是獲取全局形狀特征的另一種有效方法。
通過分析主成分分析得到的特征值,可以得到三個顯著特征(表面性、線性性、分散性)。對于局部特征,計算了每個點及其相鄰點的三個顯著性特征。對三個顯著性特征提取 3 個直方圖,每個直方圖包含 4 個間隔在 0 到 1 之間的箱子,作為局部特征。一個更復雜的特征是引入的自旋圖像(SI)。
SI 是通過圍繞給定點 p 的曲面法線 n 旋轉網格來創建的。SI 的虛擬像素是到通過 n 的直線或到由 p 和 n 定義的平面的距離。將單個逐點特征轉換為全局特征:對于一個對象,只使用其中心點的 SI 作為對象描述符。在文獻中,有更復雜的特征,比如全局傅立葉直方圖(GFH)描述符。然而,實時性要求限制了特征的復雜性。
特征提取后,分類是一個典型的有監督機器學習過程:由一個真實數據集訓練的分類器預測輸入對象的類別。著名的數據集如 kitti6 提供了豐富的資源。在機器學習(ML)的武器庫中,可以應用大量的機器學習工具,如 Naive Bayes、支持向量機(SVM)、KNN、隨機森林(RF)和梯度提升樹(GBT)。
基于徑向基函數(RBF)核的支持向量機(SVM)由于其速度快、精度高等優點,仍然是目前最流行的支持向量機方法。圖 6 顯示了基于我們的實現(基于 RBF 核的 SVM)對檢測到的道路目標的識別結果。最近,應用證據神經網絡對激光雷達目標進行分類。證據分類器可以更好地處理實踐中經常遇到的未知類。
C、 目標跟蹤
多目標跟蹤(MOT)算法通過時空一致性來關聯和定位檢測 / 識別的目標。MOT 保持被探測物體的身份,并給出它們的物理狀態,即軌跡、姿態、速度。
MOT 是一個經典的工程問題,已經被研究了很長時間。基本體系結構主要包括單個目標跟蹤器,該跟蹤器“最優”估計被跟蹤對象的狀態,數據關聯將新的檢測分配給跟蹤器。
單目標跟蹤器將運動建模為動態狀態空間模型,并在貝葉斯濾波框架下對運動狀態進行估計。Kalman Filter(KF)家族 - 高斯線性假設下的經典 KF 及其變種擴展 Kalman 濾波器(EKF),Unscented Kalman Filter(UKF),是目前流行的工具箱。
使用了一個帶有恒定速度模型的 KF 來跟蹤激光雷達探測。作為 KF 的一種非線性形式,EKF 被用于激光雷達目標跟蹤。交互多模型(IMM)濾波器將單個動態模型擴展到多個機動模型,能夠處理更復雜的情況。
IMM 濾波器由多個并行運行的濾波器組成,每個濾波器使用不同的運動模型。對于單個物體,IMM-UKF 濾波器應用,其中三個 UKF 用于三個運動模型:恒定速度、恒定轉彎速率和隨機運動。
作為另一種常用的方法,粒子濾波(PF)是為更一般的不滿足高斯線性假設的情況而設計的。PF 在激光雷達數據處理中的應用可以追溯到 DARPA。最簡單的方法是最近鄰(NN)濾波器,它根據檢測和軌跡之間的歐氏距離或馬氏距離將檢測分配給最近的軌跡。NN 濾波器對于雜波場景是不夠的。
相比之下,聯合概率數據關聯濾波器(JPDAF)為檢測航跡關聯提供了一種軟的、概率的方法。JPDAF 在一個選通窗口中考慮所有可能的檢測(包括不檢測),估計它們對軌跡的分配概率,并取所有關聯假設的加權平均值。
與雷達基 MOT 相比,基于 LiDAR 的 MOT 的所有檢測都被建模為點,而基于 LiDAR 的 MOT 的獨特之處在于它還應該跟蹤檢測的形狀。最簡單的形狀模型是一個二維邊界框,它假設檢測到的是類似汽車的物體。
L 形擬合是估計包圍盒中心、寬度、高度和方向的最常用方法。然而,二維邊界盒不足以滿足更一般的物體,如行人、樹木、建筑物等。一種更復雜的方法實現了多個形狀模型:點、多邊形、L 形和各種對象的線。在跟蹤運動目標時,其形狀隨姿態和傳感器視點的變化而變化。
D、 目標意向預測
前面介紹的模塊提供檢測到的目標的過去和現在的信息。而在自主駕駛系統中,決策和路徑規劃算法需要跟蹤目標的未來運動。以往的工作基于某些運動學模型,假設是完美地擬合檢測對象,不適用于長期預測。
針對這一缺點,提出了一種基于機器學習方法的機動或行為識別方法。車輛常見的操縱有切入、變道、制動、超車等。采用高斯混合模型(GMM)或隱馬爾可夫模型(HMM)對汽車跟馳、變道行為進行了建模。基于 HMM 實現的機動分類,
在車輛交互模型約束下,利用變分高斯混合模型(VGMMs)預測車輛的運動。隨著 RNN 在時序數據建模中的成功應用,基于 LSTM 的方法越來越流行。利用 LSTM 對交叉口駕駛員的意圖進行分類,結果表明 LSTM 優于其他傳統的機器學習方法。
提出了一種用于機動識別和軌跡預測的編解碼 LSTM 模型。除了識別單個物體的動作外,社交 LSTM 被提出用來捕捉所有物體之間的相互作用。這是通過社會池實現的,它將目標的相鄰對象的 LSTM 狀態下采樣為一個社會張量。應用和改進了原有的社會統籌部分,用于車輛軌跡預測。
E、 新興的深度學習方法
在計算機視覺和語音識別取得巨大成功之后,激光雷達數據處理也迎來了深度學習的浪潮。深度學習是機器學習算法的一個子集,主要使用多層神經網絡。
與支持向量機等傳統的機器學習方法相比,DL 技術能夠從原始輸入中自動提取特征。卷積神經網絡(CNN)和遞歸神經網絡(RNN),如 LSTM(long-short-term memory)是最常用的工具。
感知系統的基本組成部分、地面分割、目標檢測、跟蹤和識別都可以通過深度神經網絡(DNN)來實現。例如,通過將 CNN 應用于由多通道距離圖像表示的 LiDAR 點來分割地面點。
與基于聚類的可檢測任意目標的目標檢測方法不同,基于 DNN 的解決方案基于有監督學習的模式,通過識別來實現目標檢測。車輛可以通過基于 CNN 的神經網絡在激光雷達點的 BEV(鳥瞰圖)表示中檢測到。
一種更為復雜的神經網絡,將 CNN 用于激光雷達數據的距離像和 BEV,然后與攝像機檢測進行融合。然而,由于激光雷達的物理局限性,激光雷達只能對車輛進行有效的檢測,KITTI benchmark 中行人檢測的最佳結果平均精度僅為 52.40%(在本文寫作時采用的方法是不可信的)。
將證據理論集成到基于激光雷達的道路分割和制圖的 DL 體系結構中。利用 DL 實現了目標跟蹤。與傳統跟蹤算法中描述的濾波跟蹤框架不同,提出了一種檢測跟蹤框架下的深層結構模型。
檢測網首先處理一系列的激光雷達數據和圖像以生成檢測方案。然后,通過尋找最佳檢測關聯來估計軌跡,并通過行軍網和計分網實現。
除了改進傳統的感知成分外,點式語義切分在以前很難實現,現在可以通過深度學習來實現。提出了一種通用的三維點云語義分割方法點網。然而,由于激光雷達數據 w.r.t 距離的稀疏性,該方法不能很好地應用于自動駕駛場景。
squezeseg 將 CNN 應用于激光雷達點的距離視圖中,實現了實時分割。由于缺少大量帶注釋的數據集,這兩種方法的性能還不能在實際使用中部署。雖然這種情況已經被 semantickitti8 所改變,Semantickitti8 是基于 KITTI 的最新也是最大的逐點注釋數據集。
基于這個數據集,RangeNet 通過一個并不復雜的 DNN 結構展示了令人著迷的性能和速度。圖 8 示出了 RangeNet 的結構和示例結果。隨著越來越多的標注數據集,我們有充分的理由期待基于 LiDAR 的語義分割將有更好的性能。
圖 8:RangeNet 中提出的神經網絡結構
3. 結論與未來方向
本文首先對激光雷達技術進行了綜述。介紹了激光雷達如何“看到”世界和什么構成了激光雷達。分析了激光雷達技術的主要發展方向。綜上所述,目前的汽車激光雷達面臨著以下限制或挑戰:
1)成本;
2)滿足汽車可靠性和安全標準(如 ISO26262、IEC61508);
3)測量距離長(如公路應用》200m);
4)惡劣天氣,如雨、霧、雪等;
5)圖像級分辨率;
6)尺寸較小,便于集成。目前,各種可能的解決方案,從激光源(905nm V.S.1550nm)、掃描方法(自旋 /MEMS/OPA/Flash)或測距原理(ToF 或 FMCW)都被用來克服這些困難。
很難預測哪種汽車激光雷達解決方案將主導未來,但有一點是肯定的:汽車激光雷達正在走出實驗平臺,進入越來越多的量產汽車。
然后,介紹了基于激光雷達的自動駕駛感知系統的簡明教程。介紹了感知系統提供的三個層次的信息,以及典型的處理流程。一般來說,與攝像機或雷達相比,激光雷達是測量距離最精確的傳感器。
因此,由基于激光雷達的算法評估的物理信息(物體的位置、方向、形狀等)是非常可靠的。然而,語義描述是激光雷達的缺點。這是由于激光雷達的分辨率低,其本質是作為一個距離測量傳感器,而不是上下文傳感器。與攝像機的融合彌補了激光雷達在識別方面的不足。
意圖預測水平獨立于特定的傳感器,而激光雷達所帶來的精確物理信息將增強其預測能力。將深度學習應用于激光雷達的三維數據將是未來研究的重要方向之一。缺乏大量的三維點云數據集是深度學習方法成功應用的瓶頸。隨著新型激光雷達的快速發展,將出現更加適用于特定激光雷達的新算法。
責任編輯人:CC
-
激光雷達
+關注
關注
968文章
3996瀏覽量
190108 -
自動駕駛
+關注
關注
784文章
13884瀏覽量
166667
發布評論請先 登錄
相關推薦
評論