SLAM是Simultaneous localization and mapping縮寫,意為“同步定位與建圖”,主要用于解決機(jī)器人在未知環(huán)境運(yùn)動(dòng)時(shí)的定位與地圖構(gòu)建問題。
SLAM的典型應(yīng)用領(lǐng)域
主要應(yīng)用于機(jī)器人定位導(dǎo)航領(lǐng)域:地圖建模。
SLAM可以輔助機(jī)器人執(zhí)行路徑規(guī)劃、自主探索、導(dǎo)航等任務(wù)。國內(nèi)的科沃斯、塔米以及最新面世的嵐豹掃地機(jī)器人都可以通過用SLAM算法結(jié)合激光雷達(dá)或者攝像頭的方法,讓掃地機(jī)高效繪制室內(nèi)地圖,智能分析和規(guī)劃掃地環(huán)境,從而成功讓自己步入了智能導(dǎo)航的陣列。
VR/AR方面:輔助增強(qiáng)視覺效果。SLAM技術(shù)能夠構(gòu)建視覺效果更為真實(shí)的地圖,從而針對當(dāng)前視角渲染虛擬物體的疊加效果,使之更真實(shí)沒有違和感。VR/AR代表性產(chǎn)品中微軟Hololens、谷歌ProjectTango以及MagicLeap都應(yīng)用了SLAM作為視覺增強(qiáng)手段。
無人機(jī)領(lǐng)域:地圖建模。SLAM可以快速構(gòu)建局部3D地圖,并與地理信息系統(tǒng)(GIS)、視覺對象識(shí)別技術(shù)相結(jié)合,可以輔助無人機(jī)識(shí)別路障并自動(dòng)避障規(guī)劃路徑,曾經(jīng)刷爆美國朋友圈的Hovercamera無人機(jī),就應(yīng)用到了SLAM技術(shù)。
無人駕駛領(lǐng)域:視覺里程計(jì)。SLAM技術(shù)可以提供視覺里程計(jì)功能,并與GPS等其他定位方式相融合,從而滿足無人駕駛精準(zhǔn)定位的需求。例如,應(yīng)用了基于激光雷達(dá)技術(shù)Google無人駕駛車以及牛津大學(xué)MobileRoboticsGroup11年改裝的無人駕駛汽車野貓(Wildcat)均已成功路測。
SLAM系統(tǒng)構(gòu)成
SLAM系統(tǒng)一般分為五個(gè)模塊,包括傳感器數(shù)據(jù)、視覺里程計(jì)、后端、建圖及回環(huán)檢測。
傳感器數(shù)據(jù):主要用于采集實(shí)際環(huán)境中的各類型原始數(shù)據(jù)。包括激光掃描數(shù)據(jù)、視頻圖像數(shù)據(jù)、點(diǎn)云數(shù)據(jù)等。
視覺里程計(jì):主要用于不同時(shí)刻間移動(dòng)目標(biāo)相對位置的估算。包括特征匹配、直接配準(zhǔn)等算法的應(yīng)用。
后端:主要用于優(yōu)化視覺里程計(jì)帶來的累計(jì)誤差。包括濾波器、圖優(yōu)化等算法應(yīng)用。
建圖:用于三維地圖構(gòu)建。
回環(huán)檢測:主要用于空間累積誤差消除
其工作流程大致為:
傳感器讀取數(shù)據(jù)后,視覺里程計(jì)估計(jì)兩個(gè)時(shí)刻的相對運(yùn)動(dòng)(Ego-motion),后端處理視覺里程計(jì)估計(jì)結(jié)果的累積誤差,建圖則根據(jù)前端與后端得到的運(yùn)動(dòng)軌跡來建立地圖,回環(huán)檢測考慮了同一場景不同時(shí)刻的圖像,提供了空間上約束來消除累積誤差。
ALAM回環(huán)檢測
在視覺SLAM問題中,位姿的估計(jì)往往是一個(gè)遞推的過程,即由上一幀位姿解算當(dāng)前幀位姿,因此其中的誤差便這樣一幀一幀的傳遞下去,也就是我們所說的累計(jì)誤差。
我們的位姿約束都是與上一幀建立的,第五幀的位姿誤差中便已經(jīng)積累了前面四個(gè)約束中的誤差。但如果我們發(fā)現(xiàn)第五幀位姿不一定要由第四幀推出來,還可以由第二幀推算出來,顯然這樣計(jì)算誤差會(huì)小很多,因?yàn)橹淮嬖趦蓚€(gè)約束的誤差了。像這樣與之前的某一幀建立位姿約束關(guān)系就叫做回環(huán)。回環(huán)通過減少約束數(shù),起到了減小累計(jì)誤差的作用。
那如何判斷兩幀圖片的相似度?最直觀的做法是特征匹配。由于特征匹配非常耗時(shí),回環(huán)檢測需要與過去所有關(guān)鍵幀匹配,這個(gè)運(yùn)算量是絕對無法承受的,因此提出了詞袋模型來加速特征匹配。
詞袋模型就是把特征看成是一個(gè)個(gè)單詞,通過比較兩張圖片中單詞的一致性,來判斷兩張圖片是否屬于同一場景。為了能夠把特征歸類為單詞,我們需要訓(xùn)練一個(gè)字典。字典包含了所有可能的單詞的集合,為了提高通用性,需要使用海量的數(shù)據(jù)訓(xùn)練。
SLAM分類
目前用在SLAM上的傳感器主要分為這兩類,一種是基于激光雷達(dá)的激光SLAM(Lidar SLAM)和基于視覺的VSLAM(Visual SLAM)。
1、激光SLAM
激光SLAM采用2D或3D激光雷達(dá)(也叫單線或多線激光雷達(dá)),2D激光雷達(dá)一般用于室內(nèi)機(jī)器人上(如掃地機(jī)器人),而3D激光雷達(dá)一般使用于無人駕駛領(lǐng)域。激光雷達(dá)的出現(xiàn)和普及使得測量更快更準(zhǔn),信息更豐富。激光雷達(dá)采集到的物體信息呈現(xiàn)出一系列分散的、具有準(zhǔn)確角度和距離信息的點(diǎn),被稱為點(diǎn)云。通常,激光SLAM系統(tǒng)通過對不同時(shí)刻兩片點(diǎn)云的匹配與比對,計(jì)算激光雷達(dá)相對運(yùn)動(dòng)的距離和姿態(tài)的改變,也就完成了對機(jī)器人自身的定位。
激光雷達(dá)測距比較準(zhǔn)確,誤差模型簡單,在強(qiáng)光直射以外的環(huán)境中運(yùn)行穩(wěn)定,點(diǎn)云的處理也比較容易。同時(shí),點(diǎn)云信息本身包含直接的幾何關(guān)系,使得機(jī)器人的路徑規(guī)劃和導(dǎo)航變得直觀。激光SLAM理論研究也相對成熟,落地產(chǎn)品更豐富。
2、視覺SLAM
視覺SLAM從環(huán)境中獲取海量的、富于冗余的紋理信息,擁有超強(qiáng)的場景辨識(shí)能力。早期的視覺SLAM基于濾波理論,其非線性的誤差模型和巨大的計(jì)算量成為了它實(shí)用落地的障礙。近年來,隨著具有稀疏性的非線性優(yōu)化理論(Bundle Adjustment)以及相機(jī)技術(shù)、計(jì)算性能的進(jìn)步,實(shí)時(shí)運(yùn)行的視覺SLAM已經(jīng)不再是夢想。
視覺SLAM的優(yōu)點(diǎn)是它所利用的豐富紋理信息。例如兩塊尺寸相同內(nèi)容卻不同的廣告牌,基于點(diǎn)云的激光SLAM算法無法區(qū)別他們,而視覺則可以輕易分辨。這帶來了重定位、場景分類上無可比擬的巨大優(yōu)勢。同時(shí),視覺信息可以較為容易的被用來跟蹤和預(yù)測場景中的動(dòng)態(tài)目標(biāo),如行人、車輛等,對于在復(fù)雜動(dòng)態(tài)場景中的應(yīng)用這是至關(guān)重要的。
通過對比發(fā)現(xiàn),激光SLAM和視覺SLAM各擅勝場,單獨(dú)使用都有其局限性,而融合使用則可能具有巨大的取長補(bǔ)短的潛力。例如,視覺在紋理豐富的動(dòng)態(tài)環(huán)境中穩(wěn)定工作,并能為激光SLAM提供非常準(zhǔn)確的點(diǎn)云匹配,而激光雷達(dá)提供的精確方向和距離信息在正確匹配的點(diǎn)云上會(huì)發(fā)揮更大的威力。而在光照嚴(yán)重不足或紋理缺失的環(huán)境中,激光SLAM的定位工作使得視覺可以借助不多的信息進(jìn)行場景記錄。
國內(nèi)SLAM發(fā)展現(xiàn)狀
激光SLAM比視覺SLAM起步早,在理論、技術(shù)和產(chǎn)品落地上都相對成熟?;谝曈X的 SLAM 方案目前主要有兩種實(shí)現(xiàn)路徑,一種是基于 RGBD 的深度攝像機(jī),比如 Kinect;還有一種就是基于單目、雙目或者魚眼攝像頭的。VSLAM 目前尚處于進(jìn)一步研發(fā)和應(yīng)用場景拓展、產(chǎn)品逐漸落地階段。
隨著SLAM技術(shù)重要性的凸顯以及應(yīng)用市場的擴(kuò)大 ,一些企業(yè)開始紛紛投入到SLAM技術(shù)研發(fā)中,這其中也可分為兩大類,一是專門提供導(dǎo)航定位模塊的企業(yè),另一類則是移動(dòng)機(jī)器人廠商,其開發(fā)SLAM多為自用。
隨著SLAM技術(shù)重要性的凸顯,國內(nèi)越來越多企業(yè)紛紛投入SLAM技術(shù)的研發(fā)中,除了一些移動(dòng)機(jī)器人廠商作為自用研發(fā),也不乏一些企業(yè)專門提供定位導(dǎo)航模塊。思嵐科技就是其中一家,作為機(jī)器人定位導(dǎo)航技術(shù)的領(lǐng)先企業(yè),思嵐科技主要以激光SLAM取勝。它是我國最早將激光SLAM應(yīng)用于服務(wù)機(jī)器人的企業(yè),為了幫助機(jī)器人實(shí)現(xiàn)自主行走,國內(nèi)思嵐科技推出了模塊化自主定位導(dǎo)航解決方案SLAMWARE,這套定位導(dǎo)航方案以激光雷達(dá)作為核心傳感器,搭配定位導(dǎo)航控制核心SLAMWARE Core,可使機(jī)器人實(shí)現(xiàn)自主定位導(dǎo)航、自動(dòng)建圖、路徑規(guī)劃與自動(dòng)避障等功能。據(jù)了解,該開發(fā)套裝具有12米家用版及25米商用版之分,主要區(qū)別在于傳感器測距范圍的不同,思嵐科技商用版除了25米測距外,還推出了首款TOF激光雷達(dá),測距半徑可達(dá)到40米,能滿足更多更大場景的應(yīng)用,且抗光干擾能力更勝一籌。在室外60Klx的強(qiáng)光下依舊能實(shí)現(xiàn)穩(wěn)定測距及高精度地圖建圖。無論是室內(nèi)還是室外場景,都能輕松完成任務(wù)。
除了思嵐科技,國內(nèi)速感科技、布科思、米克力美、高仙、斯坦德等企業(yè)也涌入其中,且大多企業(yè)以激光SLAM為主,畢竟激光SLAM是當(dāng)下最穩(wěn)定、可靠的定位導(dǎo)航方案,而視覺SLAM將是未來主流研究方向,不過未來兩者融合也將成為一種趨勢,采用多傳感器融合能做到取長補(bǔ)短,為市場打造出更好用的定位導(dǎo)航解決方案,進(jìn)一步實(shí)現(xiàn)機(jī)器人的智能化進(jìn)程。
總體來說,目前國內(nèi)SLAM技術(shù)無論是在技術(shù)層面還是應(yīng)用層面仍處于發(fā)展階段,未來,隨著消費(fèi)刺激及產(chǎn)業(yè)鏈不斷發(fā)展,SLAM技術(shù)將會(huì)有一片更為廣闊的市場。
審核編輯 黃昊宇
-
工業(yè)機(jī)器人
+關(guān)注
關(guān)注
91文章
3369瀏覽量
92726 -
SLAM
+關(guān)注
關(guān)注
23文章
425瀏覽量
31861
發(fā)布評論請先 登錄
相關(guān)推薦
評論