色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

3D目標檢測中多模態融合方法的綜述

新機器視覺 ? 來源:新機器視覺 ? 作者:新機器視覺 ? 2022-06-29 10:42 ? 次閱讀

導讀

本文是一篇關于3D目標檢測中多模態融合方法的綜述,總結了多模態融合的難點和現有研究中的一些方法。

0 前言

本篇文章主要想對目前處于探索階段的3D目標檢測中多模態融合的方法做一個簡單的綜述,主要內容為對目前幾篇研究工作的總結和對這個研究方面的一些思考。 在前面的一些文章中,筆者已經介紹到了多模態融合的含義是將多種傳感器數據融合。在3D目標檢測中,目前大都是將lidar和image信息做融合。在上一篇文章中,筆者介紹到了目前主要的幾種融合方法,即early-fusion,deep-fusion和late-fusion,并介紹了一種基于Late-fusion的融合方法。但是在大多數研究工作中,都是以deep-fuion的方法為主要的融合策略。

1 背景知識

1.1 多模態融合的主要難點

難點一:傳感器視角問題

3D-CVF(ECCV20)的研究提出的做fusion的對做融合工作最大的問題即是在視角上的問題,描述為如下圖所示的問題,camera獲取到的信息是“小孔成像”原理,是從一個視錐出發獲取到的信息,而lidar是在真實的3D世界中獲取到的信息。這使得在對同一個object的表征上存在很大的不同。

f721bcec-f6e9-11ec-ba43-dac502259ad0.png

難點二 數據表征不一樣

這個難點也是所用多模態融合都會遇到的問題,對于image信息是dense和規則的,但是對于點云的信息則是稀疏的、無序的。所以在特征層或者輸入層做特征融合會由于domain的不同而導致融合定位困難。

難點三 信息融合的難度

從理論上講,圖像信息是dense和規則的,包含了豐富的色彩信息和紋理信息,但是缺點就是由于為二維信息。存在因為遠近而存在的sacle問題。相對圖像而言,點云的表達為稀疏的,不規則的這也就使得采用傳統的CNN感知在點云上直接處理是不可行的。但是點云包含了三維的幾何結構和深度信息,這是對3D目標檢測更有利的,因此二者信息是存在理論上的互補的。此外目前二維圖像檢測中,深度學習方法都是以CNN為基礎設計的方法,而在點云目標檢測中則有著MLP、CNN,GCN等多種基礎結構設計的網絡,在融合過程中和哪一種網絡做融合也是比較需要研究的。

1.2 點云和imgae融合的紐帶

既然做多模態特征融合,那么圖像信息和點云信息之間必然需要聯系才能做對應的融合。就在特征層或者輸入層而言,這種聯系都來自于一個認知,即是:對于激光雷達或者是相機而言,對同一個物體在同一時刻的掃描都是對這個物體此時的一種表征,唯一不同的是表征形式,而融合這些信息的紐帶就是絕對坐標,也就是說盡管相機和激光雷達所處的世界坐標系下的坐標不一樣,但是他們在同一時刻對同一物體的掃描都僅僅是在傳感器坐標系下的掃描,因此只需要知道激光雷達和相機之間的位置變換矩陣,也就可以輕松的得到得到兩個傳感器的坐標系之間的坐標轉換,這樣對于被掃描的物體,也就可以通過其在兩個傳感器下的坐標作為特征聯系的紐帶。 但是,就聯系的紐帶而言,由于在做特征提取過程中可能存在feature-map或者domain的大小的改變,所以最原始坐標也會發生一定的改變,這也是需要研究的問題。


2目前存在的一些融合方法

如果硬要把目前存在的融合方法做一個劃分的話,那么筆者從early-fuion,deep-fusion和late-fusion三個層面對最近的文章做一些簡單介紹。這里把early-fusion和deep-fusion當做同一類融合方法介紹,late-fusion當做另外一種融合策略介紹。

2.1 early-fusian & deep-fusion

在上一篇文章中,筆者也提及到這種融合方法如下圖所示。在后面,筆者將這兩種方法都統稱為特征融合方法,將late-fusion成為決策融合方法。如下圖所示的融合方法,該融合需要在特征層中做一定的交互。主要的融合方式是對lidar 和image分支都各自采用特征提取器,對圖像分支和lidar分支的網絡在前饋的層次中逐語義級別融合,做到multi-scale信息的語義融合。

f738deb8-f6e9-11ec-ba43-dac502259ad0.png


為了方便分析,在該種融合策略下,筆者按照對lidar-3D-detection的分類方法分為point-based的多模態特征融合和voxel-based的多模態特征融合。其差別也就是lidar-backbone是基于voxel還是基于point的。就筆者的理解是,基于voxel的方法可以利用強大的voxel-based的backbone(在文章TPAMI20的文章Part-A^2中有研究過point-based方法和voxel-based的方法最大的區別在于CNN和MLP的感知能力上,CNN優于MLP)。但是如果采用voxel-backbone的方法就會需要考慮點到圖像的映射關系的改變,因為基于point的方法采用原始的點云坐標做為特征載體,但是基于voxel的方法采用voxel中心作為CNN感知特征載體,而voxel中心與原始圖像的索引相對原始點云對圖像的坐標索引還是存在偏差的。

1)基于voxel-based的多模態特征融合

3D-CVF: Generating Joint Camera and LiDAR Features Using Cross-View Spatial Feature Fusion for 3D Object Detection.文章鏈接: https://arxiv.org/pdf/2004.12636 這篇發表在ECCV20的多模態融合的文章網絡結構圖如下所示,該特征融合階段為對特征進行融合,同時對于點云的backbone采用voxel-based的方法對點云做特征提取。所以這里需要解決的核心問題除了考慮怎么做特征的融合還需要考慮voxel-center作為特征載體和原始點云坐標存在一定的偏差,而如果將圖像信息索引到存在偏差的voxel中心坐標上,是本文解決的另外一個問題。

f745e216-f6e9-11ec-ba43-dac502259ad0.png

3D-CVF特征融合方法

3D-CVF 將camera的pixel轉化到點云的BEV視圖上(voxel-feature-map)時,轉化的大小是lidar-voxel-feature-map的x-y各自的兩倍大小,也就是說整體的voxel個數是Lidar的四倍,即會包含比較多的細節信息。 以下表示的Auto-Calibrated Projection Method的設計方案,前面提到的是該結構是將image轉化到bev上的網絡結構,具體的做法是: (1)投影得到一個camera-plane,該plane是圖像特征到bev視角的voxel-dense的表達。 (2)將lidar劃分的voxel中心投影到camera-plane上(帶有一個偏移量,不一定是坐標網格正中心) (3)采用近鄰插值,將最近的4個pixel的image特征插值個lidar-voxel。插值的方式采用的是距離為權重的插值方法。

f75b8904-f6e9-11ec-ba43-dac502259ad0.png


這樣,作者就得到了了image信息的feature-map在lidar-voxel上的表示,值得提到的是前面說的偏移值是為了更好的使camera和lidar對齊。這里的第二步也就是為了解決上面提到的做標偏差的問題。
如下圖所示,

2)基于point-based的多模態融合方法

由于point-based的方法在特征提取過程也是基于原始點為載體(encoder-decoder的結構會點數先減少再增加但是點是從原始點中采樣得到,對于GCN的結構則是點數不改變),所以在做特征融合時,可以直接利用前面提到的轉化矩陣的索引在絕對坐標系上做特征融合,所以目前基本也都是基于point的方法比較好融合,研究工作也多一些。PI-RCNN: An Efficient Multi-sensor 3D Object Detector with Point-based Attentive Cont-conv Fusion Module.文章鏈接: https://arxiv.org/pdf/1911.06084 發表在AAAI20,point分支和image分支分別做3D目標檢測任務和語義分割任務,然后將圖像語義分割的特征通過索引加到proposals的內部的點云上做二次優化。

f7730fe8-f6e9-11ec-ba43-dac502259ad0.png

PointPainting: Sequential Fusion for 3D Object Detection文章鏈接: https://arxiv.org/pdf/1911.10150 發表在CVPR20,該工作的fusion方式是采用二維語義分割信息通過lidar信息和image信息的變換矩陣融合到點上,再采用baseline物體檢測;可以理解為對于語義分割出的物體多了一些信息作為引導,得到更好的檢測精度。和上面的pi-rcnn的不同之處是該融合是一個串聯的網絡結構,將語義分割后的特征和原始點云一起送入深度學習網絡中。

f78312ee-f6e9-11ec-ba43-dac502259ad0.png

EPNet: Enhancing Point Features with Image Semantics for 3D Object Detection文章鏈接: https://arxiv.org/pdf/2007.08856 發表在ECCV20的文章,如下圖所示,其網絡結構點云分支是point encoder-decoder的結構,圖像分支則是一個逐步encoder的網絡,并且逐層做特征融合。

f79c7b6c-f6e9-11ec-ba43-dac502259ad0.png

2.2 late-fuion

在決策層面的融合相對簡單很多,不需要考慮在信息層面的融合和互補,也就是說,只要是兩種網絡做同樣的任務,那么在得到各自的結果后,對結果做決策上的選擇融合。CLOCs: Camera-LiDAR Object Candidates Fusion for 3D Object Detectionhttps://arxiv.org/pdf/2009.00784.pdf 這就是筆者上一篇分享的文章,從下圖可以看出該網絡經歷了三個主要的階段: (1)2D和3D的目標檢測器分別提出proposals (2)將兩種模態的proposals編碼成稀疏張量 (3)對于非空的元素采用二維卷積做對應的特征融合。

f7ac802a-f6e9-11ec-ba43-dac502259ad0.png

3 筆者總結

本文主要就目前的幾篇做多模態融合的文章做了一定的介紹,從大層面上的fusion的階段講起,然后進一步在deep-fuion階段劃分為基于point-based和voxel-based的融合方法,基于point的方法具有先天的優勢是具有和image 的索引和不具有空間變化,而voxel的方法可以更有效的利用卷積的感知能力。最后大家如果對自動駕駛場景感知的研究比較感興趣和想要找文章的話,可以去以下鏈接找最新的研究。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 傳感器
    +關注

    關注

    2562

    文章

    52548

    瀏覽量

    763632
  • 3D
    3D
    +關注

    關注

    9

    文章

    2950

    瀏覽量

    109438
  • 目標檢測
    +關注

    關注

    0

    文章

    222

    瀏覽量

    15894

原文標題:綜述:3D目標檢測多模態融合算法

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

收藏 0人收藏

    評論

    相關推薦
    熱點推薦

    海康威視發布模態大模型AI融合巡檢超腦

    基于海康觀瀾大模型技術體系,海康威視推出新一代模態大模型AI融合巡檢超腦,全面升級人、車、行為、事件等算法,為行業帶來全新的模態大模型巡
    的頭像 發表于 04-17 17:12 ?572次閱讀

    ?模態交互技術解析

    。它的核心目標是模擬人類感官協同的溝通方式,提供更高效、靈活和人性化的人機交互體驗。 核心特點 通道融合 :整合多種輸入/輸出方式(如語音+手勢+視覺)。 自然交互 :模仿人類
    的頭像 發表于 03-17 15:12 ?1507次閱讀

    BEVFusion —面向自動駕駛的多任務傳感器高效融合框架技術詳解

    ,激光雷達在3D視圖中捕獲數據。1. 核心目標與創新?目標? 解決模態傳感器(攝像頭、激光雷達等)在3
    的頭像 發表于 02-26 20:33 ?3667次閱讀
    BEVFusion —面向自動駕駛的多任務<b class='flag-5'>多</b>傳感器高效<b class='flag-5'>融合</b>框架技術詳解

    ?超景深3D檢測顯微鏡技術解析

    為一個完整的三維模型。這種技術不僅提升了成像的精度,還大大擴展了顯微鏡的應用范圍。 在材料科學領域,超景深3D檢測顯微鏡為研究人員提供了觀察材料微觀結構的強大工具。例如,在納米材料的研究,科學家可以
    發表于 02-25 10:51

    3D打印XPR技術對于打印效果的影響?

    我是3D打印設備的制造商,我想具體了解下3D打印XPR技術對于打印效果的影響? 或者是否能提供對應的專利信息以備查閱
    發表于 02-18 07:59

    海康機器人3D檢測案例入選實數融合典型案例

    伏行業高精度3D檢測案例”憑借其卓越的技術實力和應用效果脫穎而出,成功入選數字化轉型通用工具產品應用案例名單。 這一榮譽的獲得,不僅是對海康機器人在實數融合技術領域的深度探索和創新的肯定,更是對其在推動行業數字化轉
    的頭像 發表于 02-14 16:09 ?700次閱讀

    研究用于獨立檢測壓力和溫度的3D主動矩陣模態傳感器陣列

    和壓力刺激之間的干擾。 創新點 浦項科技大學Sungjune Jung,Sanghoon Baek和蔚山科學技術研究所Hyunhyub Ko開發了基于有源矩陣的三維集成的模態傳感器陣列,以獨立檢測溫度和壓力。我們的
    的頭像 發表于 01-23 18:02 ?560次閱讀
    研究用于獨立<b class='flag-5'>檢測</b>壓力和溫度的<b class='flag-5'>3D</b>主動矩陣<b class='flag-5'>多</b><b class='flag-5'>模態</b>傳感器陣列

    體驗MiniCPM-V 2.6 模態能力

    模態組網
    jf_23871869
    發布于 :2025年01月20日 13:40:48

    超聲界“內卷終結者”!ZRT智銳通提供全新引擎打造模態影像融合系統

    模態影像融合超聲系統的市場規模也在不斷擴大,國內眾多超聲系統廠家也在不斷尋找合適的硬件平臺,用以承載旗下的模態影像
    的頭像 發表于 11-11 10:52 ?1091次閱讀
    超聲界“內卷終結者”!ZRT智銳通提供全新引擎打造<b class='flag-5'>多</b><b class='flag-5'>模態</b>影像<b class='flag-5'>融合</b>系統

    利用OpenVINO部署Qwen2模態模型

    模態大模型的核心思想是將不同媒體數據(如文本、圖像、音頻和視頻等)進行融合,通過學習不同模態之間的關聯,實現更加智能化的信息處理。簡單來說,
    的頭像 發表于 10-18 09:39 ?1064次閱讀

    透明塑料件噴粉3D掃描CAV全尺寸檢測逆向3D建模設計服務-CASAIM

    3D建模
    中科院廣州電子
    發布于 :2024年08月30日 10:04:53

    安寶特產品 安寶特3D Analyzer:智能的3D CAD高級分析工具

    安寶特3D Analyzer包含多種實用的3D CAD高級分析工具,包括自動比對模型、碰撞檢測、間隙檢查、壁厚檢查,以及拔模和底切分析,能夠有效提升3D CAD模型
    的頭像 發表于 08-07 10:13 ?672次閱讀
    安寶特產品  安寶特<b class='flag-5'>3D</b> Analyzer:智能的<b class='flag-5'>3D</b> CAD高級分析工具

    廣東3D掃描鈑金件外觀尺寸測量3D偏差檢測對比解決方案CASAIM

    3D掃描
    中科院廣州電子
    發布于 :2024年07月22日 16:13:45

    奧比3D相機打造高質量、低成本的3D動作捕捉與3D動畫內容生成方案

    ? 在過去幾十年里,動作捕捉(MoCap)技術經歷了顯著的發展,廣泛被應用于電影、游戲、虛擬現實、醫療等多個領域。近期,奧比光合作客戶Moverse使用Orbbec Femto系列3D相機,打造出
    的頭像 發表于 06-25 16:37 ?1427次閱讀

    蘇州吳中區色PCB板元器件3D視覺檢測技術

    3D視覺檢測相較于2D視覺檢測,有其獨特的優勢,不受產品表面對比度影響,精確檢出產品形狀,可以測出高度(厚度)、體積、平整度等。在實際應用
    的頭像 發表于 06-14 15:02 ?718次閱讀
    蘇州吳中區<b class='flag-5'>多</b>色PCB板元器件<b class='flag-5'>3D</b>視覺<b class='flag-5'>檢測</b>技術
    主站蜘蛛池模板: 受喷汁红肿抽搐磨NP双性 | 日韩成人黄色 | 国产精品无码无卡毛片不卡视 | 国产精品俺来也在线观看 | 久久大胆视频 | 美女网站免费看 | 99精品热视频30在线热视频 | 拔萝卜视频免费看高清 | 国产色综合久久无码有码 | 俄罗斯女人与马Z00Z视频 | 久久精品亚洲热综合一本奇米 | 亚洲欧美自拍清纯中文字幕 | 狠狠躁日日躁人人爽 | 中文在线观看 | 女张腿男人桶羞羞漫画 | 久久re这里视频只有精品首页 | 国产成人在线小视频 | 最近中文字幕免费高清MV视频6 | 999久久久国产精品蜜臀AV | 美女打开双腿扒开屁股男生 | 亚洲 欧美 国产 视频二区 | 99国产精品免费视频 | 女攻男受高h全文肉肉 | 国产精品人妻无码久久久奥特曼 | QVOD在线播放| 九色PORNY丨视频入口 | 亚洲精品久久久无码 | bl被教练啪到哭H玉势 | 国产av免费观看日本 | 午夜福利免费体检区 | 国产亚洲人成网站在线观看播放 | 亚洲免费每日在线观看 | 国产成人精品亚洲线观看 | 中文无码乱人伦中文视频播放 | 日韩精品亚洲专区在线影院 | 99精品观看 | 国产 浪潮AV性色四虎 | 香蕉视频国产精品 | 国产精品久久久久久久久免费下载 | 风车动漫(p)_在线观看官网 | 亚洲欧洲精品A片久久99 |

    電子發燒友

    中國電子工程師最喜歡的網站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品