色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

CREStereo立體匹配算法總結

3D視覺工坊 ? 來源:3D視覺工坊 ? 2023-05-16 09:05 ? 次閱讀

電子科技大學用國產深度學習框架曠視天元MegEngine開發的雙目視覺立體匹配算法CREStereo ( CREStereo: Cascaded REcurrent Stereo matching network),CREStereo立體匹配算法是一種基于級聯循環網絡的立體匹配算法,旨在通過使用上下文推理來更好地理解場景中不同物體和表面之間的關系,從而提高立體匹配的準確性和效率。這使得網絡能夠更加確切地決定每個像素的深度,從而產生更準確的深度圖和3D重建。

1 前言

立體匹配是計算機視覺的重要領域,通過給定一對經過校正的圖像,計算對應像素之間的位移,即視差。立體匹配算法近年來因卷積神經網絡的出現而獲得了巨大進步。然而,由于薄結構、非理想的校正、攝像頭模塊不一致以及各種復雜場景等實際操作困難因素,從智能手機等消費級設備拍攝的真實圖像對中準確提取差異仍然是一個巨大的挑戰。為了解決這些問題,作者提出了CREStereo,即級聯循環立體匹配網絡,其特點是采用分層網絡以一種從粗到細的方式遞歸地更新視差,并使用疊堆式級聯架構進行高分辨率推理;設計自適應群局部相關層處理非理想校準問題;引入含有更豐富的光照、紋理和形狀變化的新合成數據集以更好地適應現實場景。CREStereo在Middlebury和ETH3D等公共基準測試中的表現明顯優于現有方法,并極大地提高了恢復視差的準確性。其主要貢獻可以總結為:

為實際立體匹配提出了級聯循環網絡和疊堆式級聯架構;

設計自適應群相關層來處理非理想校準問題;

創建新的合成數據集以更好地推廣到現實世界場景;

2 相關背景

視覺領域中的立體匹配是一個具有挑戰性的問題。傳統算法可以分為局部和全局方法。局部方法使用支持窗口計算匹配成本,而全局方法將立體匹配視為一個優化問題。深度神經網絡在立體匹配任務的性能表現越來越成熟,包括2D和3D的方法。對于真實世界圖像的立體匹配仍是一個少有探索的問題,但是已經有了一些解決方案,比如自適應方法、小波合成網絡和域自適應。同時,為訓練深度立體模型,合成數據集是不可或缺的。盡管現有的合成數據集對于模型訓練提供了高精度且密集的ground truth,但是這些數據集仍有許多限制,如對象形狀的變化范圍有限,失真/光流值的分布也較為局限。

3 方法

3.1 Adaptive Group Correlation Layer - 自適應組相關層(AGCL)

作者提出了一種自適應組相關層(AGCL)用于消除實際場景中立體相機校準不完美的影響。為了減少匹配的不確定性,僅在局部窗口中匹配點,通過加入注意力模塊來聚合全局上下文信息。作者采用2D-1D交替本地搜索策略來提高匹配精度,而且使用形變搜索窗口來減少對遮擋或無紋理區域的依賴。此外,作者引入組相關以逐組計算局部相關性,從而顯著降低了內存消耗和計算成本。

其中,局部關鍵點注意力是實現局部窗口匹配的核心,公式中的位置編碼增強了特征映射的位置依賴性。形變搜索窗口將搜索窗口的形狀更改為內容自適應形狀,以此來更好地處理遮擋和無紋理區域。最后,組相關機制通過分組計算本地相關性,來進一步提高匹配精度。除此之外,2D-1D交替本地搜索策略能夠提高網絡的復雜度,以細化匹配結果。這些創新性設計使得AGCL領先于現有的視覺匹配方法,在立體匹配中具有廣泛的應用前景。

4a073180-f379-11ed-90ce-dac502259ad0.png

局部匹配公式:

4a27da84-f379-11ed-90ce-dac502259ad0.png

形變搜索窗口公式:

4a3b8a16-f379-11ed-90ce-dac502259ad0.png

3.2 Cascaded Recurrent Network - 級聯循環網絡

作者提出了一種級聯遞歸網絡方法用于匹配光流。采用遞歸更新模塊(RUM)和自適應組關聯層(AGCL)來構建級聯遞歸網絡。分別在不同級聯層中計算特征圖的相關性,并獨立地用幾次迭代來細化視差。除了級聯的第一層外,其他級聯層均采用來自上一級的預測上采樣版本作為初始化。最后,使用凸上采樣獲得輸入分辨率的最終預測。

4a4dd176-f379-11ed-90ce-dac502259ad0.png

3.3 Stacked Cascades for Inference - 堆疊級聯用于推理

作者提出了一種帶有捷徑的堆疊級聯架構用于推理。預先對圖像對進行下采樣構建圖像金字塔,并將它們饋送到相同訓練的特征提取網絡中,以利用多層次的上下文信息。對于堆疊級聯的特定階段,該階段中的所有 RUM 與更高分辨率階段的最后一個 RUM 一起使用。在訓練期間,堆疊級聯的所有階段共享相同的權重,因此不需要進行微調。

4a6eb1fc-f379-11ed-90ce-dac502259ad0.png

3.4 Loss Function - 損失函數

作者所使用的損失函數采用類似于RAFT的指數加權L1距離,并使用上采樣算子將輸出序列調整到完整的預測分辨率。

4a92addc-f379-11ed-90ce-dac502259ad0.png

3.5 Synthetic Training Data - 合成訓練數據

作者在用于視差估計網絡訓練的合成訓練數據的生成過程中使用Blender生成左右圖像對和像素級準確的密集視差地圖。通過多種來源擴展場景中主要內容的模型的形狀,包括基于ShapeNet數據集的基本內容來源,以及Blender的sapling tree gen add-on和基本形狀結合線框修改器生成模型。在場景內隨機放置不同類型、顏色和亮度的燈光形成復雜的光照環境,并使用真實世界圖像作為物體和場景背景的紋理。為了覆蓋不同的基線設置,努力確保生成的數據的視差分布在寬范圍內平滑分布。

4aaf1558-f379-11ed-90ce-dac502259ad0.png

4 實驗

4.1 數據集和評估指標

作者所使用的數據集包括Middlebury、ETH3D和KITTI等公共基準測試數據集,以及Sceneflow、Sintel和Falling Things等用于訓練的數據集。評估指標包括AvgErr、Bad2.0和D1-all等。其中,AvgErr表示平均誤差,Bad2.0表示視差誤差大于2像素的像素占比,D1-all表示左圖像中視差異常像素的百分比。

4.2 實施細節

作者使用PyTorch框架實現了Crestereo網絡。使用了8個NVIDIA GTX 2080Ti GPU進行訓練,批次大小為16。整個訓練過程設置為300,000次迭代。使用Adam 優化器,標準學習率為0.0004。在開始訓練的時候,進行了一個漸進式預熱過程,持續6000次迭代,其中學習率從5%線性增加到標準值的100%。在180,000次迭代后,學習率會線性降低到末尾訓練過程中標準值的5%。這個模型使用384×512的輸入大小進行訓練。在進入模型之前,所有的訓練樣本都會經過一組數據擴充操作。為了模擬相機模塊的不一致性和非理想矯正,我們使用多個數據擴充技術進行訓練。首先,作者分別為兩個輸入應用不對稱的色彩增強,包括亮度、對比度和伽馬的變化。為了進一步提高對真實世界圖像矯正誤差的抵抗力,只對右側圖像進行空間擴充:輕微的隨機單應性變換和非常小范圍內(<2像素)的垂直平移。為了避免不合適的區域上的匹配錯誤,使用高度和寬度在50到100像素之間的隨機矩形遮擋補丁。最后,為了適應來自各個來源的輸入數據進入網絡的訓練輸入尺寸、立體圖像和視差的組合進行隨機調整和剪裁操作。

4.3 消融實驗

作者在通過消融實驗來驗證網絡組件的有效性,除了級聯堆疊中的消融實驗外,所有評估分辨率均為768×1024。首先,比較了不同類型的相關性,發現使用2D和1D all-pairs相關性會導致準確度顯著下降;其次,分析了AGCL部分的組件,固定的無學習偏移的相關窗口會降低準確性,同時組相關和局部特征注意力模塊的去除也會降低準確性;接著,比較了不同級聯階段的性能,并發現級聯的重要性;最后,引入了新的合成數據集,表明作者提出的數據集在域泛化方面更具優勢。

4ae1dc90-f379-11ed-90ce-dac502259ad0.png

5 總結

CREStereo立體匹配算法通過級聯遞歸網絡與自適應相關性,能夠更好地恢復微妙的深度細節,比現有方法更好地處理難度場景。同時,通過合成數據集的精心設計,也能更好地處理非紋理或重復紋理區域。未來可以進行改進,以適應各種便攜式設備,并最好實時運行。

審核編輯:彭靜
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 編碼
    +關注

    關注

    6

    文章

    940

    瀏覽量

    54814
  • 模型
    +關注

    關注

    1

    文章

    3226

    瀏覽量

    48809
  • 深度學習
    +關注

    關注

    73

    文章

    5500

    瀏覽量

    121113

原文標題:立體匹配算法,CRestero是如何讓它變得更加準確?

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    立體匹配SAD算法原理

    立體匹配SAD算法matlab實現
    發表于 06-05 16:08

    基于外極線分區的動態立體匹配算法

    基于區域的立體匹配算法僅針對支撐窗內的灰度信息定義匹配代價函數,導致在弱(無)紋理區域采用WTA優化出現歧義性。該文在外極線分區的基礎上,改用區域作為匹配基元,針對歧
    發表于 04-11 08:37 ?21次下載

    彩色鏡像圖像的立體匹配方法

    提出一種新的基于鏡像圖像的立體匹配方法,設計一種新的圖像采集系統,采集獲得物體的鏡像圖像,利用鏡面成像特點,將立體匹配的搜索空間由二維降為可靠的一維。應用彩色
    發表于 04-15 09:39 ?37次下載

    基于蟻群優化算法立體匹配

    立體匹配技術使得通過像點獲取景物的距離信息,實現三維立體再現成為可能,是計算機視覺研究中最基本的關鍵問題之一。本文選擇圖像的邊緣點作為匹配基元,以邊緣特征點
    發表于 06-26 10:29 ?17次下載

    雙目視覺立體匹配算法研究

    雙日視覺是計算機視覺領域的一個重要組成部分。雙目視覺研究中的關鍵技術攝像機標定和立體匹配一直是研究的熱點。本文由兩部分組成,分別對雙目視覺的算法和未標定圖
    發表于 08-14 16:41 ?0次下載

    基于擴展雙權重聚合的實時立體匹配方法

    立體匹配是對給定的一對立體圖像計算視差圖的過程。目前許多立體匹配的應用程序需要實時處理,但事實上立體匹配需要經歷大規模的計算。幸運的是,無論硬件還是軟件方面并行處理技術已經非常先進。因
    發表于 10-31 18:46 ?2次下載
    基于擴展雙權重聚合的實時<b class='flag-5'>立體匹配</b>方法

    基于顏色調整的立體匹配改進算法

    的前提,因此如何提升立體匹配算法在各種場景中的魯棒性也是計算機視覺研究的熱點問題。 立體匹配算法的目標是從兩幅校正后的匹配圖片中尋找每個像素
    發表于 11-02 11:07 ?0次下載
    基于顏色調整的<b class='flag-5'>立體匹配</b>改進<b class='flag-5'>算法</b>

    超像素分割的快速立體匹配

    針對目前立體匹配中存在的匹配精度和匹配速度很難兼顧的問題,提出了一種基于穩定特征點和SLIC超像素分割算法的快速立體匹配。利用SURF
    發表于 11-15 15:26 ?14次下載
    超像素分割的快速<b class='flag-5'>立體匹配</b>

    基于mean-shift全局立體匹配方法

    針對圖像全局立體匹配精度高、計算量大的問題,提出基于mean shift圖像分割的全局立體匹配方法。首先,通過mean shift算法對圖像進行分割,獲取圖像同質區域數量和區域的標號。在計算
    發表于 11-20 11:50 ?9次下載

    視覺顯著性的快速區域立體匹配算法

    針對區域立體匹配算法對光照變化敏感,視差圖存在目標和弱紋理區域的錯配、邊界不平滑等問題,提出一種利用視覺顯著性特征改進的快速區域立體匹配算法。該算法
    發表于 12-28 17:09 ?0次下載

    如何使用跨尺度代價聚合實現改進立體匹配算法

    針對現有的立體匹配算法在精度和速度上不可兼得的現狀,提出一種改進的跨尺度代價聚合立體匹配算法。通過強度和梯度算法計算
    發表于 02-02 14:36 ?10次下載
    如何使用跨尺度代價聚合實現改進<b class='flag-5'>立體匹配</b><b class='flag-5'>算法</b>

    雙目立體計算機視覺的立體匹配研究綜述

    、半全局和基于深度學習的立體匹配算法研究現狀的基礎上,闡述了匹配代價、代價聚合、視差計算/優化、視差校正在立體匹配算法中的實際應用,
    發表于 04-12 09:47 ?3次下載
    雙目<b class='flag-5'>立體</b>計算機視覺的<b class='flag-5'>立體匹配</b>研究綜述

    一種基于PatchMatch的半全局雙目立體匹配算法

    近年來雙目立體匹配技術發展迅速,高精度、高分辨率、大視差的應用需求無疑對該技術的計算效率提出了更高的要求。由于傳統立體匹配算法固有的計算復雜度正比于視差范圍,已經難以滿足高分辨率、大視差的應用場
    發表于 04-20 11:31 ?13次下載
    一種基于PatchMatch的半全局雙目<b class='flag-5'>立體匹配</b><b class='flag-5'>算法</b>

    融合邊緣特征的立體匹配算法Edge-Gray

    為保證SAD算法立體匹配效率,提高匹配精度,提出一種融合邊緣特征的立體匹配算法 Edge-gray。通過邊緣計算得到邊緣特征圖,在進行
    發表于 04-29 11:06 ?8次下載
    融合邊緣特征的<b class='flag-5'>立體匹配</b><b class='flag-5'>算法</b>Edge-Gray

    基于改進自適應權重的立體匹配優化算法

    為解決現有立體匹配算法對低紋理以及視差不連續區域匹配效果較差的問題,提出一種改進的立體匹配優化算法。在傳統自適應權重
    發表于 04-29 15:42 ?3次下載
    基于改進自適應權重的<b class='flag-5'>立體匹配</b>優化<b class='flag-5'>算法</b>
    主站蜘蛛池模板: 亚洲第一色网| 亚洲精品国产在线网站| 亚洲国产黄色| 在线观看免费毛片| 成年无码av片| 精品网站一区二区三区网站| 欧美牲交A欧美牲交| 亚洲不卡视频在线观看| 99久久e免费热视频百度| 国产乱辈通伦影片在线播放亚洲| 久久亚洲国产中文字幕| 色欲AV亚洲午夜精品无码| 又亲又揉摸下面视频免费看 | 99久久综合国产精品免费| 国产精品亚洲一区二区三区久久| 理论片午午伦夜理片影院| 无人视频在线观看免费播放影院| 中文字幕亚洲欧美日韩2o19| 俄罗斯bbbb| 老司机午夜影院味味| 午夜免费体验30分| 99在线精品国自产拍不卡| 寂寞护士中文字幕 mp4| 日本久久精品毛片一区随边看| 伊久久| 国产69精品9999XXXX| 两个女人互添下身高潮自视频| 鞋奴的视频VK| 扒开粉嫩的小缝末成年小美女| 久久久久久久尹人综合网亚洲| 天堂视频在线观看免费完整版| 99久久人妻无码精品系列性欧美| 精品久久久久久综合网| 四虎成人影院| 99久久全国免费久久爱| 久久亚洲精品成人| 亚洲国产三级在线观看| 国产成人一区免费观看| 欧美丰满熟妇BBB久久久| 欲奴第一季在线观看全集| 国产精品一久久香蕉国产线看|