色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

基于反向傳播PnP優(yōu)化的端到端可學習幾何視覺介紹

3D視覺工坊 ? 來源:泡泡機器人SLAM ? 2023-02-06 16:46 ? 次閱讀

摘要

深度網(wǎng)絡在從大量數(shù)據(jù)中學習模式方面表現(xiàn)出色。另一方面,許多幾何視覺任務被指定為優(yōu)化問題。

為了將深度學習和幾何視覺無縫地結合起來,至關重要的是進行端到端的學習和幾何優(yōu)化。

為了實現(xiàn)這一目標,我們提出了BPnP,這是一個新穎的網(wǎng)絡模塊,通過Perspective-nPoints(PnP)求解器反向傳播梯度,以指導神經(jīng)網(wǎng)絡參數(shù)更新。

基于隱式微分,我們表明一個 "獨立的 "PnP求解器的梯度可以被準確有效地導出,就像優(yōu)化器塊是一個可微分的函數(shù)。

我們通過將BPnP納入一個深度模型來驗證它,該模型可以從訓練數(shù)據(jù)集中學習相機的內(nèi)在因素、相機的外在因素(姿勢)和三維結構。

此外,我們開發(fā)了一個用于物體姿勢估計的端到端可訓練管道,該管道通過將基于特征的熱圖損失與二維-三維重投影誤差相結合,實現(xiàn)了更高的準確性。

由于我們的方法可以擴展到其他優(yōu)化問題,我們的工作有助于以一種原則性的方式實現(xiàn)可學習的幾何視覺。

主要貢獻

我們的主要貢獻是一個名為BPnP的新型網(wǎng)絡模塊,它包含了一個PnP求解器。BPnP通過PnP "層 "反向傳播梯度,以指導神經(jīng)網(wǎng)絡權重的更新,從而利用既定的目標函數(shù)(二維-三維重投影誤差的平方和)和幾何視覺問題的求解器實現(xiàn)端到端的學習。

盡管只結合了一個PnP求解器,我們展示了BPnP如何被用來學習有效的深度特征表征,用于多種幾何視覺任務(姿勢估計、運動結構、相機校準)。

我們還將我們的方法與最先進的幾何視覺任務的方法進行比較。從根本上說,我們的方法是基于隱式微分的。

主要方法

反向傳播的PnP算法: 讓g表示一個 "函數(shù) "形式的PnP求解器

7e1ebcc0-a402-11ed-bfe3-dac502259ad0.png

從n個2D-3D的對應關系中返回攝像機的6DOF姿態(tài)y和其內(nèi)部參數(shù)K∈R3×3

7e4a7a40-a402-11ed-bfe3-dac502259ad0.png

其中(xi , zi)是第i個對應關系。讓π(-|y, K)是三維點在圖像平面上的投影變換,姿態(tài)為y,相機本征為K。

從本質(zhì)上講,g的 "評估 "需要解決優(yōu)化問題如下:

7e66062a-a402-11ed-bfe3-dac502259ad0.png

7e926062-a402-11ed-bfe3-dac502259ad0.png

ri表示第i對對應關系的重投影誤差。

7ea00474-a402-11ed-bfe3-dac502259ad0.png

πi是三維點zi在圖像平面上的投影。

我們的最終目標是將g納入一個可學習的模型中,其中x、z和K可以是一個深度網(wǎng)絡的(中間)輸出。此外,公式(4)的求解器應該被用來參與網(wǎng)絡參數(shù)的學習。為此,我們需要把g當作一個可微調(diào)的函數(shù),這樣它的"梯度 "就可以反向傳播到網(wǎng)絡的其他部分。接下來我們將詳細介紹如何對反向傳播的梯度進行計算。

1. 隱式函數(shù)定理(IFT) 這里簡單公式推導了IFT隱式函數(shù)定理。

7eaeabb4-a402-11ed-bfe3-dac502259ad0.png

7edbe502-a402-11ed-bfe3-dac502259ad0.png

7f04826e-a402-11ed-bfe3-dac502259ad0.png

IFT允許計算一個函數(shù)g相對于其輸入a的導數(shù),而不需要函數(shù)的明確形式,但有一個函數(shù)f約束a和g(a)。

2. 構造約束函數(shù)f

為了調(diào)用隱式微分的IFT,我們首先需要定義約束函數(shù)f(a, b)。對于我們的問題,我們使用所有四個變量x、y、z和K來構造f。

但我們將f視為一個雙變量函數(shù)f(a, b),其中a在{x, z, K}中取值--取決于要得到的偏導--而b=y(即g的輸出姿勢)。

為了維護約束函數(shù)f(a,b),我們利用了優(yōu)化過程的靜止約束。

在這里,將PnP求解器的目標函數(shù)g表示為:

7f12e598-a402-11ed-bfe3-dac502259ad0.png

由于PnP求解器的輸出姿態(tài)y是目標函數(shù)的局部最優(yōu),所以可以通過對目標的一階導數(shù)與y的關系來建立一個靜止約束,即:

7f384cde-a402-11ed-bfe3-dac502259ad0.png

給出一個PnP求解器的輸出姿勢y = [y1, ..., ym] T,我們構建f,可以寫為:

7f641742-a402-11ed-bfe3-dac502259ad0.png

7f963ce0-a402-11ed-bfe3-dac502259ad0.png

3. 前向和反向傳播

我們對g的PnP公式基本上是執(zhí)行最小二乘法(LS)估計,這對離群值(x、z和K的惡劣誤差)并不穩(wěn)健。

另外,我們可以采用一個更穩(wěn)健的目標,如加入M-估計器[56]或使離群值的數(shù)量最大化[15]。

然而,我們的結果表明,LS實際上更合適,因為它對輸入測量中的誤差的敏感性鼓勵學習快速收斂到不產(chǎn)生x、z和K中的異常值的參數(shù)。

相反,一個穩(wěn)健的目標會阻止異常值的誤差信號,導致學習過程不穩(wěn)定。

鑒于(4),解算器的選擇仍然存在。

為了進行隱式微分,我們不需要精確地解決(4),因為cij只是(4)的靜止條件,任何局部最小值都能滿足。

為此,我們采用Levenberg-Marquardt(LM)算法,該算法保證了局部收斂。

作為一種迭代算法,LM在求解(4)時需要初始化y(0)。

我們通過將(1)重寫為:"(1)"來明確這種依賴關系:

7fd1889a-a402-11ed-bfe3-dac502259ad0.png

在反向傳播中,我們首先構建f,然后得到g相對于其每個輸入的雅可比系數(shù),即:

800098a6-a402-11ed-bfe3-dac502259ad0.png

給出輸出梯度,BPnP返回輸入梯度:

80179bd2-a402-11ed-bfe3-dac502259ad0.png

算法流程如下圖所示:

802578b0-a402-11ed-bfe3-dac502259ad0.png

主要結果:

805896b4-a402-11ed-bfe3-dac502259ad0.png80e32fae-a402-11ed-bfe3-dac502259ad0.png812bd664-a402-11ed-bfe3-dac502259ad0.png








審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標題:BPnP:基于反向傳播PnP優(yōu)化的端到端可學習幾何視覺

文章出處:【微信號:3D視覺工坊,微信公眾號:3D視覺工坊】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    已來,智駕仿真測試該怎么做?

    智駕方案因強泛化能力、可持續(xù)學習與升級等優(yōu)勢備受矚目,但這對仿真測試帶來了巨大挑戰(zhàn)??抵\探索了一種有效的
    的頭像 發(fā)表于 12-04 09:59 ?2865次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>已來,智駕仿真測試該怎么做?

    基于WiMAX接入技術的網(wǎng)絡架構

    基于WiMAX接入技術的網(wǎng)絡架構 本文首先分析了WiMAX技術的市場驅(qū)動力和影響其成功部署的關鍵因素,隨后介紹了一個基于WiMAX接入技術的
    發(fā)表于 10-20 21:03 ?744次閱讀

    反向傳播算法的工作原理

    反向傳播算法(BP算法)是目前用來訓練人工神經(jīng)網(wǎng)絡的最常用且最有效的算法。作為谷歌機器學習速成課程的配套材料,谷歌推出一個演示網(wǎng)站,直觀地介紹
    的頭像 發(fā)表于 07-02 16:01 ?1w次閱讀
    <b class='flag-5'>反向</b><b class='flag-5'>傳播</b>算法的工作原理

    深讀解析反向傳播算法在解決模型優(yōu)化問題的方面應用

    反向傳播算法隸屬于深度學習,它在解決模型優(yōu)化問題的方面有著重要的地位。
    的頭像 發(fā)表于 11-01 15:48 ?5732次閱讀
    深讀解析<b class='flag-5'>反向</b><b class='flag-5'>傳播</b>算法在解決模型<b class='flag-5'>優(yōu)化</b>問題的方面應用

    的自動駕駛研發(fā)系統(tǒng)介紹

    Nvidia是比較早做控制車輛工作的公司,其方法訓練CNN模型完成從單個前向攝像頭的圖像像素車輛控制的映射。 其系統(tǒng)自動學習一些處理
    的頭像 發(fā)表于 07-13 09:30 ?5082次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>的自動駕駛研發(fā)系統(tǒng)<b class='flag-5'>介紹</b>

    基于深度神經(jīng)網(wǎng)絡的圖像壓縮方法

    人工設計的算法分別進行優(yōu)化近年來,基于深度神經(jīng)網(wǎng)絡的圖像壓縮方法在圖像壓縮中取得了豐碩的成果,相比傳統(tǒng)方法,
    發(fā)表于 04-08 09:30 ?16次下載
    基于深度神經(jīng)網(wǎng)絡的<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>圖像壓縮方法

    基于生成式對抗網(wǎng)絡的圖像去霧模型

    圖像中霧的特征;其次,采用殘差學習思想直接從退化圖像中學習清晣圖像的特征,實現(xiàn)的去霧;最
    發(fā)表于 04-12 15:03 ?20次下載
    基于生成式對抗網(wǎng)絡的<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>圖像去霧模型

    的IO鏈接解決方案

    的IO鏈接解決方案
    發(fā)表于 05-10 10:43 ?1次下載
    <b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>的IO鏈接解決方案

    結合深度學習的自編碼器物理層優(yōu)化方案

    碼器物理層優(yōu)化方案。通過兩階段訓練模式提髙神經(jīng)網(wǎng)絡的泛化性,同時利用自編碼器壓縮特性量化信道狀態(tài)信息(CSI)并進行重建,降低CSI反饋導致的系統(tǒng)開銷。仿真結果表明,該方案通過分
    發(fā)表于 05-24 15:18 ?7次下載

    BP(BackPropagation)反向傳播神經(jīng)網(wǎng)絡介紹及公式推導

    BP(BackPropagation)反向傳播神經(jīng)網(wǎng)絡介紹及公式推導(電源和地電氣安全間距)-該文檔為BP(BackPropagation)反向傳播
    發(fā)表于 07-26 10:31 ?48次下載
    BP(BackPropagation)<b class='flag-5'>反向</b><b class='flag-5'>傳播</b>神經(jīng)網(wǎng)絡<b class='flag-5'>介紹</b>及公式推導

    一種對紅細胞和白細胞圖像分類任務的主動學習工作流程

    細胞成像的分割和分類等技術是一個快速發(fā)展的領域研究。就像在其他機器學習領域一樣,數(shù)據(jù)的標注是非常昂貴的,并且對于數(shù)據(jù)標注的質(zhì)量要求也非常的高。針對這一問題,本篇文章介紹一種對紅細胞和白細胞圖像分類任務的主動學習
    的頭像 發(fā)表于 08-13 10:27 ?1379次閱讀

    神經(jīng)網(wǎng)絡反向傳播算法的優(yōu)缺點有哪些

    神經(jīng)網(wǎng)絡反向傳播算法(Backpropagation Algorithm)是一種廣泛應用于深度學習和機器學習領域的優(yōu)化算法,用于訓練多層前饋
    的頭像 發(fā)表于 07-03 11:24 ?1347次閱讀

    測試用例怎么寫

    編寫測試用例是確保軟件系統(tǒng)從頭到尾能夠正常工作的關鍵步驟。以下是一個詳細的指南,介紹如何編寫
    的頭像 發(fā)表于 09-20 10:29 ?677次閱讀

    連接視覺語言大模型與自動駕駛

    自動駕駛在大規(guī)模駕駛數(shù)據(jù)上訓練,展現(xiàn)出很強的決策規(guī)劃能力,但是面對復雜罕見的駕駛場景,依然存在局限性,這是因為
    的頭像 發(fā)表于 11-07 15:15 ?407次閱讀
    連接<b class='flag-5'>視覺</b>語言大模型與<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>自動駕駛

    什么是BP神經(jīng)網(wǎng)絡的反向傳播算法

    BP神經(jīng)網(wǎng)絡的反向傳播算法(Backpropagation Algorithm)是一種用于訓練神經(jīng)網(wǎng)絡的有效方法。以下是關于BP神經(jīng)網(wǎng)絡的反向傳播算法的
    的頭像 發(fā)表于 02-12 15:18 ?228次閱讀
    主站蜘蛛池模板: 娇妻让壮男弄的流白浆 | 精品视频一区二区三三区四区 | 欧美精品色婷婷五月综合 | 亚洲不卡视频在线 | 伊人大香线蕉精品在线播放 | 少妇仑乱A毛片 | gogogo高清在线观看 | 国产成人精品电影 | 国产黄大片在线视频 | 九九精彩视频在线观看视频 | 精品亚洲国产熟女福利自在线 | 亚洲AVAV天堂AV在线网爱情 | 丰满的美女射精动态图 | 开心久久激情 | 亚洲spank男男实践网站 | 2020美女视频黄频大全视频 | 国产色精品久久人妻无码 | 亚洲免费无l码中文在线视频 | 日本阿v在线资源无码免费 日本阿v片在线播放免费 | www.日本 高清.com | 在线AV国产传媒18精品免费 | 亚洲精品AV中文字幕在线 | 日韩一卡二卡三卡四卡免费观在线 | 纯肉无码AV在线看免费看 | 国产精品久AAAAA片 | 国产AV精品白浆一区二 | 狠狠久久免费视频在线 | 国产精品一区二区20P | 欧美日韩北条麻妃一区二区 | 1234成人网| 国产精品在线手机视频 | 538视频这里只有精品 | 欧美丝袜女同 | 5g天天影院天天看天天爽 | 99九九免费热在线精品 | G国产精品无马 | 国内精品伊人久久久影院 | 日日碰狠狠躁久久躁77777 | 推倒美女总裁啪啪 | 欧美国产日韩久久久 | 老司机福利在 线影院 |