色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

完善資料讓更多小伙伴認(rèn)識(shí)你，還能領(lǐng)取20積分哦，立即完善>

3天內(nèi)不再提示

一個(gè)用于6D姿態(tài)估計(jì)和跟蹤的統(tǒng)一基礎(chǔ)模型

0. 筆者個(gè)人體會(huì)

今天筆者將為大家分享NVIDIA的最新開(kāi)源方案FoundationPose，是一個(gè)用于 6D 姿態(tài)估計(jì)和跟蹤的統(tǒng)一基礎(chǔ)模型。只要給出CAD模型或少量參考圖像，F(xiàn)oundationPose就可以在測(cè)試時(shí)立即應(yīng)用于新物體，無(wú)需任何微調(diào)，關(guān)鍵是各項(xiàng)指標(biāo)明顯優(yōu)于專為每個(gè)任務(wù)設(shè)計(jì)的SOTA方案。

下面一起來(lái)閱讀一下這項(xiàng)工作，文末附論文和代碼鏈接~

1. 效果展示

FoundationPose實(shí)現(xiàn)了新物體的6D姿態(tài)估計(jì)和跟蹤，支持基于模型和無(wú)模型設(shè)置。在這四個(gè)任務(wù)中的每一個(gè)上，F(xiàn)oundationPose都優(yōu)于專用任務(wù)的SOTA方案。(·表示僅RGB，×表示RGBD)。這里也推薦工坊推出的新課程《單目深度估計(jì)方法：算法梳理與代碼實(shí)現(xiàn)》。

2. 具體原理是什么？

為減少大規(guī)模訓(xùn)練的人工工作，F(xiàn)oundationPose利用3D模型數(shù)據(jù)庫(kù)、大型語(yǔ)言模型和擴(kuò)散模型等新技術(shù)，開(kāi)發(fā)了一種新的合成數(shù)據(jù)生成Pipeline。為了彌補(bǔ)無(wú)模型和基于模型的設(shè)置之間的差距，F(xiàn)oundationPose利用以對(duì)象為中心的神經(jīng)場(chǎng)來(lái)進(jìn)行隨后的渲染和新視圖RGBD渲染。

對(duì)于姿態(tài)估計(jì)，首先在物體周圍均勻地初始化全局姿態(tài)，然后通過(guò)細(xì)化網(wǎng)絡(luò)對(duì)其進(jìn)行細(xì)化。最后將改進(jìn)的位姿轉(zhuǎn)發(fā)給姿態(tài)選擇模塊，預(yù)測(cè)位姿的分?jǐn)?shù)，輸出得分最高的位姿。

3. 和其他SOTA方法對(duì)比如何？

YCB-Video數(shù)據(jù)集上Model-free方案的位姿估計(jì)定量結(jié)果對(duì)比。

YCB-Video數(shù)據(jù)集上位姿跟蹤的定量對(duì)比。這里也推薦工坊推出的新課程《單目深度估計(jì)方法：算法梳理與代碼實(shí)現(xiàn)》。

對(duì)更多實(shí)驗(yàn)結(jié)果和文章細(xì)節(jié)感興趣的讀者，可以閱讀一下論文原文~

4. 論文信息

標(biāo)題：FoundationPose: Unified 6D Pose Estimation and Tracking of Novel Objects

作者：Bowen Wen, Wei Yang, Jan Kautz, Stan Birchfield

機(jī)構(gòu)：NVIDIA

原文鏈接：https://arxiv.org/abs/2312.08344

代碼鏈接：https://github.com/NVlabs/FoundationPose

審核編輯：劉清

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
5013

瀏覽量
103246
RGB

RGB

+關(guān)注

關(guān)注
4

文章
799

瀏覽量
58569

原文標(biāo)題：通用性超強(qiáng)！同時(shí)實(shí)現(xiàn)6D位姿估計(jì)和跟蹤！

文章出處：【微信號(hào)：3D視覺(jué)工坊，微信公眾號(hào)：3D視覺(jué)工坊】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

KerasHub統(tǒng)一、全面的預(yù)訓(xùn)練模型庫(kù)

深度學(xué)習(xí)領(lǐng)域正在迅速發(fā)展，在處理各種類型的任務(wù)中，預(yù)訓(xùn)練模型變得越來(lái)越重要。Keras 以其用戶友好型 API 和對(duì)易用性的重視而聞名，始終處于這一動(dòng)向的前沿。Keras 擁有專用的內(nèi)容庫(kù)，如用于

發(fā)表于 12-20 10:32 ?121次閱讀

CNN, RNN, GNN和Transformer模型的統(tǒng)一表示和泛化誤差理論分析

背景介紹本文是基于我們之前的 RPN（Reconciled Polynomial Network）研究的后續(xù)工作。在此前的研究中，我們提出了 RPN 這一通用模型架構(gòu)，其包含三個(gè)組件函數(shù)：數(shù)據(jù)擴(kuò)展

發(fā)表于 12-06 11:31 ?311次閱讀

CNN, RNN, GNN和Transformer<b class='flag-5'>模型</b>的<b class='flag-5'>統(tǒng)一</b>表示和泛化誤差理論分析

常見(jiàn)人體姿態(tài)評(píng)估顯示方式的兩種方式

，基于Deeplabv3+ 與ResNet34構(gòu)建的一個(gè)人體語(yǔ)義分割模型。火柴人主要是基于關(guān)鍵點(diǎn)的人體姿態(tài)評(píng)估顯示方式，基于YOLOv8等人體姿態(tài)評(píng)估的關(guān)鍵點(diǎn)

發(fā)表于 11-11 11:21 ?241次閱讀

常見(jiàn)人體<b class='flag-5'>姿態(tài)</b>評(píng)估顯示方式的兩種方式

如何利用TPA2012D2的輸出端和阻抗值4OHM的喇叭建一個(gè)cadence仿真模型？

最近想用tlv320aic3106加tpa2012d2設(shè)計(jì)一個(gè)音頻設(shè)備，但是不太懂各個(gè)傳輸路徑上應(yīng)該加什么樣的濾波電容，想請(qǐng)教一下如何利用TPA2012

發(fā)表于 11-07 07:42

光學(xué)跟蹤測(cè)量系統(tǒng)如何工作的

、姿態(tài)等參數(shù)，實(shí)現(xiàn)對(duì)目標(biāo)物體的精確跟蹤和測(cè)量。其工作原理主要包括以下幾個(gè)步驟：光源發(fā)射：光學(xué)跟蹤測(cè)量系統(tǒng)首先需要一個(gè)光源，

發(fā)表于 08-29 17:26 ?793次閱讀

意法半導(dǎo)體新款MEMS IMU LSM6DSV32X實(shí)現(xiàn)精確姿態(tài)識(shí)別應(yīng)用

憑借3核、6軸傳感架構(gòu)，意法半導(dǎo)體新款MEMS IMU LSM6DSV32X能夠進(jìn)行卓越的邊緣計(jì)算處理，是智能手機(jī)的高精度感測(cè)和3D地圖、筆記本電腦和平板電腦的情境感知、AR和VR的精確姿態(tài)

發(fā)表于 08-01 10:15 ?843次閱讀

在PyTorch中搭建一個(gè)最簡(jiǎn)單的模型

在PyTorch中搭建一個(gè)最簡(jiǎn)單的模型通常涉及幾個(gè)關(guān)鍵步驟：定義模型結(jié)構(gòu)、加載數(shù)據(jù)、設(shè)置損失函數(shù)和優(yōu)化器，以及進(jìn)行模型訓(xùn)練和評(píng)估。

發(fā)表于 07-16 18:09 ?2085次閱讀

包含具有多種類型信息的3D模型

Desktop是一個(gè)3D建模CAD程序，用于多種繪圖和設(shè)計(jì)，涵蓋建筑、土木和機(jī)械工程，以及室內(nèi)設(shè)計(jì)、產(chǎn)品設(shè)計(jì)、景觀建筑甚至游戲開(kāi)發(fā)。它通常用于

發(fā)表于 03-28 17:18

Franka Robotics推出“Franka AI Companion”助力機(jī)器人領(lǐng)域研究創(chuàng)新

Isaac Manipulator等軟件組件，使用NVIDIA Jetson Orin將GPU功率與實(shí)時(shí)機(jī)器人控制無(wú)縫集成，無(wú)需額外資源，并采用高精度 NVIDIA AI基礎(chǔ)模型用于6D姿態(tài)

發(fā)表于 03-20 22:01 ?416次閱讀

國(guó)產(chǎn)6D激光跟蹤儀測(cè)量大尺寸空間姿態(tài)

與普通CMM相比，激光跟蹤儀的特點(diǎn)是能夠測(cè)量大型測(cè)量目標(biāo)物。隨著工業(yè)制造的發(fā)展和智能化的要求，對(duì)精度和效率的需求越來(lái)越高。激光跟蹤儀具有的高精度、高速度、非接觸式測(cè)量等優(yōu)勢(shì)，可以滿足工業(yè)制造中對(duì)精確

發(fā)表于 02-03 10:39 ?0次下載

激光跟蹤儀|國(guó)產(chǎn)6D跟蹤儀測(cè)量大尺寸空間姿態(tài)

激光跟蹤儀基于激光干涉和測(cè)距原理，能測(cè)量大型目標(biāo)物，具有高精度、高速度和非接觸式測(cè)量等優(yōu)勢(shì)。它在工業(yè)制造領(lǐng)域有廣泛應(yīng)用，如汽車制造和航空航天制造。技術(shù)創(chuàng)新與發(fā)展趨勢(shì)主要體現(xiàn)在精度和穩(wěn)定性提升、應(yīng)用領(lǐng)域擴(kuò)大、可靠性和穩(wěn)定性改進(jìn)以及自動(dòng)化應(yīng)用推進(jìn)。

發(fā)表于 01-31 09:14 ?616次閱讀

高分工作！Uni3D：3D基礎(chǔ)大模型，刷新多個(gè)SOTA！

我們主要探索了3D視覺(jué)中scale up模型參數(shù)量和統(tǒng)一模型架構(gòu)的可能性。在NLP / 2D vision領(lǐng)域，scale up大

發(fā)表于 01-30 15:56 ?916次閱讀

【愛(ài)芯派 Pro 開(kāi)發(fā)板試用體驗(yàn)】人體姿態(tài)估計(jì)模型部署后期嘗試

這里主要還是感覺(jué)上一期說(shuō)的一些對(duì)于人體姿態(tài)估計(jì)模型的前期調(diào)研，進(jìn)行后期的部署的一些嘗試。下面主要

發(fā)表于 01-22 10:46

【愛(ài)芯派 Pro 開(kāi)發(fā)板試用體驗(yàn)】人體姿態(tài)估計(jì)模型部署后期嘗試

這里主要還是感覺(jué)上一期說(shuō)的一些對(duì)于人體姿態(tài)估計(jì)模型的前期調(diào)研，進(jìn)行后期的部署的一些嘗試。下面主要

發(fā)表于 01-21 00:49

【先楫HPM5361EVK開(kāi)發(fā)板試用體驗(yàn)】06-基于MPU9250的姿態(tài)解算

采用歐拉角、四元數(shù)或旋轉(zhuǎn)矩陣等方式來(lái)表示物體的姿態(tài)，歐拉角會(huì)更加直觀一點(diǎn)。而歐拉角是一種用于描述物體在三維空間中姿態(tài)的表示方法，它通過(guò)三

發(fā)表于 01-17 14:55

3D視覺(jué)工坊
專欄

0 文章 0 閱讀 0 粉絲 0 點(diǎn)贊

關(guān)注個(gè)人主頁(yè)

Hot ROS2概述和實(shí)踐入門
Hot 一文詳解卡爾曼濾波

New 全面總結(jié)動(dòng)態(tài)NeRF
New 機(jī)器人沒(méi)有度量信息如何導(dǎo)航

精選推薦
更多

文章

資料

帖子

PCB盜銅工藝：技術(shù)與藝術(shù)的完美融合

上海為昕科技有限公司
14小時(shí)前

258 閱讀

承載AI的云南花卉，正在盛開(kāi)

腦極體
16小時(shí)前

284 閱讀

MPS磁性位置傳感器MA600在機(jī)器人中的應(yīng)用

MPS芯源系統(tǒng)
17小時(shí)前

345 閱讀

采用 LLC 拓?fù)浣Y(jié)構(gòu)設(shè)計(jì)隔離式柵極驅(qū)動(dòng)器電源,低成本 LLC 轉(zhuǎn)換器的設(shè)計(jì)指南

eeDesigner
18小時(shí)前

311 閱讀

三菱電機(jī)超小型全SiC DIPIPM解析

三菱電機(jī)半導(dǎo)體
19小時(shí)前

325 閱讀

單片機(jī)視頻教程下載

qjqb
681984

10積分

3.2w下載

Tenacity跨平臺(tái)的音頻編輯器

李澤明
46.76 MB

2積分

4下載

HStreamDB EMQ流數(shù)據(jù)庫(kù)

h1654155275.5916
0.51 MB

2積分

1下載

Heaptrack Linux堆內(nèi)存分析器

李偉
5.41 MB

2積分

1下載

DIY工作室照明設(shè)置

深圳市正商電子科有限公司
0.02 MB

2積分

6下載

SMT貼片空焊異常

jf_61640453
1天前

467 閱讀

HarmonyOS NEXT 原生應(yīng)用開(kāi)發(fā)：社交通訊發(fā)現(xiàn)界面實(shí)現(xiàn)

李洋水蛟龍
1天前

288 閱讀

用于課題的無(wú)線轉(zhuǎn)速霍爾傳感器，新人應(yīng)該從哪里開(kāi)始學(xué)習(xí)

jf_48213409
1天前

419 閱讀

labview怎樣實(shí)現(xiàn)成績(jī)圖錄入程序圖，還要顯示信息

jf_70720794
1天前

626 閱讀

嵌入式學(xué)習(xí)-飛凌嵌入式ElfBoard ELF 1板卡-初識(shí)設(shè)備樹(shù)之設(shè)備樹(shù)組成和結(jié)構(gòu)

jf_13411809
1天前

500 閱讀

推薦專欄
更多

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

一個(gè)用于6D姿態(tài)估計(jì)和跟蹤的統(tǒng)一基礎(chǔ)模型

評(píng)論

KerasHub統(tǒng)一、全面的預(yù)訓(xùn)練模型庫(kù)

CNN, RNN, GNN和Transformer模型的統(tǒng)一表示和泛化誤差理論分析

常見(jiàn)人體姿態(tài)評(píng)估顯示方式的兩種方式

如何利用TPA2012D2的輸出端和阻抗值4OHM的喇叭建一個(gè)cadence仿真模型？

光學(xué)跟蹤測(cè)量系統(tǒng)如何工作的

意法半導(dǎo)體新款MEMS IMU LSM6DSV32X實(shí)現(xiàn)精確姿態(tài)識(shí)別應(yīng)用

在PyTorch中搭建一個(gè)最簡(jiǎn)單的模型

包含具有多種類型信息的3D模型

Franka Robotics推出“Franka AI Companion”助力機(jī)器人領(lǐng)域研究創(chuàng)新

國(guó)產(chǎn)6D激光跟蹤儀測(cè)量大尺寸空間姿態(tài)

激光跟蹤儀|國(guó)產(chǎn)6D跟蹤儀測(cè)量大尺寸空間姿態(tài)

高分工作！Uni3D：3D基礎(chǔ)大模型，刷新多個(gè)SOTA！

【愛(ài)芯派 Pro 開(kāi)發(fā)板試用體驗(yàn)】人體姿態(tài)估計(jì)模型部署后期嘗試

【愛(ài)芯派 Pro 開(kāi)發(fā)板試用體驗(yàn)】人體姿態(tài)估計(jì)模型部署后期嘗試

【先楫HPM5361EVK開(kāi)發(fā)板試用體驗(yàn)】06-基于MPU9250的姿態(tài)解算