色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

高分工作!Uni3D:3D基礎(chǔ)大模型,刷新多個SOTA!

CVer ? 來源:CVer ? 2024-01-30 15:56 ? 次閱讀

我們近期的工作:3D視覺大模型Uni3D在ICLR 2024的評審中獲得了688分,被選為Spotlight Presentation

02be4964-b8ed-11ee-8b88-92fbcf53809c.jpg

在本文中,我們第一次將3D基礎(chǔ)模型成功scale up到了十億(1B)級別參數(shù)量,并使用一個模型在諸多3D下游應(yīng)用中取得SoTA結(jié)果。代碼和各個scale的模型(從6M-1B)均已開源,歡迎大家關(guān)注和使用:

論文:https://https://arxiv.org/pdf/2310.06773

代碼:https://https://github.com/baaivision/Uni3D

02cb5d02-b8ed-11ee-8b88-92fbcf53809c.jpg

我們主要探索了3D視覺中scale up模型參數(shù)量和統(tǒng)一模型架構(gòu)的可能性。在NLP / 2D vision領(lǐng)域,scale up大模型(GPT-4,SAM,EVA等)已經(jīng)取得了很impressive的結(jié)果,但是在3D視覺中模型的scale up始終沒有成功。我們旨在將NLP/2D中scale up的成功復(fù)現(xiàn)到3D表征模型上。

02d03426-b8ed-11ee-8b88-92fbcf53809c.jpg

在這項工作中,我們提出了一個3D基礎(chǔ)大模型Uni3D,直接將3D backbone統(tǒng)一為ViT(Vision Transformer),以此利用豐富和強大的2D預(yù)訓(xùn)練大模型作為初始化。Uni3D使用CLIP模型中的文本/圖像表征作為訓(xùn)練目標(biāo),通過學(xué)習(xí)三個模態(tài)的表征對齊(點云-圖像-文本)實現(xiàn)3D點云對圖像和文本的感知。同時,通過使用ViT中成功的scale up策略,我們將Uni3D逐步 scale up,訓(xùn)練了從Tiny到giant的5個不同scale的Uni3D模型,成功地將Uni3D擴展到10億級別參數(shù)。

02df8750-b8ed-11ee-8b88-92fbcf53809c.jpg

Uni3D模型不同scale下的參數(shù)量和zero-shot分類結(jié)果

Uni3D在多個3D任務(wù)上達(dá)到SoTA,如:zero-shot classification, few-shot classification,open-world understanding, open-world part segmentation.

02f5e8f6-b8ed-11ee-8b88-92fbcf53809c.jpg

Zero-shot classification

030673b0-b8ed-11ee-8b88-92fbcf53809c.jpg

Real-world zero-shot recognition

由于學(xué)到了強大的多模態(tài)表征能力,Uni3D還能夠做一些有意思的應(yīng)用,如point cloud painting(點云繪畫),text/image-based 3D shape retrieval(基于圖像/文本的3D模型檢索),point cloud captioning(點云描述):

030d818c-b8ed-11ee-8b88-92fbcf53809c.jpg

Point cloud painting

03126e90-b8ed-11ee-8b88-92fbcf53809c.jpg

Image-based 3D shape retrieval

032b3eca-b8ed-11ee-8b88-92fbcf53809c.jpg

Text-based 3D shape retrieval

03421aaa-b8ed-11ee-8b88-92fbcf53809c.jpg

Point cloud captioning.

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 3D視覺
    +關(guān)注

    關(guān)注

    4

    文章

    431

    瀏覽量

    27520
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2423

    瀏覽量

    2640

原文標(biāo)題:ICLR 2024 | 高分工作!Uni3D:3D基礎(chǔ)大模型,刷新多個SOTA!

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    安寶特產(chǎn)品 安寶特3D Analyzer:智能的3D CAD高級分析工具

    安寶特3D Analyzer包含多種實用的3D CAD高級分析工具,包括自動比對模型、碰撞檢測、間隙檢查、壁厚檢查,以及拔模和底切分析,能夠有效提升3D CAD
    的頭像 發(fā)表于 08-07 10:13 ?372次閱讀
    安寶特產(chǎn)品  安寶特<b class='flag-5'>3D</b> Analyzer:智能的<b class='flag-5'>3D</b> CAD高級分析工具

    安寶特產(chǎn)品 3D Evolution : 基于特征實現(xiàn)無損CAD格式轉(zhuǎn)換

    安寶特3D Evolution具有強大的3D CAD模型轉(zhuǎn)換功能,可在保留模型特征參數(shù)、注釋、約束的前提下,完成不同格式3D CAD
    的頭像 發(fā)表于 08-06 17:26 ?328次閱讀
    安寶特產(chǎn)品   <b class='flag-5'>3D</b> Evolution : 基于特征實現(xiàn)無損CAD格式轉(zhuǎn)換

    歡創(chuàng)播報 騰訊元寶首發(fā)3D生成應(yīng)用

    App。 騰訊元寶APP發(fā)布時,就圍繞工作效率場景、日常生活等場景提供了豐富的應(yīng)用,并有創(chuàng)建個人智能體等個性化體驗,“3D角色夢工廠”則將大模型生成技術(shù)和3D應(yīng)用結(jié)合,進一步創(chuàng)新了元寶
    的頭像 發(fā)表于 07-18 11:39 ?752次閱讀
    歡創(chuàng)播報 騰訊元寶首發(fā)<b class='flag-5'>3D</b>生成應(yīng)用

    裸眼3D筆記本電腦——先進的光場裸眼3D技術(shù)

    隨著科技的不斷進步,裸眼3D技術(shù)已經(jīng)不再是科幻電影中的幻想。如今,英倫科技裸眼3D筆記本電腦將這一前沿科技帶到了我們的日常生活中。無論你是專業(yè)的3D模型設(shè)計師,還是希望在視頻播放和
    的頭像 發(fā)表于 07-16 10:04 ?516次閱讀

    奧比中光3D相機打造高質(zhì)量、低成本的3D動作捕捉與3D動畫內(nèi)容生成方案

    ? 在過去幾十年里,動作捕捉(MoCap)技術(shù)經(jīng)歷了顯著的發(fā)展,廣泛被應(yīng)用于電影、游戲、虛擬現(xiàn)實、醫(yī)療等多個領(lǐng)域。近期,奧比中光合作客戶Moverse使用Orbbec Femto系列3D相機,打造出
    的頭像 發(fā)表于 06-25 16:37 ?1067次閱讀

    3D建模的特點和優(yōu)勢都有哪些?

    的應(yīng)用。 特點: 1.三維模型化:3D建模允許用戶在虛擬空間內(nèi)創(chuàng)建具有長度、寬度和高度的物體,從而形成真實感十足的三維模型。 2.精確性:通過3D建模軟件,用戶可以精確地控制對象的尺寸
    的頭像 發(fā)表于 05-13 16:41 ?2396次閱讀

    ad19中3d模型不顯示?

    封裝庫導(dǎo)入3d模型不顯示,但導(dǎo)入3d模型后的封裝庫生成pcb文件時顯示3d模型,這是什么原因?qū)е?/div>
    發(fā)表于 04-24 13:41

    包含具有多種類型信息的3D模型

    Desktop是一個3D建模CAD程序,用于多種繪圖和設(shè)計,涵蓋建筑、土木和機械工程,以及室內(nèi)設(shè)計、產(chǎn)品設(shè)計、景觀建筑甚至游戲開發(fā)。它通常用于創(chuàng)建和編輯3D模型,同時提供與BIM工作
    發(fā)表于 03-28 17:18

    Stability AI推出全新Stable Video 3D模型

    近日,Stability AI 推出了全新的 Stable Video 3D 模型,該模型以其獨特的功能吸引了眾多關(guān)注。此模型具備從單張圖像中生成多視圖
    的頭像 發(fā)表于 03-22 10:30 ?832次閱讀

    Stability AI推出Stable Video 3D模型,可制作多視角3D視頻

    SV3D_u是Stable Video 3D的一個版本,僅需單幅圖片即可生成運動軌跡視頻,無須進行相機調(diào)整。擴充版本的SV3D_p加入了軌道視圖的特性,使其可以根據(jù)預(yù)設(shè)的相機路徑創(chuàng)建3D
    的頭像 發(fā)表于 03-21 14:57 ?1017次閱讀

    3D動畫原理:電阻

    電阻3D
    深圳崧皓電子
    發(fā)布于 :2024年03月19日 06:49:19

    Adobe提出DMV3D3D生成只需30秒!讓文本、圖像都動起來的新方法!

    因此,本文研究者的目標(biāo)是實現(xiàn)快速、逼真和通用的 3D 生成。為此,他們提出了 DMV3D。DMV3D 是一種全新的單階段的全類別擴散模型,能直接根據(jù)
    的頭像 發(fā)表于 01-30 16:20 ?850次閱讀
    Adobe提出DMV<b class='flag-5'>3D</b>:<b class='flag-5'>3D</b>生成只需30秒!讓文本、圖像都動起來的新方法!

    探索ICLR‘24 Spotlight中的首個十億級別3D通用大模型

    Uni3D在少樣本點云部件分割任務(wù)上也展示出了卓越的性能。下表結(jié)果顯示,在各種實驗條件下,Uni3D的性能都明顯優(yōu)于Point-BERT等基線方法。
    的頭像 發(fā)表于 01-25 10:10 ?491次閱讀
    探索ICLR‘24 Spotlight中的首個十億級別<b class='flag-5'>3D</b>通用大<b class='flag-5'>模型</b>

    友思特C系列3D相機:實時3D點云圖像

    3D相機
    虹科光電
    發(fā)布于 :2024年01月10日 17:39:25

    如何搞定自動駕駛3D目標(biāo)檢測!

    可用于自動駕駛場景下基于圖像的3D目標(biāo)檢測的數(shù)據(jù)集總結(jié)。其中一些數(shù)據(jù)集包括多個任務(wù),這里只報告了3D檢測基準(zhǔn)(例如KITTI 3D發(fā)布了超過40K的圖像,其中約15K用于
    發(fā)表于 01-05 10:43 ?580次閱讀
    如何搞定自動駕駛<b class='flag-5'>3D</b>目標(biāo)檢測!
    主站蜘蛛池模板: 精品无码久久久久久久久| 神马电影我不卡国语版 | 日韩精品卡1卡2三卡四卡乱码 | 动漫美女禁区图| 麻豆狠色伊人亚洲综合网站| 无码爽死成人777在线观看网站| 99国产精品| 久久成人免费观看草草影院| 无码人妻99久久密AV| 99视频精品在线| 久久热免费观看视频| 羞羞影院午夜男女爽爽免费| 爆操大胸美女| 男同志china免费视频| 一级做a爰片久久毛片一| 国产精品免费一区二区区| 青草在线在线d青草在线| 做暖免费观看日本| 精品夜夜澡人妻无码AV蜜桃| 小p孩玩成年女性啪啪资源| 99久久婷婷国产综合精品青草| 九九在线精品视频| 亚洲精品第二页| 国产精品久久久精品日日| 日韩精品特黄毛片免费看| 99在线免费视频| 嫩草AV久久伊人妇女| 1300部真实小Y女视频合集| 久久99AV无色码人妻蜜| 亚洲国产日韩a精品乱码| 国产麻豆剧果冻传媒免费网站| 日韩中文亚洲欧美视频二| WWW污污污抽搐喷潮COM| 免费国产成人| 66美女人体| 棉袜足j吐奶视频| 最近的2019中文字幕国语完整版 | 成人高清网站| 青青草干免费线观看| 阿v天堂2017在无码| 亲女乱h文小兰第一次|