色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一張照片定制自己的3D數字化身?

微軟科技 ? 來源:未知 ? 2023-03-22 00:15 ? 次閱讀

近日,由微軟亞洲研究院提出的 Roll-out Diffusion Network (RODIN) 模型,首次實現了利用生成擴散模型在 3D 訓練數據上自動生成 3D 數字化身(Avatar)的功能。僅需一張圖片甚至一句文字描述,RODIN 擴散模型就能秒級生成 3D 化身,讓低成本定制 3D 頭像成為可能,為 3D 內容創作領域打開了更多想象空間。相關論文“RODIN: A Generative Model for Sculpting 3D Digital Avatars Using Diffusion”已被 CVPR 2023 接收。

創建個性化的用戶形象在如今的數字世界中非常普遍,很多 3D 游戲都設有這一功能。然而在創建個人形象的過程中,繁瑣的細節調整常常讓人又愛又恨,有時候大費周章地選了與自己相似的眼睛、鼻子、發型、眼鏡等細節之后,卻發現拼接起來與自己仍大相徑庭。既然現在的 AI 技術已經可以生成惟妙惟肖的 2D 圖像,那么在 3D 世界中,我們是否可以擁有一個“AI 雕塑家”,僅通過一張照片就可以幫我們量身定制自己的 3D 數字化身呢?

微軟亞洲研究院新提出的 3D 生成擴散模型 Roll-out Diffusion Network (RODIN)可以輕松做到。讓我們先來看看 RODIN 的實力吧!

46e5c67a-c803-11ed-bfe3-dac502259ad0.png46ff09f0-c803-11ed-bfe3-dac502259ad0.jpg

(a) 給定的照片

47172904-c803-11ed-bfe3-dac502259ad0.gif

(b)生成的虛擬形象

圖1:給定一張照片,RODIN 模型即可生成虛擬形象

46e5c67a-c803-11ed-bfe3-dac502259ad0.png4768dab0-c803-11ed-bfe3-dac502259ad0.gif

(a)輸入文字“留卷發和大胡子穿著黑色皮夾克的男性”

48ebff20-c803-11ed-bfe3-dac502259ad0.gif

(b) 輸入文字“紅色衣著非洲發型的女性”

圖2:給定文本描述,RODIN 模型可直接生成虛擬形象

與傳統 3D 建模需要投入大量人力成本、制作過程繁瑣不同的是,RODIN 以底層思路的創新突破與精巧的模型設計,突破了二次元到三次元的結界,實現了只輸入一張圖片或一句文字就能在幾秒之內生成定制的 3D 數字化身的能力。在此之前,AI 生成技術還僅僅圍繞 2D 圖像進行創作,RODIN 模型的出現也將極大地推動 AI 在 3D 生成領域的進步。相關論文“RODIN: A Generative Model for Sculpting 3D Digital Avatars Using Diffusion”已被 CVPR 2023 接收。

論文鏈接:

RODIN: A Generative Model for Sculpting 3D Digital Avatars Using Diffusion

https://arxiv.org/abs/2212.06135

項目頁面:

https://3d-avatar-diffusion.microsoft.com

49452a8c-c803-11ed-bfe3-dac502259ad0.png

RODIN模型首次將

擴散模型應用于3D訓練數據

在 3D 生成領域,盡管此前有不少研究利用 GAN(生成對抗網絡)或 VAE(變分自動編碼器)技術,從大量 2D 圖像訓練數據中生成 3D 圖像,但結果卻不盡如人意,“兩面派”、“三頭哪吒”等抽象派 3D 圖像時有出現。科研人員們認為,造成這種現象的原因在于這些方法存在一個基礎的欠定(ill posed)問題,也就是說由于單視角圖片存在幾何二義性,從僅僅通過大量的 2D 數據很難學到高質量 3D 化身的合理分布,所以才造成了各種不完美的生成結果。

對此,微軟亞洲研究院的研究員們轉變思路,首次提出 3D Diffusion Model,利用擴散模型的表達能力來建模 3D 內容。這種方法通過多張視角圖來訓練 3D 模型,消除了歧義性、二義性所帶來的“四不象”結果,從而得到一個正確解,創建出更逼真的 3D 形象。

然而,要實現這種方法,還需要克服三個難題:

  • 首先,盡管擴散模型此前在 2D 內容生成上取得巨大成功,將其應用在 3D 數據上并沒有可參考的實踐方法和可遵循的前例。如何將擴散模型用于生成 3D 模型的多視角圖,是研究員們找到的關鍵切入點;

  • 其次,機器學習模型的訓練需要海量的數據,但一個多視圖、一致且多樣、高質量和大規模的 3D 圖像數據很難獲取,還存在隱私和版權等方面的風險。網絡公開的 3D 圖像又無法保證多視圖的一致性,且數據量也不足以支撐 3D 模型的訓練;

  • 第三,在機器上直接拓展 2D 擴散模型至 3D 生成,所需的內存存儲與計算開銷幾乎無法承受。

49452a8c-c803-11ed-bfe3-dac502259ad0.png

多項技術創新讓RODIN模型

以低成本生成高質量的3D圖像

為了解決上述難題,微軟亞洲研究院的研究員們創新地提出了 RODIN 擴散模型,并在實驗中取得了優異的效果,超越了現有模型的 SOTA 水平。

RODIN 模型采用神經輻射場(NeRF)方法,并借鑒英偉達的 EG3D 工作,將 3D 空間緊湊地表達為空間三個互相垂直的特征平面(Triplane),并將這些圖展開至單個 2D 特征平面中,再執行 3D 感知擴散。具體而言,就是將 3D 空間在橫、縱、垂三個正交平面視圖上以二維特征展開,這樣不僅可以讓 RODIN 模型使用高效的 2D 架構進行 3D 感知擴散,將三維圖像降維成二維圖像也大幅降低了計算復雜度和計算成本。

46e5c67a-c803-11ed-bfe3-dac502259ad0.png4980cb00-c803-11ed-bfe3-dac502259ad0.png

圖3:3D 感知卷積高效處理 3D 特征。(左圖) 用三平面(triplane)表達 3D 空間,此時底部特征平面的特征點對應于另外兩個特征平面的兩條線。(右圖)引入 3D 感知卷積處理展開的 2D 特征平面,同時考慮到三個平面的三維固有對應關系。

要實現 3D 圖像的生成需要三個關鍵要素:

  • 3D 感知卷積,確保降維后的三個平面的內在關聯。傳統 2D 擴散中使用的 2D 卷積神經網絡(CNN)并不能很好地處理 Triplane 特征圖。而 3D 感知卷積并不是簡單生成三個 2D 特征平面,而是在處理這樣的 3D 表達時,考慮了其固有的三維特性,即三個視圖平面中其中一個視圖的 2D 特征本質上是 3D 空間中一條直線的投影,因此與其他兩個平面中對應的直線投影特征存在關聯性。為了實現跨平面通信,研究員們在卷積中考慮了這樣的 3D 相關性,因此高效地用 2D 的方式合成 3D 細節。

  • 隱空間協奏三平面 3D 表達生成。研究員們通過隱向量來協調特征生成,使其在整個三維空間中具有全局一致性,從而獲得更高質量的化身并實現語義編輯,同時,還通過使用訓練數據集中的圖像訓練額外的圖像編碼器,該編碼器可提取語義隱向量作為擴散模型的條件輸入。這樣,整體的生成網絡可視為自動編碼器,用擴散模型作為解碼隱空間向量。對于語義可編輯性,研究員們采用了一個凍結的 CLIP 圖像編碼器,與文本提示共享隱空間。

  • 層級式合成,生成高保真立體細節。研究員們利用擴散模型先生成了一個低分辨率的三視圖平面(64×64),然后再通過擴散上采樣生成高分辨率的三平面(256×256)。這樣,基礎擴散模型集中于整體 3D 結構生成,而后續上采樣模型專注于細節生成。

46e5c67a-c803-11ed-bfe3-dac502259ad0.png49a95782-c803-11ed-bfe3-dac502259ad0.png

圖4:RODIN 模型概述

此外,在訓練數據集方面,研究員們借助開源的三維渲染軟件 Blender,通過隨機組合畫師手動創建的虛擬 3D 人物圖像,再加上從大量頭發、衣服、表情和配飾中隨機采樣,進而創建了10萬個合成個體,同時為每個個體渲染出了300個分辨率為256*256的多視圖圖像。在文本到 3D 頭像的生成上,研究員們采用了 LAION-400M數據集的人像子集訓練從輸入模態到 3D 擴散模型隱空間的映射,最終讓 RODIN 模型可以只使用一張 2D 圖像或一句文字描述就能創建出逼真的 3D 頭像。

46e5c67a-c803-11ed-bfe3-dac502259ad0.png49e4d758-c803-11ed-bfe3-dac502259ad0.gif

圖5:利用文字做 3D 肖像編輯

46e5c67a-c803-11ed-bfe3-dac502259ad0.png4b117a1e-c803-11ed-bfe3-dac502259ad0.gif

圖6:更多隨機生成的虛擬形象 (更多結果請點擊閱讀原文,移步項目網頁)

微軟亞洲研究院主管研究員張博表示,“此前,3D 領域的研究受限于技術或高成本,生成的 3D 結果主要是點云、體素、網格等形式的粗糙幾何體,而 RODIN 模型可創建出前所未有的 3D 細節,為 3D 內容生成研究打開了新的思路。我們希望 RODIN 模型在未來可以成為 3D 內容生成領域的基礎模型,為后續的學術研究和產業應用創造更多可能。”

49452a8c-c803-11ed-bfe3-dac502259ad0.png

讓3D內容生成

更個性、更普適

現如今,虛擬人、數字化身在電影、游戲、元宇宙、線上會議、電商等行業和場景中的需求日益增多,但其制作流程卻相當復雜專業,每個高質量的化身都必須由專業的 3D 畫師精心創作,尤其是在建模頭發和面部毛發時,甚至需要逐根繪制,其中的艱辛歷程外人難以想象。微軟亞洲研究院 RODIN 模型的快速生成能力,可以協助 3D 畫師減輕數字化身創作的工作量,提升效率,促進 3D 內容產業的發展。

目前,3D 真人化身的創建耗時耗力,很多項目背后可能都有一個上百人的團隊在做支持,實現方法更多的是借助虛幻引擎、游戲引擎,再加上畫師的專業繪畫能力,才能設計出高度逼真的真人定制 3D 化身,普通大眾很難使用這些服務,通常只能得到一些現成的、與本人毫無關連的化身。而 RODIN 模型低成本和可定制化的 3D 建模技術,兼具普適性和個性化,讓 3D 內容生成走向大眾成為可能。

劉潏

微軟亞洲研究院資深產品經理


盡管當前 RODIN 模型生成結果主要為半身的 3D 頭像,但是其技術能力并不僅限于 3D 頭像的生成。隨著包括花草樹木、建筑、汽車家居等更多類別和更大規模訓練數據的學習,RODIN 模型將能生成更多樣的 3D 圖像。下一步,微軟亞洲研究院的研究員們將用 RODIN 模型探索更多 3D 場景創建的可能,向一個模型生成 3D 萬物的終極目標不斷努力。

關注微軟科技視頻

了解更多科技前沿資訊

523f6710-c803-11ed-bfe3-dac502259ad0.png ? ?

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 微軟
    +關注

    關注

    4

    文章

    6600

    瀏覽量

    104119

原文標題:一張照片定制自己的3D數字化身?

文章出處:【微信號:mstech2014,微信公眾號:微軟科技】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    3D打印汽車零部件模型定制服務,多種材料、快速打印-CASAIM

    在汽車行業中,3D打印技術正以其獨特的優勢,推動著從設計到快速制造的革命性變化。3D打印技術不僅加快了原型制作的流程,還為最終零部件的生產提供了新的可能性。以下是CASAIM的3D打印汽車零部件模型
    的頭像 發表于 11-20 16:21 ?265次閱讀
    <b class='flag-5'>3D</b>打印汽車零部件模型<b class='flag-5'>定制</b>服務,多種材料、快速打印-CASAIM

    3D掃描與數字拓片:打造文化遺產的數字復本

    拓片作為種記錄和傳承傳統石刻文化的方式,承載了厚重的歷史文化信息。然而,傳統的拓片手段在文物保存和展示方面存在許多局限。隨著科技的進步,通過3D掃描制作數字拓片,不僅能夠精準采集石刻的每
    的頭像 發表于 10-31 17:22 ?207次閱讀
    <b class='flag-5'>3D</b>掃描與<b class='flag-5'>數字</b>拓片:打造文化遺產的<b class='flag-5'>數字</b>復本

    3D掃描技術醫療領域創新實踐,積木易搭3D掃描儀Mole助力定制個性化手臂康復輔具

    1、“3D掃描+3D打印”技術為矯形修復、醫療輔助器具定制等領域帶來突破性創新 近年來,隨著AI、大數據、3D掃描、3D打印、云計算、物聯網
    的頭像 發表于 10-31 11:25 ?239次閱讀
    <b class='flag-5'>3D</b>掃描技術醫療領域創新實踐,積木易搭<b class='flag-5'>3D</b>掃描儀Mole助力<b class='flag-5'>定制</b>個性化手臂康復輔具

    3D打印技術應用的未來

    3D打印技術作為種革命性的制造技術,正逐漸改變著傳統制造業的面貌。其通過數字化模型的逐層疊加,能夠制造出復雜形狀的物體,這種增材制造方式在多個領域展現出巨大的潛力和廣泛的應用前景。
    的頭像 發表于 10-25 09:28 ?628次閱讀

    發掘3D文件格式的無限潛力:打造沉浸式虛擬世界

    在當今數字化時代,3D技術的應用范圍日益廣泛,涵蓋電影后期制作、產品原型設計、虛擬現實(VR)、增強現實(AR)、游戲等眾多領域。而3D文件格式作為3D技術的核心組成部分,對于實現
    的頭像 發表于 09-26 18:14 ?1544次閱讀
    發掘<b class='flag-5'>3D</b>文件格式的無限潛力:打造沉浸式虛擬世界

    物聯網行業中的模具定制方案_3D打印材料選型分享

    3D打印材料介紹 3D打印技術是種快速制造技術,它可以將數字模型轉化為實體物體。3D打印材料是3D
    的頭像 發表于 09-25 10:59 ?346次閱讀
    物聯網行業中的模具<b class='flag-5'>定制</b>方案_<b class='flag-5'>3D</b>打印材料選型分享

    廣東三維掃描人物雕塑還原3D建模測繪數字化逆向工程服務-CASAIM

    3D數字化
    中科院廣州電子
    發布于 :2024年08月30日 09:47:50

    廣州三維掃描石雕獅子逆向設計3D數字化建模存檔-CASAIM

    3D數字化
    中科院廣州電子
    發布于 :2024年08月30日 09:39:39

    3D 建模:塑造未來的無限可能

    在當今數字化飛速發展的時代,3D 建模正以驚人的力量改變著我們的生活和工作方式。它不僅是項創新的技術,更是開啟未來之門的鑰匙。 3D或三維這個術語指的是三個空間維度:寬度、高度和深度
    的頭像 發表于 08-16 18:24 ?1577次閱讀

    掃描“紅色文物”,致敬崢嶸歲月 3D數字化助力文物保護與傳播

    報道了遵義會議紀念館文物數字化保護工程,思看科技有幸參與該項目的三維數字化采集工作,為大量館藏文物建立三維數字檔案。 3D掃描技術結合3D
    的頭像 發表于 08-01 20:26 ?275次閱讀
    掃描“紅色文物”,致敬崢嶸歲月  <b class='flag-5'>3D</b><b class='flag-5'>數字化</b>助力文物保護與傳播

    能源裝備數字化 3D掃描助力大型汽輪機鑄件余量檢測及精準劃線!

    數字中國”戰略正日益成為產業轉型升級的強大引擎。以數字化轉型為核心,驅動能源行業向低碳、綠色、高質量發展,既是當務之急,也是大勢所趨。將3D數字化技術引入能源行業裝備制造各個環節,能
    的頭像 發表于 07-30 11:36 ?271次閱讀
    能源裝備<b class='flag-5'>數字化</b>  <b class='flag-5'>3D</b>掃描助力大型汽輪機鑄件余量檢測及精準劃線!

    歡創播報 騰訊元寶首發3D生成應用

    1 騰訊元寶首發3D生成應用 只需一張照片,便能迅速打造獨無二的3D角色。7月16日,騰訊旗下大模型應用“騰訊元寶”上線了“3D角色夢工廠
    的頭像 發表于 07-18 11:39 ?759次閱讀
    歡創播報 騰訊元寶首發<b class='flag-5'>3D</b>生成應用

    裸眼3D相框——不樣的智能相框

    在科技的快速發展下,我們的生活正在逐漸變得豐富多彩。傳統的2D照片已經無法滿足我們對于美好記憶的追求,而裸眼3D技術的出現,讓我們有機會將回憶變得更加立體、生動。今天,我要向大家介紹
    的頭像 發表于 05-31 11:40 ?420次閱讀
    裸眼<b class='flag-5'>3D</b>相框——不<b class='flag-5'>一</b>樣的智能相框

    2圖2秒鐘完成3D建模!3D內容生成工具DUSt3R爆火,國產廠商有哪些機會?

    電子發燒友網報道(文/吳子鵬)近日,款名為DUSt3R的AI新工具在GitHub上爆火。DUSt3R能夠在短短2秒鐘內通過僅有2圖片完成3D
    的頭像 發表于 03-06 00:10 ?4089次閱讀
    2<b class='flag-5'>張</b>圖2秒鐘完成<b class='flag-5'>3D</b>建模!<b class='flag-5'>3D</b>內容生成工具DUSt<b class='flag-5'>3</b>R爆火,國產廠商有哪些機會?

    泰來三維| 高精度工業3D掃描助力模具檢測和逆向設計“數字化”發展

    相應的,產品所需的模具結構也變得愈發復雜精密,傳統檢測方式和測繪工具很難滿足些最新需求。高精度工業3D掃描技術的出現,通過獲取工件完整的三維數據,為模具檢測和逆向設計提供“數字化”破局之法。高精度
    的頭像 發表于 01-29 16:22 ?491次閱讀
    泰來三維| 高精度工業<b class='flag-5'>3D</b>掃描助力模具檢測和逆向設計“<b class='flag-5'>數字化</b>”發展
    主站蜘蛛池模板: 亚洲va久久久久| 美国色情三级欧美三级纸匠情挑| 性女传奇快播| 毛茸茸womansex| 国产人妻精品久久久久久很牛| 99精品国产免费观看视频| 亚洲成人欧美| 日韩1区1区产品乱码芒果榴莲| 久久综合久久伊人| 国产午夜理论片YY8840Y| 草柳最新地址| 55夜色66夜亚洲精品播放| 亚洲青青草原| 偷窥自拍性综合图区| 欧美色图14p| 免费成人高清在线视频| 精品国产乱码久久久人妻| 妇少水多18P蜜泬17P亚洲乱 | 精品久久伊人| 国产乱码一区二区三区| 成人免费小视频| 99re8久久热在线视频| 在线观看免费国产成人软件| 亚洲精品国偷拍自产在线| 偷偷要色偷偷| 肉多的小说腐小说| 日本调教网站| 人人草人人草| 欧美日韩亚洲综合2019| 美国色吧影院| 美女靠逼漫画| 蜜桃传媒在线播放| 久热在线这里只有精品7 | 国产精品久久久亚洲偷窥女厕 | 黑人干亚洲人| 果冻传媒色AV国产播放| 国产精一品亚洲二区在线播放| 国产 交换 丝雨 巅峰| 处初女处夜情视频在线播放| ZZoo兽2皇| 成人毛片免费播放|