色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一種「個性化」的文本到圖像擴散模型 DreamBooth

CVer ? 來源:機器之心 ? 作者:機器之心 ? 2022-11-14 15:11 ? 次閱讀

來自谷歌和波士頓大學的研究者提出了一種「個性化」的文本到圖像擴散模型 DreamBooth,能夠適應用戶特定的圖像生成需求。

近來,文本到圖像模型成為一個熱門的研究方向,無論是自然景觀大片,還是新奇的場景圖像,都可能使用簡單的文本描述自動生成的。

其中,渲染天馬行空的的想象場景是一項具有挑戰性的任務,需要在新的場景中合成特定主題(物體、動物等)的實例,以便它們自然無縫地融入場景。

一些大型文本到圖像模型基于用自然語言編寫的文本提示(prompt)實現了高質量和多樣化的圖像合成。這些模型的主要優點是從大量的圖像 - 文本描述對中學到強大的語義先驗,例如將「dog」這個詞與可以在圖像中以不同姿勢出現的各種狗的實例關聯在一起。

雖然這些模型的合成能力是前所未有的,但它們缺乏模仿給定參考主題的能力,以及在不同場景中合成主題相同、實例不同的新圖像的能力。可見,已有模型的輸出域的表達能力有限。

dc9e274e-636c-11ed-8abf-dac502259ad0.png

為了解決這個問題,來自谷歌和波士頓大學的研究者提出了一種「個性化」的文本到圖像擴散模型 DreamBooth,能夠適應用戶特定的圖像生成需求。

dcf735a0-636c-11ed-8abf-dac502259ad0.png

論文地址:https://arxiv.org/abs/2208.12242

項目地址:https://github.com/XavierXiao/Dreambooth-Stable-Diffusion

該研究的目標是擴展模型的語言 - 視覺字典,使其將新詞匯與用戶想要生成的特定主題綁定。一旦新字典嵌入到模型中,它就可以使用這些詞來合成特定主題的新穎逼真的圖像,同時在不同的場景中進行情境化,保留關鍵識別特征,效果如下圖 1 所示。

dd172b76-636c-11ed-8abf-dac502259ad0.png

具體來說,該研究將給定主題的圖像植入模型的輸出域,以便可以使用唯一標識符對其進行合成。為此,該研究提出了一種用稀有 token 標識符表示給定主題的方法,并微調了一個預訓練的、基于擴散的文本到圖像框架,該框架分兩步運行;從文本生成低分辨率圖像,然后應用超分辨率(SR)擴散模型。

首先該研究使用包含唯一標識符(帶有主題類名,例如「A [V] dog」)的輸入圖像和文本提示微調低分辨率文本到圖像模型。為了防止模型將類名與特定實例過擬合和語義漂移,該研究提出了一種自生的、特定于類的先驗保存(preservation)損失,它利用嵌入模型中類的先驗語義,鼓勵模型生成給定主題下同一類中的不同實例。

第二步,該研究使用輸入圖像的低分辨率和高分辨率版本對超分辨率組件進行微調。這允許模型對場景主題中小而重要細節保持高保真度。

我們來看一下該研究提出的具體方法。

方法介紹

給定 3-5 張捕獲的圖像,這些圖像沒有文字描述,本文旨在生成具有高細節保真度和由文本提示引導變化的新圖像。該研究不對輸入圖像施加任何限制,并且主題圖像可以具有不同的上下文。方法如圖 3 所示。輸出圖像可對原始圖像進行修改,如主題的位置,更改主題的屬性如顏色、形狀,并可以修改主體的姿勢、表情、材質以及其他語義修改。

更具體的說,本文方法將一個主題(例如,一只特定的狗)和相應類名(例如,狗類別)的一些圖像(通常 3 - 5 張圖)作為輸入,并返回一個經過微調 / 個性化的文本到圖像模型,該模型編碼了一個引用主題的唯一標識符。然后,在推理時,可以在不同的句子中植入唯一標識符來合成不同語境中的主題。

dd7a6d9e-636c-11ed-8abf-dac502259ad0.png

該研究的第一個任務是將主題實例植入到模型的輸出域,并將主題與唯一標識符綁定。該研究提出了設計標識符的方法,此外還設計了一種監督模型微調過程的新方法。

為了解決圖像過擬合以及語言漂移問題,該研究還提出了一種損失( Prior-Preservation Loss ),通過鼓勵擴散模型不斷生成與主題相同的類的不同實例,從而減輕模型過擬合、語言漂移等問題。

為了保留圖像細節,該研究發現應該對模型的超分辨率(SR)組件進行微調,本文在經過預訓練的 Imagen 模型的基礎上來完成。具體過程如圖 4 所示,給定同一主題的 3-5 張圖像,之后通過兩個步驟微調文本到圖像的擴散模型:

ddc37d68-636c-11ed-8abf-dac502259ad0.png

稀有 token 標識符表示主題

該研究將主題的所有輸入圖像標記為「a [identifier] [class noun]」,其中 [identifier] 是鏈接到主題的唯一標識符,而 [class noun] 是主題的粗略類別描述符 (例如貓、狗、手表等)。該研究在句子中特別使用了類描述符,以便將類的先驗與主題聯系起來。

效果展示

下面是 Dreambooth 一個穩定擴散的實現(參考項目鏈接)。定性結果:訓練圖像來自「Textual Inversion」庫:

de33066a-636c-11ed-8abf-dac502259ad0.jpg

訓練完成后,在「photo of a sks container」提示下,模型生成的集裝箱照片如下:

de5d67fc-636c-11ed-8abf-dac502259ad0.png

在提示中加個位置「photo of a sks container on the beach」,集裝箱出現在沙灘上;

de843bd4-636c-11ed-8abf-dac502259ad0.png

綠色的集裝箱顏色太單一了,想加點紅色,輸入提示「photo of a red sks container」就能搞定:

df404126-636c-11ed-8abf-dac502259ad0.png

輸入提示「a dog on top of sks container」就能讓小狗坐在箱子里:

df684b8a-636c-11ed-8abf-dac502259ad0.png

下面是論文中展示的一些結果。生成不同畫家風格的關于狗狗的藝術圖:

df943bdc-636c-11ed-8abf-dac502259ad0.png

該研究還可以合成輸入圖像中沒有出現的各種表情,展示了模型的外推能力:

dfcd19a2-636c-11ed-8abf-dac502259ad0.png

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 圖像
    +關注

    關注

    2

    文章

    1085

    瀏覽量

    40486
  • 模型
    +關注

    關注

    1

    文章

    3253

    瀏覽量

    48874

原文標題:谷歌提出DreamBooth:新擴散模型!只需3張圖一句話,AI就能定制照片級圖像!

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    ComplexHeatmap包:個性化熱圖繪制利器

    雕琢。 官方介紹網站: https://jokergoo.github.io/ComplexHeatmap-reference/book/ 下面來介紹幾個簡單又實用的個性化調整: 可指定分群數,對熱圖
    的頭像 發表于 12-31 11:17 ?61次閱讀
    ComplexHeatmap包:<b class='flag-5'>個性化</b>熱圖繪制利器

    【「具身智能機器人系統」閱讀體驗】2.具身智能機器人大模型

    中取得了令人矚目的效果。 閱讀感悟 從傳統的手動編程借助大模型實現智能、自主,從單模態的交互
    發表于 12-29 23:04

    【「大模型啟示錄」閱讀體驗】營銷領域大模型的應用

    解目標市場,從而制定更有效的營銷策略。 大模型擅長分析,可以非常好的提煉IP,為決策者提供輔助參考。 基于消費者的歷史數據和行為模式,大模型能夠提供個性化的產品或服務推薦。這種個性化
    發表于 12-24 12:48

    語音芯片賦能可穿戴設備:開啟個性化音頻新體驗

    語音芯片與可穿戴設備合作,帶來定制音效、智能降噪、個性化推薦、語音交互及跨設備共享等,引領個性化音頻時代,提升用戶聽覺體驗。
    的頭像 發表于 12-14 15:44 ?438次閱讀

    智慧路燈照明管理系統,呈現個性化城市照明效果

    【智慧城市】智慧路燈照明管理系統,呈現個性化城市照明效果
    的頭像 發表于 10-28 14:39 ?339次閱讀
    智慧路燈照明管理系統,呈現<b class='flag-5'>個性化</b>城市照明效果

    擴散模型的理論基礎

    擴散模型的迅速崛起是過去幾年機器學習領域最大的發展之。在這本簡單易懂的指南中,學習你需要知道的關于擴散模型
    的頭像 發表于 10-28 09:30 ?446次閱讀
    <b class='flag-5'>擴散</b><b class='flag-5'>模型</b>的理論基礎

    以AI破解個性化客服難題

    文匯集多個行業借助 AI 實現的個性化客服實踐
    的頭像 發表于 10-25 09:06 ?1892次閱讀
    以AI破解<b class='flag-5'>個性化</b>客服難題

    iPadOS 18悄然升級Apple Music體驗,個性化標簽欄成亮點

    在8月29日揭曉的iPadOS 18更新中,盡管并未涌現大量專為iPad設計的獨家功能,但項針對Apple Music的細致優化——自定義標簽欄功能,卻極大地提升了iPad用戶的個性化體驗。這改動雖看似細微,實則蘊含了巨大的
    的頭像 發表于 08-29 16:10 ?369次閱讀

    Meta發布Imagine Yourself AI模型,重塑個性化圖像生成未來

    Meta公司近日在人工智能領域邁出了重要步,隆重推出了其創新之作——“Imagine Yourself”AI模型,這突破性技術為個性化圖像
    的頭像 發表于 08-26 10:59 ?522次閱讀

    Whatsapp正在開發一種新的生成人工智能功能

    據悉,Whatsapp正在開發一種新的生成人工智能功能,該功能應允許用戶制作自己的個性化頭像,用于任何想象中的場景。WABetaInfo在新的Android版WhatsApp測試版2.24.14.7
    的頭像 發表于 07-14 17:50 ?1007次閱讀

    rup是一種什么模型

    RUP(Rational Unified Process,統建模語言)是一種軟件開發過程模型,它是一種迭代和增量的軟件開發方法。RUP是由Rational Software公司(現為
    的頭像 發表于 07-09 10:13 ?1293次閱讀

    亞馬遜推出個性化AI歌單功能Maestro,進軍音樂市場

    據亞馬遜公司透露,其音樂應用程序 Amazon Music 已開始向少量美國用戶推出 AI 生成歌單功能 Maestro 的測試版服務。這項服務允許用戶利用多樣的提示信息(如文本、表情符號及其組合等),迅速生成個性化的歌單。
    的頭像 發表于 04-17 16:48 ?624次閱讀

    激光打標機:精準定位,實現個性化標識需求

    激光打標機:精準定位,實現個性化標識需求激光打標機,以其精準定位的特性,成為實現個性化標識需求的得力工具。在現代制造業中,個性化標識已成為產品差異化、品牌塑造和提升附加值的重要手段。激光打標機通過其
    的頭像 發表于 03-19 19:43 ?516次閱讀
    激光打標機:精準定位,實現<b class='flag-5'>個性化</b>標識需求

    打造專屬高清視頻轉換器:滿足個性化視頻轉換需求

    轉換器成為了個理想的選擇。 個性化需求滿足 每個人都有自己特定的視頻轉換需求。有些人可能經常需要將某種特定格式的視頻轉換為另一種格式,而有些人可能希望添加特定的轉換參數或功能。通過定制高清視頻轉換器,用戶可以
    的頭像 發表于 02-22 14:29 ?320次閱讀

    個性化定制,提升運營效率:SAP二次開發引領企業數字轉型

    的解決方案,助力其實現數字轉型,提高運營效率,迎接不斷變化的業務需求。 提升企業運營效率,打造個性化管理工具 SAP二次開發服務可以根據企業的特定需求,深入定制現有的SAP系統,為企業提供個性化的管理工具。無論是針對業務流程的
    的頭像 發表于 02-18 13:29 ?435次閱讀
    主站蜘蛛池模板: 亚洲欭美日韩颜射在线二| 成人影片大全| 好大太快了快插穿子宫了| 亚洲国产中文字幕新在线| 国产在线不卡| 伊人影院网| 欧美双拳极限扩张| 国产免费毛片在线观看| 又爽又黄又粗又大免费视频| 免费看到湿的小黄文软件APP| 高清撒尿hdtube撒尿| 亚洲精品国产专区91在线| 美女的jj| 国产精品路线1路线2路线| 制服的微热| 上课失禁丨vk| 久久毛片基地| 福利视频一二三在线观看| 亚洲午夜精品久久久久久抢| 欧美手机在线播放| 解开美女胸衣2破解版| ppypp日本欧美一区二区| 亚洲绝美精品一区二区| 欧美成 人 网 站 免费| 国产午夜一区二区三区免费视频| 18 japanese宾馆直播| 午夜小视频免费观看| 欧美 亚洲 日韩 中文2019 | 69xx欧美| 亚洲AV久久无码高潮喷水 | 狠狠色狠狠色综合日日小说| a免费视频| 艳照门在线观看| 色欲人妻无码AV专区| 美国色情三级欧美三级纸匠情挑| 国产精品亚洲精品久久国语| jizz黑丝| 777米奇影院第七色色| 亚洲人精品午夜射精日韩| 肉色无边(高h)| 免费精品国产人妻国语麻豆|