色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Stable Diffusion采樣速度翻倍!僅需10到25步的擴散模型采樣算法

智能感知與物聯網技術研究所 ? 來源:智能感知與物聯網技術研 ? 作者:智能感知與物聯網 ? 2022-11-21 11:55 ? 次閱讀

清華大學計算機系朱軍教授帶領的 TSAIL 團隊提出 DPM-Solver(NeurIPS 2022 Oral,約前 1.7%)和 DPM-Solver++,將擴散模型的快速采樣算法提升到了極致:無需額外訓練,僅需 10 到 25 步就可以獲得極高質量的采樣。

要說 AI 領域今年影響力最大的進展,爆火的 AI 作圖絕對是其中之一。設計者只需要輸入對圖片的文字描述,就可以由 AI 生成一張質量極高的高分辨率圖片。目前,使用范圍最廣的當屬 StabilityAI 的開源模型 Stable Diffusion,模型一經開源就在社區引起了廣泛的討論。

然而,擴散模型在使用上最大的問題就是其極慢的采樣速度。模型采樣需要從純噪聲圖片出發,一步一步不斷地去噪,最終得到清晰的圖片。在這個過程中,模型必須串行地計算至少 50 到 100 步才可以獲得較高質量的圖片,這導致生成一張圖片需要的時間是其它深度生成模型的 50 到 100 倍,極大地限制了模型的部署和落地。

為了加速擴散模型的采樣,許多研究者從硬件優化的角度出發,例如 Google 使用 JAX 語言將模型編譯運行在 TPU 上,OneFlow 團隊 [1] 使用自研編譯器將 Stable Diffusion 做到了“一秒出圖”。這些方法都基于 50 步的采樣算法 PNDM[2],該算法在步數減少時采樣效果會急劇下降。

就在幾天前,這一紀錄又被刷新了!Stable Diffusion 的官方 Demo[3]更新顯示,采樣 8 張圖片的時間從原來的 8 秒鐘直接被縮短至了 4 秒鐘!快了整整一倍!

9575e1e4-68e0-11ed-8abf-dac502259ad0.png

而基于自研深度學習編譯器技術的 OneFlow 團隊更是在不降低采樣效果的前提下,成功將之前的 “一秒出圖” 縮短到了 “半秒出圖”!在 GPU 上僅僅使用不到 0.5 秒就可以獲得一張高清的圖片!相關工作已經發布在[1] 中。

事實上,這些工作的核心驅動力都來自于清華大學朱軍教授帶領的 TSAIL 團隊所提出的DPM-Solver,一種針對于擴散模型特殊設計的高效求解器:該算法無需任何額外訓練,同時適用于離散時間與連續時間的擴散模型,可以在 20 到 25 步內幾乎收斂,并且只用 10 到 15 步也能獲得非常高質量的采樣。在 Stable Diffusion 上,25 步的 DPM-Solver 就可以獲得優于 50 步 PNDM 的采樣質量,因此采樣速度直接翻倍!

項目鏈接:

DPM-Solver: A Fast ODE Solver for Diffusion Probabilistic Model Sampling in Around 10 Steps:https://arxiv.org/abs/2206.00927(NeurIPS 2022 Oral)

DPM-Solver++: Fast Solver for Guided Sampling of Diffusion Probabilistic Models:https://arxiv.org/abs/2211.01095

項目開源代碼:https://github.com/LuChengTHU/dpm-solver

項目在線 Demo:https://huggingface.co/spaces/LuChengTHU/dpmsolver_sdm

擴散模型的定義與采樣方法

擴散模型通過定義一個不斷加噪聲的前向過程來將圖片逐步變為高斯噪聲,再通過定義了一個逆向過程將高斯噪聲逐步去噪變為清晰圖片以得到采樣:

9596931c-68e0-11ed-8abf-dac502259ad0.png

在采樣過程中,根據是否添加額外的噪聲,可以將擴散模型分為兩類:一類是擴散隨機微分方程模型(Diffusion SDE),另一類是擴散常微分方程(Diffusion ODE)。兩種模型的訓練目標函數都一樣,通過最小化與噪聲的均方誤差來訓練一個“噪聲預測網絡”:

95a8fab6-68e0-11ed-8abf-dac502259ad0.png

基于 Diffusion SDE 的采樣過程可以視為離散化如下隨機微分方程:

95bb02c4-68e0-11ed-8abf-dac502259ad0.png

并且 [4] 中證明,DDPM[5] 是對上述 SDE 的一階離散化。

而基于 Diffusion ODE 的采樣過程可以視為離散化如下常微分方程:

95cb322a-68e0-11ed-8abf-dac502259ad0.png

并且 [6] 中證明,DDIM[7]是對上述 ODE 的一階離散化。

然而,這些一階的離散化方法收斂速度極慢,擴散模型的采樣通常需要 100 到 1000 次串行計算才可以得到高質量的圖片。通常情況下,為了加速擴散模型的采樣,研究者往往通過對 Diffusion ODE 使用高階求解器來進行加速,例如經典的 Runge-Kutta 方法(RK45),這是因為 ODE 不會帶來額外的隨機性,離散化步長可以相對選取得更大一些。在給定 s 時刻的解后,Runge-Kutta 方法基于離散化如下積分:

95dadee6-68e0-11ed-8abf-dac502259ad0.png

這樣的離散化將 Diffusion ODE 整體看做一個黑盒,損失了 ODE 的已知信息,在小于 50 步的情況下就難以收斂了。

DPM-Solver:專為擴散模型設計的求解器

DPM-Solver 基于 Diffusion ODE 的半線性(semi-linear)結構,通過精確且解析地計算 ODE 中的線性項,我們可以得到:

95ec8fec-68e0-11ed-8abf-dac502259ad0.png

剩余的積分項是一個關于時間的復雜的積分。然而,DPM-Solver 的提出者發現,該積分可以通過對 log-SNR(對數信噪比)做換元后得到一個非常簡單的形式:

96082ec8-68e0-11ed-8abf-dac502259ad0.png

剩余的積分是一個關于噪聲預測模型的指數積分(exponentially weighted integral)。通過對噪聲預測模型做泰勒展開,我們可以得到該積分的一個估計:

9619a540-68e0-11ed-8abf-dac502259ad0.png

該估計中存在兩項:一項是全導數部分(向量),另一項是系數部分(標量)。DPM-Solver 的另一個核心貢獻是,該系數可以通過分部積分被解析地計算:

962ae364-68e0-11ed-8abf-dac502259ad0.png

而剩余的全導數部分則可以通過傳統 ODE 求解器的數值方法來近似估計(無需任何求導運算):

9661a340-68e0-11ed-8abf-dac502259ad0.png

基于以上 4 點,DPM-Solver 做到了盡可能地準確計算所有已知項,只對神經網絡部分做近似,因此最大程度地減小了離散化誤差:

966eb1d4-68e0-11ed-8abf-dac502259ad0.png

此外,基于該推導,我們可以得到 DDIM 本質上是 DPM-Solver 的一階形式,這也能解釋為什么 DDIM 在步數較少時依然可以獲得很好的加速效果:

967fe9fe-68e0-11ed-8abf-dac502259ad0.png

在實驗中,DPM-Solver 獲得了遠超其它采樣算法的加速效果,僅僅在 15-20 步就幾乎可以收斂:

96956df6-68e0-11ed-8abf-dac502259ad0.png

并且在論文中定量的結果顯示,DPM-Solver 引入的額外計算量完全可以忽略,即對于步數的加速效果直接正比于時間上的加速效果——因此,基于 25 步的 DPM-Solver,Stable-Diffusion 模型的采樣速度直接翻倍!例如,下圖展示了不同采樣算法在 Stable-Diffusion 上隨著步數變化的效果,可見 DPM-Solver 在 10 到 15 步就可以獲得非常高質量的采樣:

96afc732-68e0-11ed-8abf-dac502259ad0.png

使用 DPM-Solver

DPM-Solver 的使用非常簡單,既可以基于作者提供的官方代碼,也可以使用主流的 Diffusers 庫。例如,基于作者提供的官方代碼(https://github.com/LuChengTHU/dpm-solver),只需要 3 行:

96c72aee-68e0-11ed-8abf-dac502259ad0.png

官方代碼對 4 種擴散模型都進行了支持:

96d330fa-68e0-11ed-8abf-dac502259ad0.png

并且同時支持 unconditional sampling、classifier guidance 和 classifier-free guidance:

96e60f0e-68e0-11ed-8abf-dac502259ad0.png

而基于 Diffusers 庫的 DPM-Solver 同樣很簡單,只需要定義 scheduler 即可:

96f3548e-68e0-11ed-8abf-dac502259ad0.png

此外,作者團隊還提供了一個在線 Demo:https://huggingface.co/spaces/LuChengTHU/dpmsolver_sdm

下圖是 15 步的例子,可以看到圖像質量已經非常高:

9703f2a8-68e0-11ed-8abf-dac502259ad0.png

相信基于 DPM-Solver,擴散模型的采樣速度將不再是瓶頸。

關于作者

DPM-Solver 論文一作是來自清華大學 TSAIL 團隊的路橙博士,他在知乎上關于擴散模型的討論中也寫了一篇關于擴散模型原理的入門介紹,目前已有 2000 + 贊:https://www.zhihu.com/question/536012286/answer/2533146567

清華大學 TSAIL 團隊長期致力于貝葉斯機器學習的理論和算法研究,是國際上最早研究深度概率生成模型的團隊之一,在貝葉斯模型、高效算法和概率編程庫方面取得了系統深入的研究成果。團隊另一位博士生鮑凡提出Analytic-DPM [8][9],為擴散模型的最優均值和方差給出了簡單、令人吃驚的解析形式,獲得 ICLR 2022 Outstanding Paper Award。在概率編程方面,機器之心早在 2017 年就報道了該團隊發布的 “ZhuSuan” 深度概率編程庫(https://zhusuan.readthedocs.io/en/latest/)[10],是國際上最早的面向深度概率模型的編程庫之一。另外,值得一提的是,擴散概率模型的兩位核心作者宋飏和宋佳銘,本科時均在朱軍教授的指導下做科研訓練,后來都去了斯坦福大學讀博士。論文的合作者周聿浩、陳鍵飛、李崇軒,也是TSAIL組培養的優秀博士生,周聿浩為在讀,陳鍵飛和李崇軒分別在清華大學計算機系、人民大學高瓴人工智能學院任教。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4620

    瀏覽量

    93041
  • 模型
    +關注

    關注

    1

    文章

    3260

    瀏覽量

    48910
  • 深度學習
    +關注

    關注

    73

    文章

    5507

    瀏覽量

    121266

原文標題:Stable Diffusion采樣速度翻倍!僅需10到25步的擴散模型采樣算法

文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯網技術研究所】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    AFE4400將占空設置為25%以下時,采樣率該如何計算?

    1、 術手冊中有關ADC采樣頻率的說明,在第10頁中說采樣率為4*PRF 而在第40頁中關于ADC Data的中可以采樣率為16*PRF 但是如果我將占空設置為
    發表于 12-31 07:18

    AMC1304M25采樣電機相電流時候的采樣電阻如何計算?

    電機一般啟動電流會比額定電流大4~7倍,那選取相電流采樣電阻的時候應該得按照“AMC1304M25量程(250mv)/啟動電流”來計算采樣電阻吧。如果按照額定電流來選取采樣電阻那開機
    發表于 12-27 08:04

    關于ADS1299采樣速度的疑問求解答

    在ADS1299的datasheet上面,關于采樣速度的說明是:250sps~16Ksps。現在想問一個問題。16Ksps的采樣速度,是單個通道采集是能達到16ksps的
    發表于 12-13 07:01

    如何開啟Stable Diffusion WebUI模型推理部署

    如何開啟Stable Diffusion WebUI模型推理部署
    的頭像 發表于 12-11 20:13 ?121次閱讀
    如何開啟<b class='flag-5'>Stable</b> <b class='flag-5'>Diffusion</b> WebUI<b class='flag-5'>模型</b>推理部署

    ADS125H02采樣速度很慢怎么解決?

    ADS125H02采樣速度很慢,配置寄存器為4800sps,濾波器使用sinc1 mode1_delay設置為1160us,采樣一個外部模擬開關切換控制的多路電壓信號,在MCU控制電路切換之后
    發表于 11-29 07:24

    浙大、微信提出精確反演采樣器新范式,徹底解決擴散模型反演問題

    。當前的采樣器不能兼顧反演的準確性和采樣的質量。 為徹底解決這一問題,微信視覺團隊與浙江大學和清華大學聯手提出了基于雙向顯式線性多步法的擴散模型精確反演
    的頭像 發表于 11-27 09:21 ?199次閱讀
    浙大、微信提出精確反演<b class='flag-5'>采樣</b>器新范式,徹底解決<b class='flag-5'>擴散</b><b class='flag-5'>模型</b>反演問題

    電流采樣與運放電路分享

    1.電流采樣方案 1.1.不同數量的采樣電阻方案 電流采樣是FOC中基礎且重要的一個步驟,只有電流采樣準確了整個算法才能獲得好的效果。電流
    的頭像 發表于 11-19 09:31 ?811次閱讀

    STM32的ADC采樣及各式濾波算法實現

    本文為手把手教學ADC采樣及各式濾波算法的教程,本教程的MCU采用STM32F103ZET6。以HAL庫的ADC采樣函數為基礎進行教學,通過各式常見濾波的實驗結果進行分析對比,搭配VOFA+工具直觀的展示濾波效果。
    的頭像 發表于 10-28 10:51 ?2614次閱讀
    STM32的ADC<b class='flag-5'>采樣</b>及各式濾波<b class='flag-5'>算法</b>實現

    高邊電流采樣與低變電流采樣區別

    高邊電流采樣與低邊電流采樣是電流檢測中的兩種基本方式,它們在電路結構、應用場景、性能特點等方面存在顯著差異。 一、電路結構差異 高邊電流采樣 定義 :高邊電流采樣指的是
    的頭像 發表于 10-14 17:46 ?1634次閱讀

    電流采樣電阻的采樣原理

    電流采樣電阻的采樣原理主要基于歐姆定律,即電阻上的電壓降與通過該電阻的電流成正比,其關系可以表示為V=I*R,其中V是電阻兩端的電壓,I是通過電阻的電流,R是電阻的阻值。以下是電流采樣電阻采樣
    的頭像 發表于 08-27 10:03 ?1363次閱讀

    聲發射系統的技術指標:最高采樣速度的選擇

    采樣速度10兆則高5倍,都會給硬件軟件還有體積帶來很多倍的增加。如果采樣速度無限,增加的數
    的頭像 發表于 08-26 17:30 ?361次閱讀
    聲發射系統的技術指標:最高<b class='flag-5'>采樣</b><b class='flag-5'>速度</b>的選擇

    信號采樣算法原理是什么

    信號采樣是一種將連續信號轉換為離散信號的過程,它是數字信號處理的基礎。本文將詳細介紹信號采樣算法原理,包括采樣過程、采樣定理、
    的頭像 發表于 07-15 14:20 ?910次閱讀

    OpenAI視頻模型Sora的架構及應用場景

    LDM 就是 Stable Diffusion 使用的模型架構。擴散模型的一大問題是計算需求大,難以擬合高分辨率圖像。為了解決這一問題,實現
    發表于 02-20 15:13 ?655次閱讀
    OpenAI視頻<b class='flag-5'>模型</b>Sora的架構及應用場景

    Stability AI試圖通過新的圖像生成人工智能模型保持領先地位

    Stability AI的最新圖像生成模型Stable Cascade承諾比其業界領先的前身Stable Diffusion更快、更強大,而Stab
    的頭像 發表于 02-19 16:03 ?957次閱讀
    Stability AI試圖通過新的圖像生成人工智能<b class='flag-5'>模型</b>保持領先地位

    用tc234的ADC示例程序進行采樣,如何提高ADC采樣速度

    我現在用tc234的ADC示例程序進行采樣采樣時間設置的是1us,但是現在采樣一個通道需要花費40us左右,請問需要設置哪個寄存器才能提高采樣速度
    發表于 02-18 08:11
    主站蜘蛛池模板: 成3d漫二区三区四区| 欧美黑人经典片免费观看| 国产真实女人一级毛片| 久久www免费人成_看片高清| 男人J放进女人屁股免费观看| 色老板美国在线观看| 亚洲色图激情小说| A级毛片无码久久精品免费| 国产精品-区区久久久狼| 老师在讲桌下边h边讲课| 少妇高潮久久久久7777| 影音先锋 av天堂| 高清mv视频免费观看| 久久久久久极精品久久久| 日韩丰满少妇无码内射| 伊人久久精品AV一区二区| 成在线人免费| 暖暖在线观看播放视频| 在线成 人av影院| 日本漫画大全无翼乌| 老师的蕾丝小内内湿透了| 色多多涩涩屋下载软件| 在线免费公开视频| 国产精品97久久久久久AV色戒 | 最新无码国产在线视频9299| 国产最新地址| 乌克兰16~18sex| 成人网视频在线观看免费| 女教师の诱惑| 最新快播网站| 久久人妻无码毛片A片麻豆| 亚洲欧洲日韩天堂无吗| 国产欧美精品国产国产专区| 手机移动oa| 俄罗斯大肥BBXX| 琪琪电影午夜理论片77网| 99久久免费精品国产免费| 快播欧美大片| 在线欧美 精品 第1页| 精品一区二区三区免费毛片| 亚洲国产免费观看视频|