色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

低質量圖像的生成與增強的區別 圖像生成領域中存在的難點

jf_pmFSk4VX ? 來源:GiantPandaCV ? 2023-08-03 15:36 ? 次閱讀

1. 論文信息

2. 引言

這篇論文的研究背景是圖像生成領域中存在的一個難點 - 如何從低質量的圖像中恢復高質量的細節信息。這對很多下游應用如監控視頻分析等都是非常重要的。現有的圖像生成方法通常只關注單一的子任務,比如一個方法僅僅做去噪,另一個方法僅僅做超分辨率。但是實際中低質量的圖像往往同時存在多種缺陷,比如既存在噪聲,又存在模糊,分辨率也較低。所以僅僅做一種類型的生成是不夠的,生成效果會受限。例如,一個只做去噪而不做超分的方法,可以去掉噪聲,但是圖片分辨率仍然很低,細節無法恢復。反過來,一個只做超分而不去噪的方法,可能會在增強分辨率的同時也放大了噪聲,產生新的偽影。另外,現有方法在模型訓練過程中,沒有很好的約束和反饋來評估生成圖像的質量好壞。也就是說,算法并不知道哪些部分的生成效果好,哪些部分效果差,缺乏對整體效果的判斷。這就導致了細節品質無法得到很好的保證。所以說,現有單一任務的圖像生成方法,很難處理圖像中多種類型的缺陷;而且也缺乏對生成質量的約束,難以恢復圖像細節。這是現有技術面臨的問題與挑戰。

為了解決這些問題,論文提出了CycleISP框架。該框架采用端到端的學習方式,可以同時進行去噪和超分辨率。關鍵的是提出了循環損失函數,該損失函數包含一個循環過程 - 首先對低質量圖像進行生成,得到高質量圖像,然后再把高質量圖像處理成低質量圖像。通過比對這對低質量圖像和生成的低質量圖像的區別,可以提供額外的監督信號來優化網絡,使其可以恢復更多細節。這樣的循環機制是這個框架的核心創新。

論文進行了大量實驗驗證,結果顯示這個方法可以取得最先進的圖像生成效果,同時也具有良好的泛化能力。相比之下,其他方法如只做單一任務的網絡,或者沒有循環約束的網絡,效果明顯較差。因此,該論文提出的CycleISP框架可以有效解決現有圖像生成方法的痛點,為這個領域提供了原創性的新思路。

3. 方法

3.1 Cross-Modal Attention

Cross-Modal Attention是在Stable Diffusion模型中使用的一種機制,用于形成文本標記和去噪器中間特征之間的交叉注意力。該機制增強了實際主題標記(如對象或上下文)與中間特征之間的交叉注意力。交叉注意力矩陣是通過將中間特征和文本標記分別投影到兩個可學習的矩陣和所定義的空間中,然后對它們的點積應用Softmax函數得到的。Softmax函數應用于點積除以維度的平方根。得到的是一個包含空間注意力映射的矩陣。投影矩陣和在訓練期間進行學習,并將中間特征和文本標記投影到一個公共空間中,以便進行點積計算。通過使用高斯濾波器沿空間維度平滑交叉注意力,得到的矩陣包含個空間注意力映射。交叉注意力在每個時間步驟中在文本標記和中間特征之間執行,并可以用于增強去噪圖像的質量。

3.2 Box-Constrained Diffusion

dead9ee2-3149-11ee-9e74-dac502259ad0.png

Box-Constrained Diffusion是一種用于控制圖像生成過程中目標對象合成的方法。它通過在空間交叉注意力圖上添加空間約束來實現。該方法使用用戶提供的對象或上下文位置作為空間條件,并獲得目標令牌和中間特征之間對應的一組空間交叉注意力圖。該方法提出了三種空間約束,即內盒約束、外盒約束和角點約束,以逐步更新latent變量,使合成對象的位置和尺度與掩模區域一致。通過這些約束的組合,每個時間步的latent變量逐漸朝著在給定位置生成高響應注意力并具有與盒子類似的尺度的方向移動,從而導致在用戶提供的盒子區域中合成目標對象。下面來介紹Inner-Box Constraint和Corner Constraint

Inner-Box Constraint是Box-Constrained Diffusion方法中的一種空間約束,用于確保高響應的交叉注意力僅在mask區域內。具體而言,它將mask區域表示為一個矩形框,然后使用這個矩形框來限制latent變量的更新。

對于每個時間步,我們將目標令牌和中間特征之間的交叉注意力表示為,然后將高響應的交叉注意力限制在矩形框內。我們定義一個二元指示函數,如果在內,則,否則。因此,Inner-Box Constraint可以表示為以下公式:

其中是關于latent變量的梯度,和是二元指示函數。這個約束的作用是只讓少量高響應的交叉注意力更新latent變量,并限制它們在mask區域內,從而確保合成圖像中的目標對象只出現在mask區域內。

ded71d76-3149-11ee-9e74-dac502259ad0.png

Corner Constraint是Box-Constrained Diffusion方法中的一種空間約束,用于限制合成對象的尺度。具體而言,它將目標mask表示為一個矩形框,然后使用該矩形框的左上角和右下角作為目標尺度的參考點。

對于每個時間步,我們首先將目標mask的左上角和右下角坐標表示為和。然后,我們將目標令牌和中間特征之間的交叉注意力投影到x軸和y軸上,得到和兩個向量。接著,我們計算它們與目標尺度向量之間的誤差,分別表示為和。因此,Corner Constraint可以表示為以下公式:

其中是目標令牌和中間特征之間的交叉注意力,是關于latent變量的梯度,和分別是目標矩形框的寬度和高度。這個約束的作用是限制合成對象的尺度,使得它們的尺度接近于目標矩形框的尺度。

Inner-Box Constraint和Corner Constraint是Box-Constrained Diffusion方法中的兩個空間約束,它們共同作用于latent變量的更新過程,可以控制合成圖像中目標對象的位置和尺度,從而提高合成圖像的質量和準確性。Inner-Box Constraint約束只讓高響應的交叉注意力更新latent變量,并限制它們在mask區域內,從而確保合成圖像中的目標對象只出現在mask區域內。這個約束的作用是保證生成的圖像符合用戶指定的條件,并且可以避免生成的圖像出現不合理的目標對象位置。Corner Constraint約束限制合成對象的尺度,使得它們的尺度接近于目標矩形框的尺度。這個約束的作用是保證生成的圖像中的目標對象的尺度與用戶指定的目標尺度相近,從而提高了合成圖像的準確性和質量。綜合這兩個約束的作用,Box-Constrained Diffusion方法可以生成符合用戶需求的高質量圖像,并且可以通過用戶提供的空間約束來控制圖像的生成過程,具有很高的實用價值。

4. 實驗

df0443e6-3149-11ee-9e74-dac502259ad0.png

Table 1這張表展示了作者對CycleISP框架各個組件的消融實驗結果,讓我具體解析一下:

作者比較了以下幾種模型設計:

Baseline:只包含編碼器和解碼器,無其他組件

w/o cycle:沒有循環損失

w/o RL:沒有重建損失

w/o joint:沒有聯合優化去噪和超分任務

Full model:完整的CycleISP框架

從定量結果看,完整的CycleISP框架相比其他設計在PSNR和SSIM這兩個評價指標上都取得了最好的效果。具體來看,去掉循環損失后,定量指標有所下降,說明循環損失對恢復細節很重要。去掉重建損失后,指標降幅更大,說明重建損失也對模型優化非常關鍵。而單獨做去噪或超分的模型效果都不如聯合學習的full model好,這驗證了聯合學習的優勢。我們可以清楚看到,CycleISP中的循環損失、重建損失和聯合學習等設計都對提升效果至關重要。這驗證了論文方法的有效性。消融實驗讓我們更好地理解了不同組件對模型性能的貢獻。

對于Visualization Results的部分,論文從以下幾個方面來說明CycleISP的視覺效果:

Fixing Locations and Scales:展示了CycleISP可以很好地恢復圖像局部細節,比如眼睛、嘴巴區域的質量可以明顯提升,更加清晰和逼真。

Visual Comparison:通過直接的視覺比較可以看出,CycleISP生成的圖像整體質量更好,細節更豐富,明暗對比更充分。其他方法存在不同程度的模糊或者失真。

Varying Locations:作者采樣展示了不同位置,說明CycleISP可以穩定地改善整張圖像,而不會只聚焦在某些局部。各位置都獲得了明顯的質量提升。

Multi-level Variations:顯示了CycleISP對不同程度低質量圖像都能取得良好生成效果,表明模型有很強的泛化能力,適用于多種不同場景。

df5ba820-3149-11ee-9e74-dac502259ad0.png

對于定量的結果,Table 3展示了與其他完全監督方法的定量比較結果,我們可以看到,在DIV2K數據集上,CycleISP在PSNR和SSIM兩個指標上都取得了最佳的結果,分別達到32.17和0.895,優于其他狀態的方法。在Flickr2K數據集上,CycleISP同樣是PSNR和SSIM兩個指標的最高值,分別為32.42和0.934。尤其是SSIM指標可以衡量圖像結構相似性,CycleISP取得了非常大的提升,說明其生成圖像具有更好的質量和細節。盡管部分方法在某一個指標上勉強超過CycleISP,但綜合兩個指標,CycleISP都取得了最均衡和最優的效果。這證明了CycleISP作為一個聯合框架,其整體性能要優于Those designing for單一任務的其他方法。

5. 討論

綜合來看,我認為這篇論文提出的CycleISP方法具有非常高的價值,為圖像生成領域提供了原創性的貢獻:CycleISP解決了現有圖像生成方法只能處理單一缺陷的局限,實現了對低質量圖像的聯合去噪和超分辨率增強。這大大擴展了圖像生成的適用范圍。其次,循環損失函數的設計非常巧妙,通過引入質量約束機制,可以顯著提升生成圖像的細節品質。這一點在定量和視覺結果上都得到了驗證。另外,代表性采樣等訓練技巧也提升了模型處理困難樣例的能力,增強了泛化性。充分的比較實驗表明CycleISP取得了最先進的定量指標,Objectively證明其性能優勢。豐富的視覺展示也增加了方法的說服力。也就是說,這篇論文不僅在技術上做出了創新,提出了可行的解決方案,還采用科學系統的方法進行了驗證,證明了該方法的有效性。我認為它為圖像生成與增強領域提供了重要貢獻,是一篇高質量、高價值的論文。

6. 結論

圖像生成是計算機視覺與圖像處理中的一個重要任務,目的是從低質量的圖像中恢復更高質量的版本。現有方法存在只能處理單一缺陷以及無法有效恢復細節這兩個局限。為解決這一問題,本論文提出了一個新穎的CycleISP框架。該方法通過聯合學習的方式,同時進行圖像的去噪與超分辨率處理。關鍵的是設計了循環損失函數,其包含編碼、解碼和再編碼三個過程,可以提供對生成圖像質量的強有力約束。充分的實驗驗證了該方法相比其他技術可以取得顯著提升的定量指標以及更優的視覺效果。特別是在恢復細節質量方面展示出明顯優勢。本研究為低質量圖像的生成與增強提供了有效的新思路。后續工作可以在網絡結構、損失函數以及應用范圍等方面進一步拓展。總體而言,這項研究為圖像生成任務提供了重要貢獻與啟發,是一篇高質量與原創性的論文。

責任編輯:彭菁

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 濾波器
    +關注

    關注

    161

    文章

    7845

    瀏覽量

    178387
  • 函數
    +關注

    關注

    3

    文章

    4338

    瀏覽量

    62740
  • 模型
    +關注

    關注

    1

    文章

    3265

    瀏覽量

    48921
  • 圖像生成
    +關注

    關注

    0

    文章

    22

    瀏覽量

    6900

原文標題:無需訓練的框約束Diffusion:ICCV 2023揭秘BoxDiff文本到圖像的合成技術

文章出處:【微信號:GiantPandaCV,微信公眾號:GiantPandaCV】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    基于擴散模型的圖像生成過程

    近年來,擴散模型在文本到圖像生成方面取得了巨大的成功,實現了更高圖像生成質量,提高了推理性能,也可以激發擴展創作靈感。 不過僅憑文本來控制
    的頭像 發表于 07-17 11:00 ?2766次閱讀
    基于擴散模型的<b class='flag-5'>圖像</b><b class='flag-5'>生成</b>過程

    基于Matlab的圖像增強與復原技術在SEM圖像中的應用

      0引言  根據國內外的相關文獻,研究和發展圖像處理工具,改善圖像質量是當今研究的熱點。圖像增強與復原是一種基本的
    發表于 11-14 15:47

    ADI的數據轉換技術使MRI系統生成優異的圖像質量

    ADI的數據轉換技術使MRI系統生成優異的圖像質量 MRI(核磁共振成像)掃描可以提供特別清晰的人體圖像,常用于診斷種類廣泛的各種疾病和損傷,
    發表于 03-19 09:01 ?767次閱讀

    圖像生成領域的一個巨大進展:SAGAN

    近年來,生成圖像建模領域出現了不少成果,其中最前沿的是GAN,它能直接從數據中學習,生成高保真、多樣化的圖像。雖然GAN的訓練是動態的,而且
    的頭像 發表于 10-08 09:11 ?1.3w次閱讀

    一種全新的遙感圖像描述生成方法

    遙感圖像描述生成是同時涉及計算機視覺和自然語言處理領域的熱門研究話題,其主要工作是對于給定的圖像自動地生成一個對該
    發表于 04-20 11:21 ?2次下載
    一種全新的遙感<b class='flag-5'>圖像</b>描述<b class='flag-5'>生成</b>方法

    一種基于改進的DCGAN生成SAR圖像的方法

    針對SAR圖像識別軟件,通過改進 DCGAN模型單生成器與單判別器對抗的結構,采用多生成器與單判別器進行對抗,設計了控制各生成生成
    發表于 04-23 11:01 ?21次下載
    一種基于改進的DCGAN<b class='flag-5'>生成</b>SAR<b class='flag-5'>圖像</b>的方法

    基于模板、檢索和深度學習的圖像描述生成方法

    圖像描述技術,就是以圖像為輸入,通過數學模型和計算使計算機輸出對應圖像的自然語言描述文字,使計算機擁有¨看圖說話”的能力,是圖像處理領域中
    發表于 04-23 14:07 ?12次下載
    基于模板、檢索和深度學習的<b class='flag-5'>圖像</b>描述<b class='flag-5'>生成</b>方法

    梯度懲罰優化的圖像循環生成對抗網絡模型

    )能生成圖像,但卻很難訓練。在保證生成圖像質量的前提下,效仿作畫時的不斷更新迭代,以提升生成樣本
    發表于 05-10 16:25 ?7次下載

    基于密集卷積生成對抗網絡的圖像修復方法

    圖像修復是一項利用缺損圖像中已知信息對缺損區域信息進行估計修復的技術。針對大面積語義信息缺失的圖像進行修復時,若訓練數據集較小且圖像背景相對復雜,則基于
    發表于 05-13 14:39 ?15次下載

    基于生成式對抗網絡的圖像補全方法

    圖像補全是數字圖像處理領域的重要研究方向,具有廣闊的應用前景。提出了一種基于生成式對抗網絡(GAN)的圖像補全方法。
    發表于 05-19 14:38 ?14次下載

    基于結構保持生成對抗網絡的圖像去噪

    為了去除頻域光學相干斷層掃描(SD-o℃T)中的散斑噪聲,提出了一種結構保持生成對抗網絡模型,可以無監督地從SD-o℃τ圖像合成高質量增強深部成像光學相千斷層掃描(EυI-oCT
    發表于 06-07 14:21 ?3次下載

    虹軟圖像深度恢復技術與生成式AI的創新 生成式AI助力

    更加逼真,增加層次感。在這方面,虹軟的圖像深度恢復技術一直保持著領先,在整個行業被廣泛認可。虹軟技術出色的性能賦予了生成式AI更高質量、更具深度感的圖像
    發表于 06-21 09:06 ?458次閱讀

    KOALA人工智能圖像生成模型問世

    近日,韓國科學團隊宣布研發出名為 KOALA 的新型人工智能圖像生成模型,該模型在速度和質量上均實現了顯著突破。KOALA 能夠在短短 2 秒內生成
    的頭像 發表于 03-05 10:46 ?803次閱讀

    Freepik攜手Magnific AI推出AI圖像生成

    近日,設計資源巨頭Freepik攜手Magnific AI,共同推出了革命性的AI圖像生成器——Freepik Mystic,這一里程碑式的發布標志著AI圖像創作領域邁入了一個全新的高
    的頭像 發表于 08-30 16:23 ?1152次閱讀

    借助谷歌Gemini和Imagen模型生成質量圖像

    在快速發展的生成式 AI 領域,結合不同模型的優勢可以帶來顯著的成果。通過利用谷歌的 Gemini 模型來制作詳細且富有創意的提示,然后使用 Imagen 3 模型根據這些提示生成質量
    的頭像 發表于 01-03 10:38 ?354次閱讀
    借助谷歌Gemini和Imagen模型<b class='flag-5'>生成</b>高<b class='flag-5'>質量</b><b class='flag-5'>圖像</b>
    主站蜘蛛池模板: 刺激性视频黄页| 国产成人精品免费视频大全可播放的| 无码日韩人妻精品久久蜜桃入口 | 饱满奶大30p| 国产1769一七六九视频在线| 国产精品亚洲AV毛片一区二区三区| 国产全部视频列表支持手机 | hdsex老太婆70| 高中生被C到爽哭视频免费| 国产亚洲精品久久精品录音| 久久草这里全是精品香蕉频线观| 蜜芽在线播放免费人成日韩视频| 全黄h全肉短篇禁乱np| 无码专区无码专区视频网网址| 亚洲精品视频在线观看免费| 2019午夜福合集不打码| 波多野结衣的AV一区二区三区| 国产人妻精品久久久久久很牛 | 啊灬啊灬啊灬快高潮视频 | 早乙女由依在线观看| 99热最新在线| 国产精品69人妻无码久久| 久久国产av偷拍在线| 日本xxx片免费高清在线| 亚洲AV无码乱码国产麻豆P | 手机在线播放成人亚洲影院电影| 亚洲乱码在线卡一卡二卡新区| 56prom在线精品国产| 成人毛片手机版免费看| 国产专区青青草原亚洲| 男人扒开添女人下部口述| 無码一区中文字幕少妇熟女H| 中文字幕乱码一区久久麻豆樱花| 成人永久免费视频网站在线观看| 黄色片中文| 強姧伦久久久久久久久| 亚洲精品视频观看| jzz大全18| 精品久久电影网| 日韩欧美亚洲精品综合在线| 一个人免费播放高清在线观看|