色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

圖像修復與處理經典論文回顧和精讀

OpenCV學堂 ? 來源:OpenCV學堂 ? 作者:OpenCV學堂 ? 2022-07-13 16:18 ? 次閱讀

筆者最近在集中時間學習對抗生成網絡(GAN),特別是深度生成先驗進行多用途圖像修復與處理,需要對圖像修復與處理經典論文進行回顧和精讀。

將從圖像修復與處理的經典之作DGP《Exploiting Deep Generative Prior for Versatile Image Restoration and Manipulation》開始,重啟精讀之路。

d4193df6-0283-11ed-ba43-dac502259ad0.png

DGP提出了一種挖掘GAN中圖像先驗的方式,在多個任務上揭示了GAN作為一種通用圖像先驗的潛力。

論文提出了同時插值隱變量和生成器的漸變式圖像反演方法,可以應用于復雜圖片的對抗防御,在實驗中DGP所展現出的強大的像素間空間關系模擬能力也十分有趣。

d43f1a1c-0283-11ed-ba43-dac502259ad0.gif

Deep generative prior的圖像復原效果

01深度生成先驗

深度圖像先驗DIP僅依靠輸入圖像的統計信息,無法應用于需要更一般的圖像統計信息的任務,如圖像上色和圖像編輯。

d46d2f42-0283-11ed-ba43-dac502259ad0.png

我們更感興趣的是研究一種更通用的圖像先驗,即在大規模自然圖像上訓練的GAN生成器用于圖像合成。具體來說,是一個基于GAN-inversion的圖像重構過程。

在實踐中,僅僅通過優化隱向量z難以準確重建ImageNet這樣的復雜真實圖像。訓練GAN的數據集(ImageNet)本身是自然圖片中很少的一部分,GAN受限于有限的模型性能和mode collapse,其模擬的圖片分布與訓練集圖片分布也存在鴻溝。

即使存在以上限制,GAN仍然學習了豐富的圖片信息,為了利用這些信息并且實現精確重建,我們讓生成器online地適應于每張目標圖片,即聯合優化隱向量z和生成器參數

d4926fdc-0283-11ed-ba43-dac502259ad0.png

我們將此新的目標稱為深度生成先驗(DGP),DGP顯著提高了圖像重構的效果。設計合適的距離度量和優化策略非常關鍵,在重建過程中,生成器原始的生成先驗被修改了,輸出真實自然圖像的能力可能會下降。

02判別器指引的漸進式重建

從 latent space Z 中隨機抽取幾百個候選的初始 latent code,并選擇在度量L下重構效果最好的一個。

在GAN重建中,傳統的距離度量方法是 MSE 或 Perceptual loss。優化生成器參數時,將這些傳統距離度量用在圖像恢復如上色任務中,常常無法準確恢復顏色,并且重建過程中圖像會變得模糊,需要設計更好的優化方式來保留生成器的原有信息。

我們在該工作中選擇使用與生成器對應的判別器來作為距離度量。與Perceptual loss所采用的VGGNet不同,判別器并非在一個第三方的任務上訓練,而是在預訓練時就與生成器高度耦合,它天然地適用于調整生成器的輸出分布。

使用這種基于判別器的距離度量時,重建的過程更加自然和真實,最終顏色恢復的效果也更好。

d4c46f50-0283-11ed-ba43-dac502259ad0.png

其中D(x, i)代表以x作為輸入時判別器第i個block輸出的特征

雖然改進的距離度量帶來了更好的效果,但是圖像復原的結果仍存在非自然痕跡,因為生成器在針對目標圖片優化時,淺層參數匹配好圖片整體布局之前,深層參數就開始匹配細節紋理了。

d4d8fee8-0283-11ed-ba43-dac502259ad0.png

上面的蘋果圖是幾種訓練策略的對比,從三行效果可以看出,有的蘋果在訓練初期沒被染上色后期還是沒被染上色,我們把這種現象稱作“信息滯留”。

對策就是:使用漸進式重建的策略,即在微調生成器時,先優化淺層,再逐漸過渡到深層,讓重建過程“先整體后局部”。

與非漸進策略相比,這種漸進策略更好地保留了缺失語義和現有語義之間的一致性。

d4ee357e-0283-11ed-ba43-dac502259ad0.png

03重建結果

使用BigGAN模型,基于ImageNet進行訓練,使用ImageNet驗證集中的1000張圖像進行實驗,取每類的第一張,相比于其他方法,DGP取得了非常高的PSNR和SSIM,視覺上的重建誤差幾乎難以察覺。

d51bea28-0283-11ed-ba43-dac502259ad0.png

04實驗

因為GAN刻畫了自然圖像的先驗,因此可以完成很多的任務:比如上色、補全、超分辨率等等,還能進行圖像處理。下面放一些效果圖。

圖像上色

使用ResNet50上的分類精度作為定量評估結果, 下列方法的精度分別為 51.5%, 56.2%, 56.0%, 62.8%。

d56bab58-0283-11ed-ba43-dac502259ad0.png

圖像補全

d58cc4f0-0283-11ed-ba43-dac502259ad0.png

超分辨率

d5b1deb6-0283-11ed-ba43-dac502259ad0.png

靈活性

d5c8ecdc-0283-11ed-ba43-dac502259ad0.png

隨機擾動

d5e3a16c-0283-11ed-ba43-dac502259ad0.png

總結

GAN作為圖像領域最強大的生成式模型之一,學習到了豐富的自然圖像流形,可以對自然圖像的恢復和編輯帶來巨大幫助。

利用好大規模預訓練模型的能力是深度學習目前各個領域的流行前沿,可以減少對訓練數據的需求,整合相近的研究領域。

未來更強大的生成式模型,將帶來更具實際應用價值的圖像恢復和編輯應用,有望在更廣泛的領域落地

d609a812-0283-11ed-ba43-dac502259ad0.png

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • GaN
    GaN
    +關注

    關注

    19

    文章

    1933

    瀏覽量

    73290
  • 生成器
    +關注

    關注

    7

    文章

    315

    瀏覽量

    21003
  • 圖像修復
    +關注

    關注

    0

    文章

    11

    瀏覽量

    2262

原文標題:深度學習論文精讀[GAN]:利用深度生成先驗進行多用途圖像修復與處理

文章出處:【微信號:CVSCHOOL,微信公眾號:OpenCV學堂】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    傅立葉變換在圖像處理中的作用

    傅里葉變換在圖像處理中發揮著至關重要的作用。以下是傅里葉變換在圖像處理中的幾個主要作用: 一、圖像增強與去噪 去噪 :
    的頭像 發表于 12-06 16:55 ?371次閱讀

    經典圖神經網絡(GNNs)的基準分析研究

    本文簡要介紹了經典圖神經網絡(GNNs)的基準分析研究,發表在 NeurIPS 2024。 文章回顧經典 GNNs 模型在節點分類任務上的表現,結果發現過去 SOTA 圖學習模型報告的性能優越
    的頭像 發表于 11-27 09:16 ?169次閱讀
    <b class='flag-5'>經典</b>圖神經網絡(GNNs)的基準分析研究

    FPGA在圖像處理領域的優勢有哪些?

    FPGA(Field Programmable Gate Array,現場可編程門陣列)在圖像處理領域具有顯著的優勢,這些優勢主要體現在以下幾個方面: 一、高并行處理能力 FPGA內部擁有大量的邏輯
    發表于 10-09 14:36

    圖像處理器的發展歷史

    圖像處理器(Image Processor)的發展歷史是一段充滿創新與突破的歷程,它伴隨著計算機技術的不斷進步和圖像處理需求的日益增長而逐漸成熟。以下是對
    的頭像 發表于 08-14 09:42 ?771次閱讀

    圖像處理器是什么意思

    圖像處理器(Image Processor)是一種專門用于圖像處理和計算的硬件設備或芯片,它通過高速數據傳輸、圖像編解碼、濾波、變換等多種技
    的頭像 發表于 08-14 09:28 ?834次閱讀

    圖像識別技術包括自然語言處理

    圖像識別技術與自然語言處理是人工智能領域的兩個重要分支,它們在很多方面有著密切的聯系,但也存在一些區別。 一、圖像識別技術與自然語言處理的關系 1.1
    的頭像 發表于 07-16 10:54 ?734次閱讀

    圖像處理中的卷積運算

    卷積運算是圖像處理中一種極其重要的操作,廣泛應用于圖像濾波、邊緣檢測、特征提取等多個方面。它基于一個核(或稱為卷積核、濾波器)與圖像進行相乘并求和的過程,通過這一操作可以實現對
    的頭像 發表于 07-11 15:15 ?2219次閱讀

    經典卷積網絡模型介紹

    經典卷積網絡模型在深度學習領域,尤其是在計算機視覺任務中,扮演著舉足輕重的角色。這些模型通過不斷演進和創新,推動了圖像處理、目標檢測、圖像生成、語義分割等多個領域的發展。以下將詳細探討
    的頭像 發表于 07-11 11:45 ?508次閱讀

    計算機視覺和圖像處理的區別和聯系

    計算機視覺和圖像處理是兩個密切相關但又有明顯區別的領域。 1. 基本概念 1.1 計算機視覺 計算機視覺是一門研究如何使計算機能夠理解和解釋視覺信息的科學。它涉及到從圖像或視頻中提取、分析和理解視覺
    的頭像 發表于 07-09 09:16 ?1282次閱讀

    FPGA設計經驗之圖像處理

    今天和大俠簡單聊一聊基于FPGA的圖像處理,之前也和各位大俠聊過相關的圖像處理,這里面也超鏈接了幾篇,具體如下: 圖像邊緣檢測算法體驗步驟
    發表于 06-12 16:26

    Workshop!圖像處理和識別入門培訓

    隨著人工智能技術的快速發展,圖像處理方面的人才成為市場亟須的高級專業人才。通過本次實踐,開發者們將全面了解圖像處理領域相關知識,并將圖像
    的頭像 發表于 03-20 08:34 ?288次閱讀
    Workshop!<b class='flag-5'>圖像</b><b class='flag-5'>處理</b>和識別入門培訓

    機器視覺圖像采集卡:關鍵的圖像處理設備

    機器視覺圖像采集卡是一種用于采集和處理圖像數據的關鍵設備,它在現代工業生產和科學研究中起著至關重要的作用。本文將探討機器視覺圖像采集卡的工作原理、應用領域以及未來發展趨勢。首先,讓我們
    的頭像 發表于 02-22 16:23 ?496次閱讀
    機器視覺<b class='flag-5'>圖像</b>采集卡:關鍵的<b class='flag-5'>圖像</b><b class='flag-5'>處理</b>設備

    關于數字圖像處理的常用技巧

    圖像生成采集處理過程中都會不同程度的引入各種噪聲,因此會導致圖像的質量變差。從而影響對圖像的識別。所以必須要對圖像進行濾波,所以必須對
    的頭像 發表于 02-19 09:27 ?917次閱讀
    關于數字<b class='flag-5'>圖像</b><b class='flag-5'>處理</b>的常用技巧

    圖像處理怎么入門?

    總之圖像處理的基本思想還是要立足于圖像本身,要深度到圖像內部結構中,思維要靈活。我當時做本科畢設時,怎么也不知道圖像和高維空間中的點之間有什
    的頭像 發表于 01-08 09:51 ?394次閱讀

    FPGA圖像處理之CLAHE算法

    在FPGA圖像處理--CLAHE算法(一)中介紹了為啥要用CLAHE算法來做圖像增強。
    的頭像 發表于 01-04 12:23 ?2507次閱讀
    FPGA<b class='flag-5'>圖像</b><b class='flag-5'>處理</b>之CLAHE算法
    主站蜘蛛池模板: 亚洲九九视频| 国产日韩精品SUV| 蜜臀色欲AV无人A片一区| 亚洲一区二区三区乱码在线欧洲| 国产成人精品免费视频软件 | 日日操夜夜操天天操| 777精品久无码人妻蜜桃| 嗨嗨快播电影| 亚洲成人一区| 国产精品亚欧美一区二区三区| 色哒哒影院| 俄罗斯12一15处交| 日韩精品无码免费专区| 扒开屁股眼往里面夹东西| 内射少妇36P九色| 97伦理97伦理2018最新| 伦理片飘花免费影院| 中国老太60old mantv| 久久久久国产精品嫩草影院| 亚洲视频国产| 精品国产成人系列| 亚洲午夜久久久久中文字幕| 国语对白老女人8av| 亚洲精品第二页| 花蝴蝶免费版高清版| 亚洲午夜精品A片久久软件 | YELLOW视频直播在线观看| 欧美雌雄双性人交xxxx| 99久久精品免费看国产免费| 农民工老头在出租屋嫖老熟女| 91久久夜色精品| 欧美一区二区三区久久综| xxxxhdvideos动漫| 日本美国群交P片内射捆绑| 大香伊人中文字幕精品| 四虎成人影院| 国产偷国产偷亚洲高清SWAG| 亚洲精品一二三区区别在哪| 精品人妻无码一区二区三区蜜桃臀| 一本色道久久综合亚洲AV蜜桃 | 中文字幕日本久久2019|