色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

模型在學習可轉移的語義分割表示方面的有效性

jf_pmFSk4VX ? 來源:GiantPandaCV ? 2023-05-18 11:35 ? 次閱讀

目錄

前言

DPSS 方法概述

DeP 和 DDeP

基礎網絡結構

損失函數

diffusion 的擴展

實驗

總結

參考

前言

當前語義分割任務存在一個特別常見的問題是收集 groundtruth 的成本和耗時很高,所以會使用預訓練。例如監督分類或自監督特征提取,通常用于訓練模型 backbone。基于該問題,這篇文章介紹的方法被叫做 decoder denoising pretraining (DDeP),如下圖所示。

9bfdc3f4-f4b0-11ed-90ce-dac502259ad0.png請添加圖片描述

與標準的去噪自編碼器類似,網絡被訓練用于對帶有噪聲的輸入圖像進行去噪。然而,編碼器是使用監督學習進行預訓練并凍結的,只有解碼器的參數使用去噪目標進行優化。此外,當給定一個帶有噪聲的輸入時,解碼器被訓練用于預測噪聲,而不是直接預測干凈圖像,這也是比較常見的方式。

DPSS 方法概述

這次介紹的這篇文章叫做 Denoising Pretraining for Semantic Segmentation,為了方便,后文統一簡寫為 DPSS。DPSS 將基于 Transformer 的 U-Net 作為去噪自編碼器進行預訓練,然后在語義分割上使用少量標記示例進行微調。與隨機初始化的訓練以及即使在標記圖像數量較少時,對編碼器進行監督式 ImageNet-21K 預訓練相比,去噪預訓練(DeP)的效果更好。解碼器去噪預訓練(DDeP)相對于主干網絡的監督式預訓練的一個關鍵優勢是能夠預訓練解碼器,否則解碼器將被隨機初始化。也就是說,DPSS 使用監督學習初始化編碼器,并僅使用去噪目標預訓練解碼器。盡管方法簡單,但是 DDeP 在 label-efficient 的語義分割上取得了最先進的結果。9c0a6a1e-f4b0-11ed-90ce-dac502259ad0.png

為了方便理解,上圖是以可用的標記訓練圖像比例為橫坐標的 Cityscapes 驗證集上的平均 IOU 結果。從左到右四個直方圖依次是不進行預訓練,使用 ImageNet-21K 預訓練 backbone,使用 DeP 預訓練編碼器和使用 DDeP 的方式。當可用的標記圖像比例小于5%時,去噪預訓練效果顯著。當可用標記比例較大時,基于 ImageNet-21K 的監督式預訓練 backbone 網絡優于去噪預訓練。值得注意的是,DDeP 在各個標記比例下都取得了最佳的結果。

DeP 和 DDeP

下圖是 DPSS 的一個形象的圖示,其中第二步代表 DDeP。最后的 Fine-tuning 過程是微調整個網絡,而不是只做 last layer。

9c0f1384-f4b0-11ed-90ce-dac502259ad0.png請添加圖片描述

基礎網絡結構

DPSS 使用了基于 Transfomer 的 U-Net 架構:TransUnet,如下圖所示。它將 12 層 Transfomer 與標準的 U-Net 模型相結合。這種架構中的編碼器是一種混合模型,包括卷積層和自注意力層。也就是說,patch embeddings 是從 CNN 特征圖中提取的。這篇論文采用了和 Hybrid-vit 模型相同的編碼器,以利用在 imagenet-21k 數據集中預先訓練的監督模型 checkpoints。論文中強調,去噪預訓練方法并不特定模型架構的選擇,只是結果都在 TransUNet 架構上測試。

9c1a7f94-f4b0-11ed-90ce-dac502259ad0.png請添加圖片描述

損失函數

為了預訓練 U-Net,設計了去噪目標函數。該函數向未標記的圖像添加高斯噪聲以創建噪點圖像。噪音水平由一個叫做 gamma 的標量值控制:

然后,噪聲圖像被輸入到 U-Net,它試圖通過消除噪點來重建原始圖像。去噪目標函數用如下公式表示,它涉及對噪聲水平和噪聲分布的期望值:

還將去噪目標函數與另一種公式進行了比較,該公式對圖像和噪聲進行衰減以確保隨機變量的方差為 1。發現具有固定噪聲水平的更簡單的去噪目標函數非常適合表示學習:

DeP 經過訓練,可以從噪聲損壞的版本中重建圖像,并且可以使用未標記的數據。降噪預訓練目標表示為 DDPM 擴散過程的單次迭代。sigma 的選擇對表示學習質量有很大影響,預訓練后,最終的 projection layer 會被丟棄,然后再對語義分割任務進行微調。此外,上面設計 DDPM 的內容,這里就不贅述了,在 GiantPandaCV 之前的語義分割和 diffusion 系列里可以找到。

diffusion 的擴展

在最簡單的形式下,當在上一節的最后一個方程中使用單個固定的 σ 值時,相當于擴散過程中的一步。DPSS 還研究了使該方法更接近于 DDPM 中使用的完整擴散過程的方法,包括:

Variable noise schedule:在 DDPM 中,模擬從干凈圖像到純噪聲(以及其反向)的完整擴散過程時,σ 被隨機均勻地從 [0, 1] 中抽樣,針對每個訓練樣本。盡管發現固定的 σ 通常表現最佳,但 DPSS 也嘗試隨機采樣 σ。在這種情況下,將 σ 限制在接近 1 的范圍內對于表示質量是必要的。

Conditioning on noise level:在擴散形式化方法中,模型表示從一個噪聲水平過渡到下一個的(反向)轉換函數,因此受當前噪聲水平的條件約束。在實踐中,這是通過將為每個訓練樣本抽樣的 σ 作為額外的模型輸入(例如,用于標準化層)來實現的。由于我們通常使用固定的噪聲水平,對于 DPSS 來說,不需要進行條件設置。

Weighting of noise levels:在 DDPM 中,損失函數中不同噪聲水平的相對權重對樣本質量有很大影響。論文中的實驗表明,學習可轉移表示不需要使用多個噪聲水平。因此,DPSS 并未對不同噪聲水平的加權進行實驗。

實驗

實驗在 Cityscapes,Pascal Context 和 ADE20K 數據集上。下面兩個表是在 Cityscapes 的驗證集上進行測試,其中還測試了可用帶標簽訓練數據為原始訓練數據量 1/30 的情況,表明即使有標簽的樣本數量很少,DPSS 在 mIoU 上的表現也優于以前的方法。

9c218f1e-f4b0-11ed-90ce-dac502259ad0.png請添加圖片描述 9c2a2426-f4b0-11ed-90ce-dac502259ad0.png請添加圖片描述

下面比較了在 DeP 模型中調整 sigma 參數的兩種不同方法的性能。第二種方法使用固定的 sigma 值,而第一種方法從間隔 [0.2,0.3] 對西格瑪進行均勻采樣。此外,折線圖表示固定 sigma 在值為 0.2 左右的區間效果更好。這部分實驗基于 Pascal Context 和 ADE20K 數據集。

9c3204c0-f4b0-11ed-90ce-dac502259ad0.png請添加圖片描述

總結

這篇文章受到 diffusion 的啟發,探索了這些模型在學習可轉移的語義分割表示方面的有效性。發現將語義分割模型預訓練為去噪自編碼器可以顯著提高語義分割性能,尤其是在帶標記樣本數量有限的情況下。基于這一發現,提出了一個兩階段的預訓練方法,其中包括監督預訓練的編碼器和去噪預訓練的解碼器的組合。在不同大小的數據集上都表現出了性能提升,是一種很實用的預訓練方法。

審核編輯:彭靜
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 解碼器
    +關注

    關注

    9

    文章

    1157

    瀏覽量

    41176
  • 函數
    +關注

    關注

    3

    文章

    4353

    瀏覽量

    63292
  • 模型
    +關注

    關注

    1

    文章

    3415

    瀏覽量

    49475

原文標題:用于語義分割的解碼器 diffusion 預訓練方法

文章出處:【微信號:GiantPandaCV,微信公眾號:GiantPandaCV】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    神奇的數據有效性的使用

    數據有效性的使用
    發表于 06-24 16:59

    特征選擇在減少預測推理時間方面的有效性展示

    。特征選擇是大多數機器學習管道中的一個重要步驟,主要用于提高性能。當減少特征時,就是降低了模型的復雜,從而降低了訓練和驗證的時間。在這篇文章中,我們展示了特征選擇在減少預測推理時間方面的
    發表于 09-07 14:46

    高斯混合模型對乳腺癌診斷的有效性初探

    計算機輔助醫療診斷是計算機應用的一個熱門方向。本文旨在探討基于EM 算法的高斯混合模型在乳腺癌診斷方面的有效性。通過與現在流行的BP 神經網絡輔助醫療診斷方法的比較
    發表于 01-09 11:54 ?24次下載

    基于網絡本體語言OWL表示模型語義的相似計算方法

    念屬性特征為基礎語義對象的結構化表示模型;然后,從OWL表示模型中提取用于評價兩個模型相似
    發表于 12-17 10:33 ?0次下載
    基于網絡本體語言OWL<b class='flag-5'>表示</b><b class='flag-5'>模型</b><b class='flag-5'>語義</b>的相似<b class='flag-5'>性</b>計算方法

    利用深度學習模型實現監督式語義分割

    最近進行語義分割的結構大多用的是卷積神經網絡(CNN),它首先會給每個像素分配最初的類別標簽。卷積層可以有效地捕捉圖像的局部特征,同時將這樣的圖層分層嵌入,CNN嘗試提取更寬廣的結構。隨著越來越多的卷積層捕捉到越來越復雜的圖像特
    的頭像 發表于 05-25 10:09 ?6301次閱讀

    分析總結基于深度神經網絡的圖像語義分割方法

    語義分割和弱監督學習圖像語義分割,對每種方法中代表算法的效果以及優缺點進行對比與分析,并闡述深
    發表于 03-19 14:14 ?21次下載
    分析總結基于深度神經網絡的圖像<b class='flag-5'>語義</b><b class='flag-5'>分割</b>方法

    基于語義耦合相關的判別式跨模態哈希特征表示學習算法

    特征表示語義判別,從而導致哈希碼表示的類別區分不強,降低了最近鄰搜索的準確和魯棒
    發表于 03-31 11:28 ?12次下載
    基于<b class='flag-5'>語義</b>耦合相關的判別式跨模態哈希特征<b class='flag-5'>表示</b><b class='flag-5'>學習</b>算法

    基于深度神經網絡的圖像語義分割方法

    對應用于圖像語義分割的幾種深度神經網絡模型進行簡單介紹,接著詳細闡述了現有主流的基于深度神經網絡的圖像語義分割方法,依據實現技術的區別對圖像
    發表于 04-02 13:59 ?11次下載
    基于深度神經網絡的圖像<b class='flag-5'>語義</b><b class='flag-5'>分割</b>方法

    基于SEGNET模型的圖像語義分割方法

    的多尺度語義信息更加豐富,從而提升對每個像素點的類別預測精度,在模型中加入生成對抗網絡以充分考慮空間中相鄰像素點間關系。實驗結果表明,該模型語義
    發表于 05-27 14:54 ?15次下載

    語義分割模型 SegNeXt方法概述

    語義分割是對圖像中的每個像素進行識別的一種算法,可以對圖像進行像素級別的理解。作為計算機視覺中的基礎任務之一,其不僅僅在學術界廣受關注,也在無人駕駛、工業檢測、輔助診斷等領域有著廣泛的應用。
    的頭像 發表于 09-27 15:27 ?3528次閱讀

    普通視覺Transformer(ViT)用于語義分割的能力

    本文探討了普通視覺Transformer(ViT)用于語義分割的能力,并提出了SegViT。以前基于ViT的分割網絡通常從ViT的輸出中學習像素級
    的頭像 發表于 10-31 09:57 ?5421次閱讀

    圖像語義分割的概念與原理以及常用的方法

    (Graph partitioning segmentation methods),在深度學習(Deep learning, DL)“一統江湖”之前,圖像語義分割方面的工作可謂“百花齊
    的頭像 發表于 04-20 10:01 ?5093次閱讀

    深度學習圖像語義分割指標介紹

    深度學習在圖像語義分割上已經取得了重大進展與明顯的效果,產生了很多專注于圖像語義分割模型與基準
    發表于 10-09 15:26 ?496次閱讀
    深度<b class='flag-5'>學習</b>圖像<b class='flag-5'>語義</b><b class='flag-5'>分割</b>指標介紹

    圖像分割語義分割中的CNN模型綜述

    圖像分割語義分割是計算機視覺領域的重要任務,旨在將圖像劃分為多個具有特定語義含義的區域或對象。卷積神經網絡(CNN)作為深度學習的一種核心
    的頭像 發表于 07-09 11:51 ?1334次閱讀

    圖像語義分割的實用是什么

    圖像語義分割是一種重要的計算機視覺任務,它旨在將圖像中的每個像素分配到相應的語義類別中。這項技術在許多領域都有廣泛的應用,如自動駕駛、醫學圖像分析、機器人導航等。 一、圖像語義
    的頭像 發表于 07-17 09:56 ?623次閱讀
    主站蜘蛛池模板: 国产在线一区二区三区四区 | 亚洲高清在线mv | 俄罗斯18xv在线观看 | 国产不卡免费 | 美女被免费喷白浆视频 | 99国内偷揿国产精品人妻 | bbwvideoa欧美老妇 | chinese学生gv video| 国产人妻麻豆蜜桃色69 | 午夜亚洲WWW湿好大 午夜性爽视频男人的天堂在线 | 亚洲国产精品无码中文字幕 | 国产精品久久久久久搜索 | 韩剧甜性涩爱 | 扒开老师大腿猛进AAA片邪恶 | 亚洲中文无码亚洲人在线观看- | 欧美多人群p刺激交换电影 欧美多毛的大隂道 | 影音先锋色av男人资源网 | 99re久久免费热在线视频手机 | 看了n遍舍不得删的黄文 | 极品网红液液酱粉嫩福利照子凌酱 | 精品免费久久久久久成人影院 | 麻豆免费高清完整版 | 色WWW永久免费视频首页 | 欧美精品熟妇乱 | 青柠在线观看视频在线 | 快乐激情网 | 骚妇BB双飞插 | 亚州综合网 | 最近更新2019中文字幕国语 | 最新日本免费一区 | 大胸美女被C得嗷嗷叫动态图 | 在线观看中文字幕国产 | 国产1广场舞丰满老女偷 | 色婷婷欧美在线播放内射 | 无码区国产区在线播放 | 2020国产欧洲精品视频 | 国内精品一级毛片免费看 | 亚洲h视频在线观看 | 色裕插插插影视 | 99国产精品综合AV无码 | 91欧美秘密入口 |