色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

IPMT:用于小樣本語義分割的中間原型挖掘Transformer

CVer ? 來源:CVer ? 作者:CVer ? 2022-11-17 15:25 ? 次閱讀

本文簡要介紹發表在NeurIPS 2022上關于小樣本語義分割的論文《Intermediate Prototype Mining Transformer for Few-Shot Semantic Segmentation》。該論文針對現有研究中忽視查詢和支持圖像之間因類內多樣性而帶來的類別信息的差距,而強行將支持圖片的類別信息遷移到查詢圖片中帶來的分割效率低下的問題,引入了一個中間原型,用于從支持中挖掘確定性類別信息和從查詢中挖掘自適應類別知識,并因此設計了一個中間原型挖掘Transformer。文章在每一層中實現將支持和查詢特征中的類型信息到中間原型的傳播,然后利用該中間原型來激活查詢特征圖。借助Transformer迭代的特性,使得中間原型和查詢特征都可以逐步改進。相關代碼已開源在:

https://github.com/LIUYUANWEI98/IPMT

一、研究背景

目前在計算機視覺取得的巨大進展在很大程度上依賴于大量帶標注的數據,然而收集這些數據是一項耗時耗力的工作。為了解決這個問題,通過小樣本學習來學習一個模型,并將該模型可以推廣到只有少數標注圖像的新類別。這種設置也更接近人類的學習習慣,即可以從稀缺標注的示例中學習知識并快速識別新類別。

本文專注于小樣本學習在語義分割上的應用,即小樣本語義分割。該任務旨在用一些帶標注的支持樣本來分割查詢圖像中的目標物體。然而,目前的研究方法都嚴重依賴從支持集中提取的類別信息。盡管支持樣本能提供確定性的類別信息指導,但大家都忽略了查詢和支持樣本之間可能存在固有的類內多樣性。

在圖1中,展示了一些支持樣本原型和查詢圖像原型的分布。從圖中可以觀察到,對于與查詢圖像相似的支持圖像(在右側標記為“相似支持圖像”),它們的原型在特征空間中與查詢原型接近,在這種情況下匹配網絡可以很好地工作。然而,對于與查詢相比在姿勢和外觀上具有較大差異的支持圖像(在左側標記為“多樣化支持圖像”),支持和查詢原型之間的距離會很遠。在這種情況下,如果將支持原型中的類別信息強行遷移到查詢中,則不可避免地會引入較大的類別信息偏差。

e427f546-6635-11ed-8abf-dac502259ad0.jpg

圖1 支持樣本原型與查詢圖像原型分布圖

因此,本文在通過引入一個中間原型來緩解這個問題,該原型可以通過作者提出的中間原型挖掘Transformer彌補查詢和支持圖像之間的類別信息差距。每層Transformer由兩個步驟組成,即中間原型挖掘和查詢激活。在中間原型挖掘中,通過結合來自支持圖像的確定性類別信息和來自查詢圖像的自適應類別知識來學習中間原型。然后,使用學習到的原型在查詢特征激活模塊中激活查詢特征圖。此外,中間原型挖掘Transformer以迭代方式使用,以逐步提高學習原型和激活查詢功能的質量。

二、方法原理簡述

e4511246-6635-11ed-8abf-dac502259ad0.jpg

圖2 方法總框圖

支持圖像和查詢圖像輸入到主干網絡分別提取除支持特征和查詢特征。查詢特征在原型激活(PA)模塊中經過簡單的利用支持圖像原型進行激活后,分割成一個初始預測掩碼,并將該掩碼和激活后的查詢特征作為中間原型挖掘Transformer層的一個輸入。同時,將支持特征、支持圖片掩碼和隨機初始化的一個中間原型也做為第一層中間原型挖掘Transformer的輸入。在中間原型挖掘Transformer層中,首先進行掩碼注意力操作。具體來說,計算中間原型與查詢或支持特征之間的相似度矩陣,并利用下式僅保留前景區域的特征相似度矩陣:

e47eb26e-6635-11ed-8abf-dac502259ad0.png

處理后的相似度矩陣作為權重,分別捕獲查詢或支持特征中的類別信息并形成新的原型。

e4a64540-6635-11ed-8abf-dac502259ad0.png

查詢特征新原型、支持特征新原型和原中間原型結合在一起形成新的中間原型,完成對中間原型的挖掘。

e4d6ec7c-6635-11ed-8abf-dac502259ad0.png

而后,新的中間原型在查詢特征激活模塊中對查詢特征中的類別目標予以激活。

e4fdfbc8-6635-11ed-8abf-dac502259ad0.png

為了便于學習中間原型中的自適應類別信息,作者使用它在支持和查詢圖像上生成兩個分割掩碼,并計算兩個分割損失。

e51e9af4-6635-11ed-8abf-dac502259ad0.png

并設計雙工分割損失(DSL):

e5353b2e-6635-11ed-8abf-dac502259ad0.png

由于一個中間原型挖掘Transformer層可以更新中間原型、查詢特征圖和查詢分割掩碼,因此,作者通過迭代執行這個過程,得到越來越好的中間原型和查詢特征,最終使分割結果得到有效提升。假設有L 層,那么對于每一層有:

e552a614-6635-11ed-8abf-dac502259ad0.png

上式中具體過程又可以分解為以下環節:

e57441ac-6635-11ed-8abf-dac502259ad0.png

三、實驗結果及可視化

e5b042d8-6635-11ed-8abf-dac502259ad0.png

圖3 作者提出方法的結果的可視化與比較

在圖3中,作者可視化了文章中方法和僅使用支持圖像的小樣本語義分割方法[1]的一些預測結果。可以看出,與第 2 行中僅使用支持信息的結果相比,第3行中的結果展現出作者的方法可以有效地緩解由固有的類內多樣性引起的分割錯誤。

表4 與先前工作在PASCAL-5i[2]數據集上的效果比較

e60ebb06-6635-11ed-8abf-dac502259ad0.png

從表4中可以發現,作者的方法大大超過了所有其他方法,并取得了新的最先進的結果。在使用 ResNet-50 作為主干網絡時, 在 1-shot 設置下與之前的最佳結果相比,作者將 mIoU 得分提高了 2.6。此外,在使用 ResNet-101作為主干網絡時,作者方法實現了 1.8 mIoU(1-shot)和 2.2 mIoU(5-shot )的提升。

表5 各模塊消融實驗

e678b39e-6635-11ed-8abf-dac502259ad0.png

表5中指出,當僅使用 IPM 會導致 5.3 mIoU 的性能下降。然而,當添加 DSL 時,模型的性能在baseline上實現了 4.1 mIoU 的提升。作者認為這種現象是合理的,因為無法保證 IPM 中的可學習原型將在沒有 DSL 的情況下學習中間類別知識。同時,使用 QA 激活查詢特征圖可以進一步將模型性能提高 2.5 mIoU。這些結果清楚地驗證了作者提出的 QA 和 DSL 的有效性。

表6 中間原型Transformer有效性的消融研究

e6a4a940-6635-11ed-8abf-dac502259ad0.png

在表6中,作者對比了僅使用support或者query提供類別信息時,和是否使用迭代方式提取信息時的模型的性能情況。可以看出,借助中間原型以迭代的方式從support和query中都獲取類型信息所取得的效果更為出色,也驗證了作者提出方法的有效性。

e6c452a4-6635-11ed-8abf-dac502259ad0.png

圖7 支持原型和中間原型分別的可視化比較

如圖7所示,作者將原本的支持原型可視化為橘色,學習到的中間原型可視化為藍色,查詢圖像原型可視化為粉色。可以看到,在特征空間中,中間原型比支持原型更接近查詢原型,因此驗證了作者的方法有效地緩解了類內多樣性問題并彌補了查詢和支持圖像之間的類別信息差距。

四、總結及結論

在文章中,作者關注到查詢和支持之間的類內多樣性,并引入中間原型來彌補它們之間的類別信息差距。核心思想是通過設計的中間原型挖掘Transformer并采取迭代的方式使用中間原型來聚合來自于支持圖像的確定性類型信息和查詢圖像的自適應的類別信息。令人驚訝的是,盡管它很簡單,但作者的方法在兩個小樣本語義分割基準數據集上大大優于以前的最新結果。為此,作者希望這項工作能夠激發未來的研究能夠更多地關注小樣本語義分割的類內多樣性問題。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 模塊
    +關注

    關注

    7

    文章

    2696

    瀏覽量

    47438
  • 圖像
    +關注

    關注

    2

    文章

    1084

    瀏覽量

    40455
  • 計算機視覺
    +關注

    關注

    8

    文章

    1698

    瀏覽量

    45982

原文標題:?NeurIPS 2022 | IPMT:用于小樣本語義分割的中間原型挖掘Transformer

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    Transformer模型的具體應用

    如果想在 AI 領域引領一輪新浪潮,就需要使用到 Transformer
    的頭像 發表于 11-20 09:28 ?415次閱讀
    <b class='flag-5'>Transformer</b>模型的具體應用

    手冊上新 |迅為RK3568開發板NPU例程測試

    測試 6.1 deeplabv3語義分割 6.2 lite_transformer 6.3 LPRNet車牌識別 6.4 mobilenet圖像分類 6.5 PPOCR-Rec文字識別 6.6
    發表于 10-23 14:06

    語義分割25種損失函數綜述和展望

    本綜述提供了對25種用于圖像分割的損失函數的全面且統一的回顧。我們提供了一種新穎的分類法,并詳細審查了這些損失函數如何在圖像分割中被定制和利用,強調了它們的重要特征和應用,并進行了系統的分類。摘要
    的頭像 發表于 10-22 08:04 ?483次閱讀
    <b class='flag-5'>語義</b><b class='flag-5'>分割</b>25種損失函數綜述和展望

    手冊上新 |迅為RK3568開發板NPU例程測試

    測試 6.1 deeplabv3語義分割 6.2 lite_transformer 6.3 LPRNet車牌識別 6.4 mobilenet圖像分類 6.5 PPOCR-Rec文字識別 6.6
    發表于 08-12 11:03

    圖像語義分割的實用性是什么

    圖像語義分割是一種重要的計算機視覺任務,它旨在將圖像中的每個像素分配到相應的語義類別中。這項技術在許多領域都有廣泛的應用,如自動駕駛、醫學圖像分析、機器人導航等。 一、圖像語義
    的頭像 發表于 07-17 09:56 ?415次閱讀

    圖像分割語義分割的區別與聯系

    圖像分割語義分割是計算機視覺領域中兩個重要的概念,它們在圖像處理和分析中發揮著關鍵作用。 1. 圖像分割簡介 圖像分割是將圖像劃分為多個區
    的頭像 發表于 07-17 09:55 ?917次閱讀

    迅為RK3568手冊上新 | RK3568開發板NPU例程測試

    deeplabv3語義分割 6.2 lite_transformer 6.3 LPRNet車牌識別 6.4 mobilenet圖像分類 6.5 PPOCR-Rec文字識別 6.6 PPOCR-Det
    發表于 07-12 14:44

    Transformer語言模型簡介與實現過程

    在自然語言處理(NLP)領域,Transformer模型以其卓越的性能和廣泛的應用前景,成為了近年來最引人注目的技術之一。Transformer模型由谷歌在2017年提出,并首次應用于神經機器翻譯
    的頭像 發表于 07-10 11:48 ?1634次閱讀

    圖像分割語義分割中的CNN模型綜述

    圖像分割語義分割是計算機視覺領域的重要任務,旨在將圖像劃分為多個具有特定語義含義的區域或對象。卷積神經網絡(CNN)作為深度學習的一種核心模型,在圖像
    的頭像 發表于 07-09 11:51 ?845次閱讀

    中間繼電器主要用于信號傳遞和放大的原因

    中間繼電器(Middle Relay)是一種電氣設備,主要用于在電氣控制系統中傳遞和放大信號。它具有結構簡單、性能穩定、可靠性高、使用方便等特點,廣泛應用于各種工業自動化、電力系統、通信系統等領域
    的頭像 發表于 06-24 11:37 ?910次閱讀

    中間繼電器的型號怎么表示

    中間繼電器是一種電氣控制元件,用于接收輸入信號并將其轉換為輸出信號,以控制其他電氣設備。它廣泛應用于工業自動化、電力系統、通信設備等領域。 本文將詳細介紹中間繼電器的型號表示方法,包括
    的頭像 發表于 06-24 11:33 ?1888次閱讀

    【大語言模型:原理與工程實踐】大語言模型的基礎技術

    就無法修改,因此難以靈活應用于下游文本的挖掘中。 詞嵌入表示:將每個詞映射為一個低維稠密的實值向量。不同的是,基于預訓練的詞嵌入表示先在語料庫中利用某種語言模型進行預訓練,然后將其應用到下游任務中,詞
    發表于 05-05 12:17

    中間繼電器的應用 中間繼電器在使用中的注意事項

    中間繼電器(intermediate relay):它用于在控制電路中傳遞中間信號。中間繼電器的結構和原理與交流接觸器基本相同
    的頭像 發表于 02-28 10:26 ?1212次閱讀
    <b class='flag-5'>中間</b>繼電器的應用 <b class='flag-5'>中間</b>繼電器在使用中的注意事項

    助力移動機器人下游任務!Mobile-Seed用于聯合語義分割和邊界檢測

    精確、快速地劃定清晰的邊界和魯棒的語義對于許多下游機器人任務至關重要,例如機器人抓取和操作、實時語義建圖以及在邊緣計算單元上執行的在線傳感器校準。
    的頭像 發表于 02-20 10:30 ?899次閱讀
    助力移動機器人下游任務!Mobile-Seed<b class='flag-5'>用于</b>聯合<b class='flag-5'>語義</b><b class='flag-5'>分割</b>和邊界檢測

    基于Transformer的多模態BEV融合方案

    由于大量的相機和激光雷達特征以及注意力的二次性質,將 Transformer 架構簡單地應用于相機-激光雷達融合問題是很困難的。
    發表于 01-23 11:39 ?821次閱讀
    基于<b class='flag-5'>Transformer</b>的多模態BEV融合方案
    主站蜘蛛池模板: 东京热无码中文字幕av专区| 亚洲精品在线免费| 蜜桃日本MV免费观看| 精品无码乱码AV| 国产一区二区三区影院| 国产精品欧美亚洲| 国产成人免费片在线视频观看| X8X8拨牐拨牐X8免费视频8午夜| 9477小游戏| 99精品国产福利在线观看| 97免费人妻在线观看| 7723日本高清完整版在线观看| 在线观看视频中文字幕| 一个人看的www视频动漫版| 亚洲欧美视频在线| 亚洲午夜精品A片久久WWW软件| 亚洲 日韩 在线 国产 视频| 亚洲AV精品无码喷水直播间| 亚洲m男在线中文字幕| 亚洲成人欧美| 亚洲日本欧美日韩高观看| 野花韩国在线观看| 在线免费公开视频| 91麻豆精品| 边做边爱BD免费看片| 富婆大保健嗷嗷叫普通话对白| 国产AV白丝爆浆在线播放| 国产精品一区二区三区免费| 国产一卡 二卡三卡四卡无卡乱码视频 | 国产区在线不卡视频观看| 国产乱码伦人偷精品视频| 狠狠色香婷婷久久亚洲精品| 久久精麻豆亚洲AV国产品| 噜噜噜狠狠夜夜躁| 欧美人成在线观看ccc36| 人妖操女人| 午夜日韩久久影院| 一本道久在线综合色色| 99视频免视看| 囯产少妇BBBBBB高潮喷水一| 果冻传媒9CM在线观看|