在线国产区,在线欧美亚洲,甜逼

1 前言

之前已經有過關于小樣本語義分割的論文解讀，關于如何用 Transformer 思想的分類器進行小樣本分割。本篇是發表在 CVPR 2022 上的 Generalized Few-shot Semantic Segmentation（后文簡稱 GFS-Seg），既一種泛化的小樣本語義分割模型。在看論文的具體內容之前，我們先了解一些前置知識。

深度學習是 Data hunger 的方法，需要大量的數據，標注或者未標注。少樣本學習研究就是如何從少量樣本中去學習。拿分類問題來說，每個類只有一張或者幾張樣本。少樣本學習可以分為 Zero-shot Learning（即要識別訓練集中沒有出現過的類別樣本）和 One-Shot Learning/Few shot Learning（即在訓練集中，每一類都有一張或者幾張樣本）。以 Zero-shot Learning 來說，比如有一個中文 “放棄”，要你從 I, your、 she、them 和 abnegation 五個單詞中選擇出來對應的英文單詞，盡管你不知道“放棄”的英文是什么，但是你會將“放棄”跟每個單詞對比，而且在你之前的學習中，你已經知道了 I、 your、she 和 them 的中文意思，都不是“放棄”，所以你會選擇 abnegation。還需要明確幾個概念：

Support set：支撐集，每次訓練的樣本集合。

Query set：查詢集，用于與訓練樣本比對的樣本，一般來說 Query set 就是一個樣本。

在 Support set 中，如果有 n 個種類，每個種類有 k 個樣本，那么這個訓練過程叫 n-way k-shot。如每個類別是有 5 個 examples 可供訓練，因為訓練中還要分 Support set 和 Query set，5-shots 場景至少需要 5+1 個樣例，至少一個 Query example 去和 Support set 的樣例做距離（分類）判斷。

2 概述

訓練語義分割模型需要大量精細注釋的數據，這使得它很難快速適應不滿足這一條件的新類，FS-Seg 在處理這個問題時有很多限制條件。在這篇文章中引入了一個新的方法，稱為 GFS-Seg，能同時分割具有極少樣本的新類別和具有足夠樣本的基礎類別的能力。建立了一個 GFS-Seg baseline，在不對原模型進行結構性改變的情況下能取得不錯的性能。此外，由于上下文信息對語義分割至關重要，文中提出了上下文感知原型學習架構（CAPL），利用 Support Set 樣本共同的先驗知識，根據每個 Query Set 圖像的內容動態地豐富分類器的上下文信息，顯著提高性能。

3 GFS-Seg 和 FS-Seg 的 Pipeline 區別

如下圖所示，GFS-Seg 有三個階段。分別是：基類的學習階段；新類的注冊階段，其中包含新類的少數 Support set 樣本；對基類和新類的評估階段。也就是說，GFS-Seg 與 FS-Seg 的區別在于，在評估階段，GFS-Seg 不需要轉發測試（Query set）樣本中包含相同目標類的 Support set 樣本來進行預測，因為 GFS-Seg 在基類學習階段和新類注冊階段應該已經分別獲得了基類和新類的信息。GFS-Seg 在事先不知道查詢圖像中包含哪些類別的情況下，同時對新類進行預測時，可以在不犧牲基類準確性的情況下仍表現良好。

4 Towards GFS-Seg

在經典的 Few-Shot Segmentation 任務中，有兩個關鍵標準：(1) 模型在訓練期間沒有看到測試類的樣本。(2) 模型要求其 Support set 樣本包含 Query set 中存在的目標類，以做出相應的預測。

通過下圖，我們來看下 GFS-Seg 與經典人物有哪些不同。下圖中用相同的 Query 圖像說明了 FS-Seg 和 GFS-Seg 的一個 2-way K-shot 任務，其中牛和摩托車是新的類，人和車是基類。先來看下 (a)，Prototype Network 通過 Embedding Generation 函數，將牛和摩托車的少量訓練樣本映射為 2 個向量，在檢測分類時候，將待分割圖像的特征也通過 Embedding Generation 映射為向量，最后計算待檢測向量與 2 個向量的特征差異（假設是距離），認定距離最小的為預測類別。(a) 只限于預測 Support set 中包含的類的二進制分割掩碼。右邊的人和上面的車在預測中缺失，因為支持集沒有提供這些類的信息，即使模型已經在這些基類上訓練了足夠的 epoch。此外，如果 (a) 的支持集提供了查詢圖像中沒有的多余的新類（如飛機），這些類別可能會影響模型性能，因為 FS-Seg 有一個前提條件，即 Query 圖像必須是 Support set 樣本提供的類。

FS-Seg 模型只學習并預測給定的新類的前景掩碼，所以在我們提出的 GFS-Seg 的通用化設置中，性能會大大降低，因為所有可能的基類和新類都需要預測。不同的是，(b) 也就是 GFS-Seg，在沒有 Query 圖像中包含的類的先驗知識的情況下，同時識別基類和新類，額外的 Support set（如 (b) 左上角的飛機）應該不會對模型產生很大影響。在評估過程中，GFS-Seg 不需要事先了解 Query 圖像中存在哪些目標類別，而是通過注冊新的類別，對所有測試圖像一次性形成一個新的分類器（(b) 中的藍色區域代表新的類別注冊階段）。

此外，還有更多關于 GFS-Seg 的 baseline 細節，這里就不詳細展開了，讀者們可以一遍看代碼一邊看論文中的解釋，不難理解。

5 上下文感知原型學習（CAPL）

原型學習（PL）適用于小樣本分類和 FS-Seg，但它對 GFS-Seg 的效果較差。在 FS-Seg 的設置中，查詢樣本的標簽只來自于新的類別。因此，新類和基類之間沒有必要的聯系，可以利用它來進一步改進。然而，在 GFS-Seg 中，對每個測試圖像中包含的類別沒有這樣的限制，需要對所有可能的基類和新穎類進行預測。

如上圖所示，我們不關注 SCE 和 DQCE 的計算過程。SCE 只發生在新的類注冊階段，它利用支持 Support set 樣本來提供先驗知識。然而，在評估階段，新分類器由所有 Query 圖像共享，因此引入的先驗可能會偏向于有限的 Support set 樣本的內容，導致對不同 Query 圖像的泛化能力較差。為了緩解這個問題，進一步提出了動態查詢上下文豐富計算（DQCE），它通過動態合并從單個查詢樣本中挖掘的基本語義信息，使新分類器適應不同的上下文。繼續看上圖，N‘n 個新類別（例如摩托車和奶牛）的權重直接由特征平均得出。此外，Support set 中出現的 N’b 個基類（例如人、汽車、羊和公共汽車）的權重由 SCE 用原始權重計算得出。此外，DQCE 通過從 Query set 樣本中提取的臨時上下文特征，動態豐富了分類器中 N'b 個基類的權重。綜上，新的分類器結合了 SCE 和 DQCE 的優點。

GFS-Seg 使用 CAPL 的方式完成訓練，具體性能表現在下面的實驗部分列出。

6 實驗

如下表所示，CANet、SCL、PFENet 和 PANet 與用 CAPL 實現的模型相比表現不佳。值得注意的是，下表中的 mIoU 的結果是在 GFS-Seg 配置下的，因此它們低于這些 FS-Seg 模型的論文中給出的結果，這種差異是由不同的全局設置造成的。在 GFS-Seg 中，模型需要在給定的測試圖像中識別所有的類，包括基類和新類，而在 FS-Seg 中，模型只需要找到屬于一個特殊的新類的像素，不會去分割基類，Support set 的樣本提供了目標類是什么的先驗知識。因此，在 GFS-Seg 中，存在基類干擾的情況下，識別新類要難得多，所以數值很低。

FS-Seg 是 GFS-Seg 的一個極端情況。所以為了在 FS-Seg 的中驗證提出的 CAPL，在下表中，我們將 CAPL 合并到 PANet 和 PFENet。可以看出， CAPL 對 baseline 實現了顯著的改進。數據集是 Pascal-5i 和 COCO-20i ，只需要識別新類。

下圖對分割結果進行了可視化，其中 SCE 和 DQCE 的組合進一步完善了 baseline 的預測，還有一些消融實驗的效果這里不一一列出了。

7 結論

這篇閱讀筆記僅為個人理解，文章提出了一個具有泛化性的小樣本語義分割（GFS-Seg），并提出了一個新的解決方案：上下文感知原型學習（CAPL）。與經典的 FS-Seg 不同，GFS-Seg 旨在識別 FS-Seg 模型所不能識別的基礎類和新類。提出的 CAPL 通過動態地豐富上下文信息的適應性特征，實現了性能的顯著提高。CAPL 對基礎模型沒有結構上的限制，因此它可以很容易地應用于普通的語義分離框架，并且它可以很好地推廣到 FS-Seg。

審核編輯：劉清

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

原文標題：CVPR 2022：Generalized Few-shot Semantic Segmentation 解讀

文章出處：【微信號：GiantPandaCV，微信公眾號：GiantPandaCV】歡迎添加關注！文章轉載請注明出處。

ADS8556和ADS8568采集一個樣本點最快支持多少nS？

求教一下，有應用經驗的給指導一下，ADS8556 和ADS8568 采集一個樣本點最快支持多少nS，且兩個相鄰樣本點的數據不能相互串擾。

發表于 12-09 07:16

手冊上新 |迅為RK3568開發板NPU例程測試

yolov5目標檢測 6.13 yolov5-seg語義分割 6.14 yolov6目標檢測 6.15 yolov7目標檢測 6.16 yolov8目標檢測 6.17 yolov8_seg

發表于 10-23 14:06

語義分割25種損失函數綜述和展望

本綜述提供了對25種用于圖像分割的損失函數的全面且統一的回顧。我們提供了一種新穎的分類法，并詳細審查了這些損失函數如何在圖像分割中被定制和利用，強調了它們的重要特征和應用，并進行了系統

發表于 10-22 08:04 ?567次閱讀

畫面分割器怎么調試

畫面分割器，通常指的是視頻畫面分割器，它是一種可以將一個視頻信號分割成多個小畫面的設備。這種設備

發表于 10-17 09:32 ?412次閱讀

手冊上新 |迅為RK3568開發板NPU例程測試

yolov5目標檢測 6.13 yolov5-seg語義分割 6.14 yolov6目標檢測 6.15 yolov7目標檢測 6.16 yolov8目標檢測 6.17 yolov8_seg

發表于 08-12 11:03

system_adc_read_fast為什么只能采集255個樣本？

system_adc_read_fast僅采集 255 個樣本當樣本數量增加時，函數凍結，看門狗復位芯片。 NONOS 2.0

發表于 07-18 08:31

圖像語義分割的實用性是什么

圖像語義分割是一種重要的計算機視覺任務，它旨在將圖像中的每個像素分配到相應的語義類別中。這項技術在許多領域都有廣泛的應用，如自動駕駛、醫學圖像分析、機器人導航等。

發表于 07-17 09:56 ?438次閱讀

圖像分割和語義分割的區別與聯系

圖像分割和語義分割是計算機視覺領域中兩個重要的概念，它們在圖像處理和分析中發揮著關鍵作用。 1. 圖像分割簡介圖像

發表于 07-17 09:55 ?984次閱讀

迅為RK3568手冊上新 | RK3568開發板NPU例程測試

6.13 yolov5-seg語義分割 6.14 yolov6目標檢測 6.15 yolov7目標檢測 6.16 yolov8目標檢測 6.17 yolov8_seg

發表于 07-12 14:44

機器學習中的數據分割方法

在機器學習中，數據分割是一項至關重要的任務，它直接影響到模型的訓練效果、泛化能力以及最終的性能評估。本文將從多個方面詳細探討機器學習中數據分割的方法，包括常見的

發表于 07-10 16:10 ?1822次閱讀

圖像分割與語義分割中的CNN模型綜述

圖像分割與語義分割是計算機視覺領域的重要任務，旨在將圖像劃分為多個具有特定語義含義的區域或對象。卷積神經網絡（CNN）作為深度學習的

發表于 07-09 11:51 ?928次閱讀

機器人視覺技術中常見的圖像分割方法

機器人視覺技術中的圖像分割方法是一個廣泛且深入的研究領域。圖像分割是將圖像劃分為多個區域或對象的過程，這些區域或對象具有某種共同的特征，如顏

發表于 07-09 09:31 ?720次閱讀

Bootloader.ld文件的iram_seg范圍是多大呢？

的bootloader.ld，調試iram和dram的org和len可以解決問題。因此，我有一個疑問。 iram_seg和dram_seg的范圍分別是什么呢？我嘗試往前調整過org

發表于 06-14 08:10

在components下添加自定義組件，為什么my_seg組件就找不到my_seg.h頭文件？

這是我的項目結構，在components下，我自定義了三個組件，分別為my_gpio,my_timer,my_seg，每個組件都添加了CMAKE，并且my_gpio和my_timer組件已經能成

發表于 06-05 06:54

SEG Solar與Grand Batang City簽訂用地協議

東南亞最大光伏產業園區土地正式交付休斯頓2024年5月15日 /美通社/ -- 5月15日，美國領先光伏組件制造商SEG Solar(簡稱"SEG")與印度尼西亞最大的國有企業工業園區

發表于 05-15 14:03 ?442次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

一個具有泛化性的小樣本語義分割（GFS-Seg）

評論

ADS8556和ADS8568采集一個樣本點最快支持多少nS？

手冊上新 |迅為RK3568開發板NPU例程測試

語義分割25種損失函數綜述和展望

畫面分割器怎么調試

手冊上新 |迅為RK3568開發板NPU例程測試

system_adc_read_fast為什么只能采集255個樣本？

圖像語義分割的實用性是什么

圖像分割和語義分割的區別與聯系

迅為RK3568手冊上新 | RK3568開發板NPU例程測試

機器學習中的數據分割方法

圖像分割與語義分割中的CNN模型綜述

機器人視覺技術中常見的圖像分割方法

Bootloader.ld文件的iram_seg范圍是多大呢？

在components下添加自定義組件，為什么my_seg組件就找不到my_seg.h頭文件？

SEG Solar與Grand Batang City簽訂用地協議