一个人www在线视频,最新四虎4hu影库地址在线,无人在线高清免费看

語義分割

目的：給定一張圖像，我們要對這張圖像上的每個pixel逐一進行分類，結果展示如下圖：

上圖中的實例分割是語義分割的延伸，要區別出相同類別的不同個體。

應用場景：無人駕駛、輔助醫療等。

語義分割方法發展過程：

1.灰度分割(Gray Level Segmentation)

語義分割的最簡單形式是對一個區域設定必須滿足的硬編碼規則或屬性，進而指定特定類別標簽. 編碼規則可以根據像素的屬性來構建，如灰度級強度(gray level intensity). 基于該技術的一種分割方法是 Split and Merge 算法. 該算法是通過遞歸地將圖像分割為子區域，直到可以分配標簽；然后再合并具有相同標簽的相鄰子區域。

這種方法的問題是規則必須是硬編碼的. 而且，僅使用灰度級信息是很難表示比如人類等復雜類別的. 因此，需要特征提取和優化技術來正確地學習復雜類別的特征表示。

2.條件隨機場(Conditional Random Fields)

CRFs 是一類用于結構化預測的統計建模方法. 不同于分類算法，CRFs 在進行預測前，會考慮像素的鄰近信息(neighboring context)，如像素間的關系. 這使得 CRFs 成為語義分割的理想候選者. 這里介紹下 CRFs 在語義分割中的應用.

圖像中的每個像素都是與有限的可能狀態集相關. 在語義分割中，target 類別標簽就是可能狀態集. 將一個狀態(或，label u) 分配給的單個像素 x 的成本(cost) 被稱為一元成本(unary cost). 為了對像素間的關系進行建模，還進一步考慮將一對標簽(labels (u, v)) 分配給一對像素 (x, y)，其被成為成對成本(pairwise cost). 可以采用直接相鄰的像素對作為像素對(Grid CRF)；也可以采用圖像中所有的像素構建像素對(Denser CRF)。

圖像中所有 unary cost 和 pairwise cost 的相加和作為 CRF 的能量函數(或損失函數，loss). 求解最小化即可得到較好的分割輸出。

深度學習極大地簡化了語義分割的流程(pipeline)，并得到了較高質量的分割結果

3.FCN

FCN方法的提出成功的將深度學習方法成功的引入到了語義分割領域，由于要預測的圖像是一個二維的表示，因此提出了全卷積網絡用來抽取圖像中的特征，將得到的高級語義特征上采樣到指定的維度，從而得到了最終的預測結果，從而自然的形成了Encoder-Decoder框架，這也成為了語義分割領域中通用框架之一。

具體的模型圖如下：

由于在Encoder中獲取到圖像的高級語義，但是其并不是最終分割的結果，因此作者采用轉置卷積的方法將該高級特征上采樣到指定的維度，從而得到最終的分割結果。由于直接上采樣之后的結果并不好，因此在改論文中引入了跳躍模型就是將不同卷積層下獲取到的特征相融合，從而改善模型的效果，其具體結構如下所示：

4.U-NET, SegNet 等

為了改善FCN中的弊端，隨后提出了很多模型最經典的是U-Net，SegNet，但是他們的本質上并沒有改變Encoder-Decoder模型的架構。

5.DeepLab系列

DeepLab的出現帶來了一個新的方法就是擴展卷積（空洞卷積）方法，卷積層引入了一個稱為 “擴張率(dilation rate)”的新參數，該參數定義了卷積核處理數據時各值的間距。其目的是為了擴大模型的感受野，使其能夠感受到更大范圍下的特征信息。具體的體現如下所示：

擴展卷積方法的提出讓人們可以去除Encoder-Decoder框架的限制。隨后deeplab算法的改進也提出了例如多尺度學習的通則紅描述方法（ASPP等）

6.NOW

面對監督式方法---最近的方法大家更注重于實時的語義分割任務，也就是輕量級的語義分割網絡的設計。當然還有一些其他的方法，例如針對不同的領域設計不同的語義分割網絡、改進上采樣方法等。

面對弱監督方法---目前出現了很多弱監督方法，就是通過學習圖像分類的數據集（image-level tag）中的信息，來完成語義分割這種密度預測的任務。當然還有使用框架注釋來標注數據(bounding-boxes tag)的。

語義分割領域中困難的地方：

1、數據問題：分割不像檢測等任務，只需要標注一個類別就可以拿來使用，分割需要精確的像素級標注，包括每一個目標的輪廓等信息，因此使得制作數據集成本過高；

2、計算資源問題：現在想要得到較高的精度的語義分割模型就需要使用類似于ResNet101等深網絡。同時，分割預測了每一個像素，這就要求feature map的分辨率盡可能的高，這都說明了計算資源的問題，雖然也有一些輕量級的網絡，但精度還是太低了；

3、精細分割：目前的方法中對于圖像中的大體積的東西能夠很好的分類，但是對于細小的類別，由于其輪廓太小，從而無法精確的定位輪廓，造成精度較低；

4、上下文信息：分割中上下文信息很重要，否則會造成一個目標被分成多個part，或者不同類別目標分類成相同類別；

評價指標：

1、執行時間：速度或運行時間是一個非常有價值的度量，因為大多數系統需要保證推理時間可以滿足硬實時的需求。然而在通常的實驗中其影響是很不明顯的，并且該指標非常依賴硬件設備及后臺實現，致使一些比較是無用的。

2、內存占用：在運行時間相同的情況下，記錄系統運行狀態下內存占用的極值和均值是及其有價值的。

3、精確度：這里指的是逐像素標記的精度測量，假設共有k個類（從l0到lk其中有一個類別是屬于背景的。），Pij表示本屬于i類但是被預測為j類的像素個數，Pii表示為真正分對類的數量，而Pij與Pji分別被稱為假正樣本和假負樣本。

1）Pixel Accuracy（PA，像素精度）：標記正確的像素占總像素的比例

2）Mean Pixel Accuracy(MPA，平均像素精度)：計算每個類內被正確分類像素數比例，之后求所有類的平均數。

3）Mean Intersection over Union(MIoU，均交并比)：為語義分割的標準度量，其計算兩個集合的交集和并集之比，這兩個集合分別為ground truth 與predicted segmentation,在每個類上計算IoU，之后將其求平均。

-----IoU即真正樣本數量/（真正樣本數量+假正樣本數量+假負樣本數量）

4）Frequency weighted Intersection over Union(FWIoU,頻權交并)：是MIoU的一種提升，這種方法根據每個類出現的頻率為期設置權重。

責任編輯：lq

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

圖像

圖像

+關注

關注
2

文章
1083

瀏覽量
40449
函數

函數

+關注

關注
3

文章
4327

瀏覽量
62573
分割

分割

+關注

關注
0

文章
17

瀏覽量
11895

原文標題：語義分割入門的總結

文章出處：【微信號：vision263com，微信公眾號：新機器視覺】歡迎添加關注！文章轉載請注明出處。

利用VLM和MLLMs實現SLAM語義增強

語義同步定位與建圖（SLAM）系統在對鄰近的語義相似物體進行建圖時面臨困境，特別是在復雜的室內環境中。本文提出了一種面向對象SLAM的語義增強（SEO-SLAM）的新型SLAM系統，借助視覺語言模型

發表于 12-05 10:00 ?122次閱讀

利用VLM和MLLMs實現SLAM<b class='flag-5'>語義</b>增強

語義分割25種損失函數綜述和展望

語義圖像分割，即將圖像中的每個像素分類到特定的類別中，是許多視覺理解系統中的重要組成部分。作為評估統計模型性能的主要標準，損失函數對于塑造基于深度學習的分割算法的發

發表于 10-22 08:04 ?470次閱讀

<b class='flag-5'>語義</b><b class='flag-5'>分割</b>25種損失函數綜述和展望

圖像語義分割的實用性是什么

圖像語義分割是一種重要的計算機視覺任務，它旨在將圖像中的每個像素分配到相應的語義類別中。這項技術在許多領域都有廣泛的應用，如自動駕駛、醫學圖像分析、機器人導航等。一、圖像語義

發表于 07-17 09:56 ?415次閱讀

圖像分割和語義分割的區別與聯系

圖像分割和語義分割是計算機視覺領域中兩個重要的概念，它們在圖像處理和分析中發揮著關鍵作用。 1. 圖像分割簡介圖像分割是將圖像劃分為多個區

發表于 07-17 09:55 ?908次閱讀

圖像分割與目標檢測的區別是什么

圖像分割與目標檢測是計算機視覺領域的兩個重要任務，它們在許多應用場景中都發揮著關鍵作用。然而，盡管它們在某些方面有相似之處，但它們的目標、方法和應用場景有很大的不同。本文將介紹圖像分割與目標檢測

發表于 07-17 09:53 ?1275次閱讀

機器學習中的數據分割方法

在機器學習中，數據分割是一項至關重要的任務，它直接影響到模型的訓練效果、泛化能力以及最終的性能評估。本文將從多個方面詳細探討機器學習中數據分割的方法，包括常見的分割

發表于 07-10 16:10 ?1697次閱讀

圖像分割與語義分割中的CNN模型綜述

圖像分割與語義分割是計算機視覺領域的重要任務，旨在將圖像劃分為多個具有特定語義含義的區域或對象。卷積神經網絡（CNN）作為深度學習的一種核心模型，在圖像

發表于 07-09 11:51 ?829次閱讀

機器人視覺技術中常見的圖像分割方法

機器人視覺技術中的圖像分割方法是一個廣泛且深入的研究領域。圖像分割是將圖像劃分為多個區域或對象的過程，這些區域或對象具有某種共同的特征，如顏色、紋理、形狀等。在機器人視覺中，圖像

發表于 07-09 09:31 ?658次閱讀

人工智能的定義和發展過程

人工智能（Artificial Intelligence，簡稱AI）是計算機科學的一個分支，旨在通過計算機程序或機器來模擬、實現人類智能的技術和方法。它使計算機能夠具備感知、理解、判斷、推理、學習

發表于 07-04 14:05 ?1050次閱讀

機器人視覺技術中圖像分割方法有哪些

和分析。本文將詳細介紹圖像分割的各種方法，包括傳統的圖像處理方法和基于深度學習的方法。閾值分割法閾值

發表于 07-04 11:34 ?933次閱讀

陶瓷電熔爐啟動過程中升溫停止問題的原因及解決辦法分析

放射性廢物的處置問題一直是核工業發展過程中不可忽視的關鍵環節。核燃料后處理循環過程中產生的高放廢液的安全處置是放射性廢物處理的關鍵，國際上比較成熟的高放廢液處理方法是玻璃固化[1]。

發表于 03-12 16:43 ?614次閱讀

助力移動機器人下游任務！Mobile-Seed用于聯合語義分割和邊界檢測

精確、快速地劃定清晰的邊界和魯棒的語義對于許多下游機器人任務至關重要，例如機器人抓取和操作、實時語義建圖以及在邊緣計算單元上執行的在線傳感器校準。

發表于 02-20 10:30 ?895次閱讀

OpenCV兩種不同方法實現粘連大米分割計數

測試圖如下，圖中有個別米粒相互粘連，本文主要演示如何使用OpenCV用兩種不同方法將其分割并計數。

發表于 01-22 14:55 ?1716次閱讀

改進棉花根系圖像分割方法

的重要方法，受限于圖像質量、復雜土壤環境、低效傳統方法，根系圖像分割存在一定挑戰。河北農業大學機電工程學院、河北省教育考試院、河北農業大學農學院組成王楠科研團隊，為提高根系圖像分割的準

發表于 01-18 16:18 ?295次閱讀

PCB信號跨分割線需要怎么處理？

在PCB設計過程中，電源平面的分割或者是地平面的分割，會導致平面的不完整，這樣信號走線的時候，它的參考平面就會出現從一個電源面跨接到另一個電源面，這種現象我們就叫做信號跨分割。

發表于 01-10 15:28 ?1034次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

語義分割方法發展過程

評論

利用VLM和MLLMs實現SLAM語義增強

語義分割25種損失函數綜述和展望

圖像語義分割的實用性是什么

圖像分割和語義分割的區別與聯系

圖像分割與目標檢測的區別是什么

機器學習中的數據分割方法

圖像分割與語義分割中的CNN模型綜述

機器人視覺技術中常見的圖像分割方法

人工智能的定義和發展過程

機器人視覺技術中圖像分割方法有哪些

陶瓷電熔爐啟動過程中升溫停止問題的原因及解決辦法分析

助力移動機器人下游任務！Mobile-Seed用于聯合語義分割和邊界檢測

OpenCV兩種不同方法實現粘連大米分割計數

改進棉花根系圖像分割方法

PCB信號跨分割線需要怎么處理？