香蕉视频久久,曰批全过程免费视频观看软件,亚洲女同在线观看

這篇文章展示了一個具體的文檔示例，演示如何使用深度學(xué)習(xí)和 Computer Vision System Toolbox 訓(xùn)練語義分割網(wǎng)絡(luò)。

語義分割網(wǎng)絡(luò)對圖像中的每個像素進行分類，從而生成按類分割的圖像。語義分割的應(yīng)用包括用于自動駕駛的道路分割和醫(yī)學(xué)診斷中的癌細胞分割。

如需了解更多文檔示例和詳細信息，建議查閱技術(shù)文檔：https://cn.mathworks.com/help

為了說明訓(xùn)練過程，本示例將訓(xùn)練 SegNet，一種用于圖像語義分割的卷積神經(jīng)網(wǎng)絡(luò) (CNN)。用于語義分割的其他類型網(wǎng)絡(luò)包括全卷積網(wǎng)絡(luò) (FCN) 和 U-Net。以下所示訓(xùn)練過程也可應(yīng)用于這些網(wǎng)絡(luò)。

本示例使用來自劍橋大學(xué)的CamVid 數(shù)據(jù)集展開訓(xùn)練。此數(shù)據(jù)集是包含駕駛時所獲得的街道級視圖的圖像集合。該數(shù)據(jù)集為 32 種語義類提供了像素級標簽，包括車輛、行人和道路。

建立

本示例創(chuàng)建了 SegNet 網(wǎng)絡(luò)，其權(quán)重從 VGG-16 網(wǎng)絡(luò)初始化。要獲取 VGG-16，請安裝Neural Network Toolbox Model for VGG-16 Network：

安裝完成后，運行以下代碼以驗證是否安裝正確。

vgg16();

此外，請下載預(yù)訓(xùn)練版 SegNet。預(yù)訓(xùn)練模型可支持您運行整個示例，而無需等待訓(xùn)練完成。

關(guān)于如何使用MATLAB 深度學(xué)習(xí)進行語義分割的方法詳解

強烈建議采用計算能力為 3.0 或更高級別，支持 CUDA 的 NVIDIA GPU 來運行本示例。使用 GPU 需要 Parallel Computing Toolbox。

下載 CamVid 數(shù)據(jù)集

從以下 URL 中下載 CamVid 數(shù)據(jù)集。

關(guān)于如何使用MATLAB 深度學(xué)習(xí)進行語義分割的方法詳解

注意：數(shù)據(jù)下載時間取決于您的 Internet 連接情況。在下載完成之前，上面使用的命令會阻止訪問 MATLAB。或者，您可以使用 Web 瀏覽器先將數(shù)據(jù)集下載到本地磁盤。要使用從 Web 中下載的文件，請將上述 outputFolder 變量更改為下載文件的位置。

加載 CamVid 圖像

用于加載 CamVid 圖像。借助 imageDatastore，可以高效地加載磁盤上的大量圖像數(shù)據(jù)。

imgDir = fullfile(outputFolder,'images','701_StillsRaw_full');imds = imageDatastore(imgDir);

顯示其中一個圖像。

I = readimage(imds,1);I = histeq(I);imshow(I)

加載 CamVid 像素標簽圖像

使用imageDatastore加載 CamVid 像素標簽圖像。pixelLabelDatastore 將像素標簽數(shù)據(jù)和標簽 ID 封裝到類名映射中。

按照 SegNet 原創(chuàng)論文（Badrinarayanan、Vijay、Alex Kendall 和 Roberto Cipolla：《SegNet：用于圖像分割的一種深度卷積編碼器-解碼器架構(gòu)》(SegNet: A Deep Convolutional Encoder-Decoder Architecture for ImageSegmentation)。arXiv 預(yù)印本：1511.00561，201）中采用的步驟進行操作，將 CamVid 中的 32 個原始類分組為 11 個類。指定這些類。

classes = [ "Sky" "Building" "Pole" "Road" "Pavement" "Tree" "SignSymbol" "Fence" "Car" "Pedestrian" "Bicyclist" ];

要將 32 個類減少為 11 個，請將原始數(shù)據(jù)集中的多個類組合在一起。例如，“Car” 是 “Car” 、 “SUVPickupTruck” 、 “Truck_Bus” 、 “Train” 和 “OtherMoving” 的組合。使用支持函數(shù) camvidPixelLabelIDs 返回已分組的標簽 ID，該函數(shù)會在本示例的末尾列出。

labelIDs = camvidPixelLabelIDs();

使用這些類和標簽 ID 創(chuàng)建 pixelLabelDatastore。

labelDir = fullfile(outputFolder,'labels');pxds = pixelLabelDatastore(labelDir,classes,labelIDs);

讀取并在一幅圖像上疊加顯示像素標簽圖像。

C = readimage(pxds,1);cmap = camvidColorMap;B = labeloverlay(I,C,'ColorMap',cmap);imshow(B)pixelLabelColorbar(cmap,classes);

沒有顏色疊加的區(qū)域沒有像素標簽，在訓(xùn)練期間不會使用這些區(qū)域。

分析數(shù)據(jù)集統(tǒng)計信息

要查看 CamVid 數(shù)據(jù)集中類標簽的分布情況，請使用countEachLabel。此函數(shù)會按類標簽計算像素數(shù)。

tbl = countEachLabel(pxds)

關(guān)于如何使用MATLAB 深度學(xué)習(xí)進行語義分割的方法詳解

按類可視化像素計數(shù)。

frequency = tbl.PixelCount/sum(tbl.PixelCount);bar(1:numel(classes),frequency)xticks(1:numel(classes)) xticklabels(tbl.Name)xtickangle(45)ylabel('Frequency')

關(guān)于如何使用MATLAB 深度學(xué)習(xí)進行語義分割的方法詳解

理想情況下，所有類都有相同數(shù)量的觀察結(jié)果。但是，CamVid 中的這些類比例失衡，這是街道場景汽車數(shù)據(jù)集中的常見問題。由于天空、建筑物和道路覆蓋了圖像中的更多區(qū)域，因此相比行人和騎自行車者像素，這些場景擁有更多的天空、建筑物和道路像素。如果處理不當，這種失衡可能影響學(xué)習(xí)過程，因為學(xué)習(xí)過程偏向主導(dǎo)類。在本示例中，您稍后將使用類權(quán)重來處理此問題。

調(diào)整 CamVid 數(shù)據(jù)的大小

CamVid 數(shù)據(jù)集中的圖像大小為 720 x 960。要減少訓(xùn)練時間和內(nèi)存使用量，請將圖像和像素標記圖像的大小調(diào)整為 360 x 480。resizeCamVidImages 和 resizeCamVidPixelLabels 是本示例末尾所列出的支持函數(shù)。

關(guān)于如何使用MATLAB 深度學(xué)習(xí)進行語義分割的方法詳解

準備訓(xùn)練集和測試集

使用數(shù)據(jù)集中 60% 的圖像訓(xùn)練 SegNet。其余圖像用于測試。以下代碼會將圖像和像素標記數(shù)據(jù)隨機分成訓(xùn)練集和測試集。

[imdsTrain,imdsTest,pxdsTrain,pxdsTest] = partitionCamVidData(imds,pxds);

60/40 拆分會生產(chǎn)以下數(shù)量的訓(xùn)練圖像和測試圖像：

numTrainingImages = numel(imdsTrain.Files)

numTrainingImages = 421

numTestingImages = numel(imdsTest.Files)

numTestingImages = 280

創(chuàng)建網(wǎng)絡(luò)

使用segnetLayers創(chuàng)建利用 VGG-16 權(quán)重初始化的 SegNet 網(wǎng)絡(luò)。segnetLayers 會自動執(zhí)行傳輸 VGG-16 中的權(quán)重所需的網(wǎng)絡(luò)操作，并添加語義分割所需其他網(wǎng)絡(luò)層。

imageSize = [360 480 3];numClasses = numel(classes);lgraph = segnetLayers(imageSize,numClasses,'vgg16');

根據(jù)數(shù)據(jù)集中圖像的大小選擇圖像大小。根據(jù) CamVid 中的類選擇類的數(shù)量。

使用類權(quán)重平衡類

如前所示，CamVid 中的這些類比例失衡。要改進訓(xùn)練情況，可以使用類權(quán)重來平衡這些類。使用之前通過countEachLayer計算的像素標簽計數(shù)，并計算中值頻率類權(quán)重。

imageFreq = tbl.PixelCount ./ tbl.ImagePixelCount;classWeights = median(imageFreq) ./ imageFreq

關(guān)于如何使用MATLAB 深度學(xué)習(xí)進行語義分割的方法詳解

使用pixelClassificationLayer指定類權(quán)重。

pxLayer = pixelClassificationLayer('Name','labels','ClassNames',tbl.Name,'ClassWeights',classWeights)

關(guān)于如何使用MATLAB 深度學(xué)習(xí)進行語義分割的方法詳解

通過刪除當前 pixelClassificationLayer 并添加新層，使用新的 pixelClassificationLayer 更新 SegNet 網(wǎng)絡(luò)。當前 pixelClassificationLayer 名為“pixelLabels”。使用removeLayers刪除該層，使用addLayers添加新層，然后使用connectLayers將新層連接到網(wǎng)絡(luò)的其余部分。

關(guān)于如何使用MATLAB 深度學(xué)習(xí)進行語義分割的方法詳解

選擇訓(xùn)練選項

用于訓(xùn)練的優(yōu)化算法是引入動量的隨機梯度下降 (SGDM) 算法。使用trainingOptions指定用于 SGDM 的超參數(shù)。

關(guān)于如何使用MATLAB 深度學(xué)習(xí)進行語義分割的方法詳解

大小為 4 的 minimatch 用于減少訓(xùn)練時的內(nèi)存使用量。您可以根據(jù)系統(tǒng)中的 GPU 內(nèi)存量增加或減少此值。

數(shù)據(jù)擴充

在訓(xùn)練期間使用數(shù)據(jù)擴充向網(wǎng)絡(luò)提供更多示例，以便提高網(wǎng)絡(luò)的準確性。此處，隨機左/右反射以及 +/- 10 像素的隨機 X/Y 平移用于數(shù)據(jù)擴充。用于指定這些數(shù)據(jù)擴充參數(shù)。

關(guān)于如何使用MATLAB 深度學(xué)習(xí)進行語義分割的方法詳解

imageDataAugmenter 支持其他幾種類型的數(shù)據(jù)擴充。選擇它們需要經(jīng)驗分析，并且這是另一個層次的超參數(shù)調(diào)整。

開始訓(xùn)練

使用pixelLabelImageDatastore組合訓(xùn)練數(shù)據(jù)和數(shù)據(jù)擴充選擇。pixelLabelImageDatastore 會讀取批量訓(xùn)練數(shù)據(jù)，應(yīng)用數(shù)據(jù)擴充，并將已擴充的數(shù)據(jù)發(fā)送至訓(xùn)練算法。

關(guān)于如何使用MATLAB 深度學(xué)習(xí)進行語義分割的方法詳解

如果 doTraining 標志為 true，則會開始訓(xùn)練。否則，會加載預(yù)訓(xùn)練網(wǎng)絡(luò)。注意：NVIDIA Titan X 上的訓(xùn)練大約需要 5 個小時，根據(jù)您的 GPU 硬件具體情況，可能會需要更長的時間。

關(guān)于如何使用MATLAB 深度學(xué)習(xí)進行語義分割的方法詳解

在圖像上測試網(wǎng)絡(luò)

作為快速完整性檢查，將在測試圖像上運行已訓(xùn)練的網(wǎng)絡(luò)。

I = read(imdsTest);C = semanticseg(I, net);

顯示結(jié)果。

關(guān)于如何使用MATLAB 深度學(xué)習(xí)進行語義分割的方法詳解

將 C 中的結(jié)果與 pxdsTest 中的預(yù)期真值進行比較。綠色和洋紅色區(qū)域突出顯示了分割結(jié)果與預(yù)期真值不同的區(qū)域。

expectedResult = read(pxdsTest);actual = uint8(C);expected = uint8(expectedResult);imshowpair(actual, expected)

從視覺上看，道路、天空、建筑物等類的語義分割結(jié)果重疊情況良好。然而，行人和車輛等較小的對象則不那么準確。可以使用交叉聯(lián)合 (IoU) 指標（又稱 Jaccard 系數(shù)）來測量每個類的重疊量。使用jaccard函數(shù)測量 IoU。

iou = jaccard(C, expectedResult);table(classes,iou)

關(guān)于如何使用MATLAB 深度學(xué)習(xí)進行語義分割的方法詳解

IoU 指標可確認視覺效果。道路、天空和建筑物類具有較高的 IoU 分數(shù)，而行人和車輛等類的分數(shù)較低。其他常見的分割指標包括Dice 系數(shù)和Boundary-F1輪廓匹配分數(shù)。

評估已訓(xùn)練的網(wǎng)絡(luò)

要測量多個測試圖像的準確性，請在整個測試集中運行semanticseg。

pxdsResults = semanticseg(imdsTest,net,'MiniBatchSize',4,'WriteLocation',tempdir,'Verbose',false);

semanticseg 會將測試集的結(jié)果作為 pixelLabelDatastore 對象返回。imdsTest 中每個測試圖像的實際像素標簽數(shù)據(jù)會在“WriteLocation”參數(shù)指定的位置寫入磁盤。使用evaluateSemanticSegmentation測量測試集結(jié)果的語義分割指標。

metrics = evaluateSemanticSegmentation(pxdsResults,pxdsTest,'Verbose',false);

evaluateSemanticSegmentation返回整個數(shù)據(jù)集、各個類以及每個測試圖像的各種指標。要查看數(shù)據(jù)集級別指標，請檢查 metrics.DataSetMetrics。

metrics.DataSetMetrics

關(guān)于如何使用MATLAB 深度學(xué)習(xí)進行語義分割的方法詳解

數(shù)據(jù)集指標可提供網(wǎng)絡(luò)性能的高級概述。要查看每個類對整體性能的影響，請使用 metrics.ClassMetrics 檢查每個類的指標。

metrics.ClassMetrics

關(guān)于如何使用MATLAB 深度學(xué)習(xí)進行語義分割的方法詳解

盡管數(shù)據(jù)集整體性能非常高，但類指標顯示，諸如 Pedestrian、Bicyclist 和 Car 等代表性不足的類分割效果不如Road、Sky 和 Building 等類。附加數(shù)據(jù)多一些代表性不足類樣本可能會提升分割效果。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

網(wǎng)絡(luò)

網(wǎng)絡(luò)

+關(guān)注

關(guān)注
14

文章
7553

瀏覽量
88731
深度學(xué)習(xí)

深度學(xué)習(xí)

+關(guān)注

關(guān)注
73

文章
5500

瀏覽量
121113

Pytorch深度學(xué)習(xí)訓(xùn)練的方法

掌握這 17 種方法，用最省力的方式，加速你的 Pytorch 深度學(xué)習(xí)訓(xùn)練。

發(fā)表于 10-28 14:05 ?195次閱讀

Pytorch<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>訓(xùn)練的<b class='flag-5'>方法</b>

AI大模型與深度學(xué)習(xí)的關(guān)系

AI大模型與深度學(xué)習(xí)之間存在著密不可分的關(guān)系，它們互為促進，相輔相成。以下是對兩者關(guān)系的介紹：一、深度學(xué)習(xí)是AI大模型的基礎(chǔ) 技術(shù)支撐：深度

發(fā)表于 10-23 15:25 ?651次閱讀

語義分割25種損失函數(shù)綜述和展望

語義圖像分割，即將圖像中的每個像素分類到特定的類別中，是許多視覺理解系統(tǒng)中的重要組成部分。作為評估統(tǒng)計模型性能的主要標準，損失函數(shù)對于塑造基于深度學(xué)習(xí)的

發(fā)表于 10-22 08:04 ?470次閱讀

圖像語義分割的實用性是什么

什么是圖像語義分割圖像語義分割是一種將圖像中的所有像素點按照其語義類別進行分類的任務(wù)。與傳統(tǒng)

發(fā)表于 07-17 09:56 ?415次閱讀

圖像分割和語義分割的區(qū)別與聯(lián)系

圖像分割和語義分割是計算機視覺領(lǐng)域中兩個重要的概念，它們在圖像處理和分析中發(fā)揮著關(guān)鍵作用。 1. 圖像分割簡介圖像分割是將圖像劃分為多個區(qū)

發(fā)表于 07-17 09:55 ?908次閱讀

利用Matlab函數(shù)實現(xiàn)深度學(xué)習(xí)算法

在Matlab中實現(xiàn)深度學(xué)習(xí)算法是一個復(fù)雜但強大的過程，可以應(yīng)用于各種領(lǐng)域，如圖像識別、自然語言處理、時間序列預(yù)測等。這里，我將概述一個基本的流程，包括環(huán)境設(shè)置、數(shù)據(jù)準備、模型設(shè)計、訓(xùn)練過程、以及測試和評估，并提供一個基于

發(fā)表于 07-14 14:21 ?2166次閱讀

基于Python的深度學(xué)習(xí)人臉識別方法

基于Python的深度學(xué)習(xí)人臉識別方法是一個涉及多個技術(shù)領(lǐng)域的復(fù)雜話題，包括計算機視覺、深度學(xué)習(xí)、以及圖像處理等。在這里，我將概述一個基本的

發(fā)表于 07-14 11:52 ?1251次閱讀

機器學(xué)習(xí)中的數(shù)據(jù)分割方法

在機器學(xué)習(xí)中，數(shù)據(jù)分割是一項至關(guān)重要的任務(wù)，它直接影響到模型的訓(xùn)練效果、泛化能力以及最終的性能評估。本文將從多個方面詳細探討機器學(xué)習(xí)中數(shù)據(jù)分割的方法

發(fā)表于 07-10 16:10 ?1696次閱讀

深度學(xué)習(xí)中的時間序列分類方法

的發(fā)展，基于深度學(xué)習(xí)的TSC方法逐漸展現(xiàn)出其強大的自動特征提取和分類能力。本文將從多個角度對深度學(xué)習(xí)在時間序列分類中的應(yīng)用

發(fā)表于 07-09 15:54 ?877次閱讀

圖像分割與語義分割中的CNN模型綜述

圖像分割與語義分割是計算機視覺領(lǐng)域的重要任務(wù)，旨在將圖像劃分為多個具有特定語義含義的區(qū)域或?qū)ο蟆＞矸e神經(jīng)網(wǎng)絡(luò)（CNN）作為深度

發(fā)表于 07-09 11:51 ?828次閱讀

深度學(xué)習(xí)中的無監(jiān)督學(xué)習(xí)方法綜述

深度學(xué)習(xí)作為機器學(xué)習(xí)領(lǐng)域的一個重要分支，近年來在多個領(lǐng)域取得了顯著的成果，特別是在圖像識別、語音識別、自然語言處理等領(lǐng)域。然而，深度學(xué)習(xí)模型

發(fā)表于 07-09 10:50 ?683次閱讀

機器人視覺技術(shù)中圖像分割方法有哪些

和分析。本文將詳細介紹圖像分割的各種方法，包括傳統(tǒng)的圖像處理方法和基于深度學(xué)習(xí)的方法。閾值

發(fā)表于 07-04 11:34 ?933次閱讀

深度學(xué)習(xí)的模型優(yōu)化與調(diào)試方法

深度學(xué)習(xí)模型在訓(xùn)練過程中，往往會遇到各種問題和挑戰(zhàn)，如過擬合、欠擬合、梯度消失或爆炸等。因此，對深度學(xué)習(xí)模型進行優(yōu)化與調(diào)試是確保其性能優(yōu)越的

發(fā)表于 07-01 11:41 ?801次閱讀

深度學(xué)習(xí)與傳統(tǒng)機器學(xué)習(xí)的對比

在人工智能的浪潮中，機器學(xué)習(xí)和深度學(xué)習(xí)無疑是兩大核心驅(qū)動力。它們各自以其獨特的方式推動著技術(shù)的進步，為眾多領(lǐng)域帶來了革命性的變化。然而，盡管它們都屬于機器學(xué)習(xí)的范疇，但

發(fā)表于 07-01 11:40 ?1326次閱讀

深度解析深度學(xué)習(xí)下的語義SLAM

隨著深度學(xué)習(xí)技術(shù)的興起，計算機視覺的許多傳統(tǒng)領(lǐng)域都取得了突破性進展，例如目標的檢測、識別和分類等領(lǐng)域。近年來，研究人員開始在視覺SLAM算法中引入深度學(xué)習(xí)技術(shù)，使得

發(fā)表于 04-23 17:18 ?1285次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

關(guān)于如何使用MATLAB 深度學(xué)習(xí)進行語義分割的方法詳解

評論

Pytorch深度學(xué)習(xí)訓(xùn)練的方法

AI大模型與深度學(xué)習(xí)的關(guān)系

語義分割25種損失函數(shù)綜述和展望

圖像語義分割的實用性是什么

圖像分割和語義分割的區(qū)別與聯(lián)系

利用Matlab函數(shù)實現(xiàn)深度學(xué)習(xí)算法

基于Python的深度學(xué)習(xí)人臉識別方法

機器學(xué)習(xí)中的數(shù)據(jù)分割方法

深度學(xué)習(xí)中的時間序列分類方法

圖像分割與語義分割中的CNN模型綜述

深度學(xué)習(xí)中的無監(jiān)督學(xué)習(xí)方法綜述

機器人視覺技術(shù)中圖像分割方法有哪些

深度學(xué)習(xí)的模型優(yōu)化與調(diào)試方法

深度學(xué)習(xí)與傳統(tǒng)機器學(xué)習(xí)的對比

深度解析深度學(xué)習(xí)下的語義SLAM