色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

PyTorch教程-14.11. 全卷積網絡

jf_pJlTbmA9 ? 來源:PyTorch ? 作者:PyTorch ? 2023-06-05 15:44 ? 次閱讀

如第 14.9 節所述,語義分割在像素級別對圖像進行分類。全卷積網絡 (FCN) 使用卷積神經網絡將圖像像素轉換為像素類( Long et al. , 2015 )與我們之前在圖像分類或目標檢測中遇到的 CNN 不同,全卷積網絡將中間特征圖的高度和寬度轉換回輸入圖像的高度和寬度:這是通過 14.10 節介紹的轉置卷積層實現 . 因此,分類輸出和輸入圖像在像素級別具有一一對應關系:任何輸出像素的通道維度都包含相同空間位置的輸入像素的分類結果。

%matplotlib inline
import torch
import torchvision
from torch import nn
from torch.nn import functional as F
from d2l import torch as d2l
%matplotlib inline
from mxnet import gluon, image, init, np, npx
from mxnet.gluon import nn
from d2l import mxnet as d2l

npx.set_np()

14.11.1。該模型

在這里,我們描述了全卷積網絡模型的基本設計。如圖 14.11.1所示,該模型首先使用 CNN 提取圖像特征,然后通過1×1卷積層,最后通過 14.10 節介紹的轉置卷積將特征圖的高度和寬度轉換為輸入圖像的高度和寬度。因此,模型輸出與輸入圖像具有相同的高度和寬度,其中輸出通道包含相同空間位置的輸入像素的預測類別。

https://file.elecfans.com/web2/M00/A9/CD/poYBAGR9O_CARhOnAAfA_q5Ldd8563.svg

圖 14.11.1全卷積網絡。

下面,我們使用在 ImageNet 數據集上預訓練的 ResNet-18 模型來提取圖像特征并將模型實例表示為 pretrained_net該模型的最后幾層包括全局平均池化層和全連接層:全卷積網絡不需要它們。

pretrained_net = torchvision.models.resnet18(pretrained=True)
list(pretrained_net.children())[-3:]
[Sequential(
  (0): BasicBlock(
   (conv1): Conv2d(256, 512, kernel_size=(3, 3), stride=(2, 2), padding=(1, 1), bias=False)
   (bn1): BatchNorm2d(512, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
   (relu): ReLU(inplace=True)
   (conv2): Conv2d(512, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
   (bn2): BatchNorm2d(512, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
   (downsample): Sequential(
    (0): Conv2d(256, 512, kernel_size=(1, 1), stride=(2, 2), bias=False)
    (1): BatchNorm2d(512, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
   )
  )
  (1): BasicBlock(
   (conv1): Conv2d(512, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
   (bn1): BatchNorm2d(512, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
   (relu): ReLU(inplace=True)
   (conv2): Conv2d(512, 512, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
   (bn2): BatchNorm2d(512, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
  )
 ),
 AdaptiveAvgPool2d(output_size=(1, 1)),
 Linear(in_features=512, out_features=1000, bias=True)]
pretrained_net = gluon.model_zoo.vision.resnet18_v2(pretrained=True)
pretrained_net.features[-3:], pretrained_net.output
(HybridSequential(
  (0): Activation(relu)
  (1): GlobalAvgPool2D(size=(1, 1), stride=(1, 1), padding=(0, 0), ceil_mode=True, global_pool=True, pool_type=avg, layout=NCHW)
  (2): Flatten
 ),
 Dense(512 -> 1000, linear))

接下來,我們創建全卷積網絡實例net它復制了 ResNet-18 中的所有預訓練層,除了最終的全局平均池化層和最接近輸出的全連接層。

net = nn.Sequential(*list(pretrained_net.children())[:-2])
net = nn.HybridSequential()
for layer in pretrained_net.features[:-2]:
  net.add(layer)

給定高度和寬度分別為 320 和 480 的輸入,正向傳播將net輸入高度和寬度減小到原始的 1/32,即 10 和 15。

X = torch.rand(size=(1, 3, 320, 480))
net(X).shape
torch.Size([1, 512, 10, 15])
X = np.random.uniform(size=(1, 3, 320, 480))
net(X).shape
(1, 512, 10, 15)

接下來,我們使用一個1×1卷積層將輸出通道的數量轉換為 Pascal VOC2012 數據集的類數 (21)。最后,我們需要將特征圖的高度和寬度增加 32 倍,以將它們變回輸入圖像的高度和寬度。回想一下7.3 節中如何計算卷積層的輸出形狀自從 (320?64+16×2+32)/32=10(480?64+16×2+32)/32=15,我們構造一個轉置卷積層,步幅為32,將內核的高度和寬度設置為64,填充到16. 一般來說,我們可以看到對于 strides, 填充s/2 (假設s/2是一個整數),內核的高和寬2s,轉置卷積將使輸入的高度和寬度增加s次。

num_classes = 21
net.add_module('final_conv', nn.Conv2d(512, num_classes, kernel_size=1))
net.add_module('transpose_conv', nn.ConvTranspose2d(num_classes, num_classes,
                  kernel_size=64, padding=16, stride=32))
num_classes = 21
net.add(nn.Conv2D(num_classes, kernel_size=1),
    nn.Conv2DTranspose(
      num_classes, kernel_size=64, padding=16, strides=32))

14.11.2。初始化轉置卷積層

我們已經知道轉置卷積層可以增加特征圖的高度和寬度。在圖像處理中,我們可能需要對圖像進行放大,即上采樣雙線性插值是常用的上采樣技術之一。它也經常用于初始化轉置卷積層。

為了解釋雙線性插值,假設給定一個輸入圖像,我們想要計算上采樣輸出圖像的每個像素。為了計算輸出圖像在坐標處的像素(x,y), 第一張地圖(x,y)協調(x′,y′)在輸入圖像上,例如,根據輸入大小與輸出大小的比率。請注意,映射x′y′是實數。然后,找到最接近坐標的四個像素 (x′,y′)在輸入圖像上。最后,輸出圖像在坐標處的像素(x,y)是根據輸入圖像上這四個最接近的像素及其與 (x′,y′).

雙線性插值的上采樣可以通過轉置卷積層實現,內核由以下bilinear_kernel函數構造。限于篇幅,bilinear_kernel下面只給出功能的實現,不討論其算法設計。

def bilinear_kernel(in_channels, out_channels, kernel_size):
  factor = (kernel_size + 1) // 2
  if kernel_size % 2 == 1:
    center = factor - 1
  else:
    center = factor - 0.5
  og = (torch.arange(kernel_size).reshape(-1, 1),
     torch.arange(kernel_size).reshape(1, -1))
  filt = (1 - torch.abs(og[0] - center) / factor) * 
      (1 - torch.abs(og[1] - center) / factor)
  weight = torch.zeros((in_channels, out_channels,
             kernel_size, kernel_size))
  weight[range(in_channels), range(out_channels), :, :] = filt
  return weight
def bilinear_kernel(in_channels, out_channels, kernel_size):
  factor = (kernel_size + 1) // 2
  if kernel_size % 2 == 1:
    center = factor - 1
  else:
    center = factor - 0.5
  og = (np.arange(kernel_size).reshape(-1, 1),
     np.arange(kernel_size).reshape(1, -1))
  filt = (1 - np.abs(og[0] - center) / factor) * 
      (1 - np.abs(og[1] - center) / factor)
  weight = np.zeros((in_channels, out_channels, kernel_size, kernel_size))
  weight[range(in_channels), range(out_channels), :, :] = filt
  return np.array(weight)

讓我們試驗一下由轉置卷積層實現的雙線性插值的上采樣。我們構建了一個將高度和重量加倍的轉置卷積層,并使用該bilinear_kernel函數初始化其內核。

conv_trans = nn.ConvTranspose2d(3, 3, kernel_size=4, padding=1, stride=2,
                bias=False)
conv_trans.weight.data.copy_(bilinear_kernel(3, 3, 4));
conv_trans = nn.Conv2DTranspose(3, kernel_size=4, padding=1, strides=2)
conv_trans.initialize(init.Constant(bilinear_kernel(3, 3, 4)))

讀取圖像X并將上采樣輸出分配給Y為了打印圖像,我們需要調整通道維度的位置。

img = torchvision.transforms.ToTensor()(d2l.Image.open('../img/catdog.jpg'))
X = img.unsqueeze(0)
Y = conv_trans(X)
out_img = Y[0].permute(1, 2, 0).detach()
img = image.imread('../img/catdog.jpg')
X = np.expand_dims(img.astype('float32').transpose(2, 0, 1), axis=0) / 255
Y = conv_trans(X)
out_img = Y[0].transpose(1, 2, 0)

正如我們所見,轉置卷積層將圖像的高度和寬度增加了兩倍。雙線性插值放大后的圖像與14.3節打印的原始圖像除了坐標比例不同外, 看起來是一樣的。

d2l.set_figsize()
print('input image shape:', img.permute(1, 2, 0).shape)
d2l.plt.imshow(img.permute(1, 2, 0));
print('output image shape:', out_img.shape)
d2l.plt.imshow(out_img);
input image shape: torch.Size([561, 728, 3])
output image shape: torch.Size([1122, 1456, 3])
https://file.elecfans.com/web2/M00/AA/47/pYYBAGR9O_KARRwjAAGEqpbl5s8624.svg
d2l.set_figsize()
print('input image shape:', img.shape)
d2l.plt.imshow(img.asnumpy());
print('output image shape:', out_img.shape)
d2l.plt.imshow(out_img.asnumpy());
input image shape: (561, 728, 3)
output image shape: (1122, 1456, 3)
https://file.elecfans.com/web2/M00/AA/47/pYYBAGR9O_KARRwjAAGEqpbl5s8624.svg

在全卷積網絡中,我們使用雙線性插值的上采樣來初始化轉置卷積層。為了 1×1卷積層,我們使用 Xavier 初始化。

W = bilinear_kernel(num_classes, num_classes, 64)
net.transpose_conv.weight.data.copy_(W);
W = bilinear_kernel(num_classes, num_classes, 64)
net[-1].initialize(init.Constant(W))
net[-2].initialize(init=init.Xavier())

14.11.3。讀取數據集

我們閱讀了第 14.9 節中介紹的語義分割數據集 隨機裁剪的輸出圖像形狀指定為320×480:高度和寬度都可以被整除32.

batch_size, crop_size = 32, (320, 480)
train_iter, test_iter = d2l.load_data_voc(batch_size, crop_size)
read 1114 examples
read 1078 examples
batch_size, crop_size = 32, (320, 480)
train_iter, test_iter = d2l.load_data_voc(batch_size, crop_size)
Downloading ../data/VOCtrainval_11-May-2012.tar from http://d2l-data.s3-accelerate.amazonaws.com/VOCtrainval_11-May-2012.tar...
read 1114 examples
read 1078 examples

14.11.4。訓練

現在我們可以訓練我們構建的全卷積網絡了。這里的損失函數和精度計算與前面章節的圖像分類沒有本質區別。因為我們使用轉置卷積層的輸出通道來預測每個像素的類別,所以在損失計算中指定了通道維度。此外,準確度是根據所有像素的預測類別的正確性計算的。

def loss(inputs, targets):
  return F.cross_entropy(inputs, targets, reduction='none').mean(1).mean(1)

num_epochs, lr, wd, devices = 5, 0.001, 1e-3, d2l.try_all_gpus()
trainer = torch.optim.SGD(net.parameters(), lr=lr, weight_decay=wd)
d2l.train_ch13(net, train_iter, test_iter, loss, trainer, num_epochs, devices)
loss 0.441, train acc 0.863, test acc 0.853
167.9 examples/sec on [device(type='cuda', index=0), device(type='cuda', index=1)]
https://file.elecfans.com/web2/M00/A9/CD/poYBAGR9O_aARwnIAAEBn5zqe4s240.svg
num_epochs, lr, wd, devices = 5, 0.1, 1e-3, d2l.try_all_gpus()
loss = gluon.loss.SoftmaxCrossEntropyLoss(axis=1)
net.collect_params().reset_ctx(devices)
trainer = gluon.Trainer(net.collect_params(), 'sgd',
            {'learning_rate': lr, 'wd': wd})
d2l.train_ch13(net, train_iter, test_iter, loss, trainer, num_epochs, devices)
loss 0.320, train acc 0.894, test acc 0.848
144.9 examples/sec on [gpu(0), gpu(1)]
https://file.elecfans.com/web2/M00/AA/47/pYYBAGR9O_qAGgWgAAEBiDnJ2-4309.svg

14.11.5。預言

在進行預測時,我們需要對每個通道的輸入圖像進行標準化處理,將圖像轉化為CNN需要的四維輸入格式。

def predict(img):
  X = test_iter.dataset.normalize_image(img).unsqueeze(0)
  pred = net(X.to(devices[0])).argmax(dim=1)
  return pred.reshape(pred.shape[1], pred.shape[2])
def predict(img):
  X = test_iter._dataset.normalize_image(img)
  X = np.expand_dims(X.transpose(2, 0, 1), axis=0)
  pred = net(X.as_in_ctx(devices[0])).argmax(axis=1)
  return pred.reshape(pred.shape[1], pred.shape[2])

為了可視化每個像素的預測類別,我們將預測類別映射回其在數據集中的標簽顏色。

def label2image(pred):
  colormap = torch.tensor(d2l.VOC_COLORMAP, device=devices[0])
  X = pred.long()
  return colormap[X, :]
def label2image(pred):
  colormap = np.array(d2l.VOC_COLORMAP, ctx=devices[0], dtype='uint8')
  X = pred.astype('int32')
  return colormap[X, :]

測試數據集中的圖像大小和形狀各不相同。由于該模型使用了步長為32的轉置卷積層,當輸入圖像的高度或寬度不能被32整除時,轉置卷積層的輸出高度或寬度會偏離輸入圖像的形狀。為了解決這個問題,我們可以在圖像中裁剪出多個高寬均為32整數倍的矩形區域,分別對這些區域的像素進行前向傳播。請注意,這些矩形區域的并集需要完全覆蓋輸入圖像。當一個像素被多個矩形區域覆蓋時,可以將同一像素在不同區域的轉置卷積輸出的平均值輸入到 softmax 操作中以預測類別。

為簡單起見,我們只讀取了一些較大的測試圖像,并裁剪了一個 320×480從圖像的左上角開始的預測區域。對于這些測試圖像,我們逐行打印它們的裁剪區域、預測結果和地面實況。

voc_dir = d2l.download_extract('voc2012', 'VOCdevkit/VOC2012')
test_images, test_labels = d2l.read_voc_images(voc_dir, False)
n, imgs = 4, []
for i in range(n):
  crop_rect = (0, 0, 320, 480)
  X = torchvision.transforms.functional.crop(test_images[i], *crop_rect)
  pred = label2image(predict(X))
  imgs += [X.permute(1,2,0), pred.cpu(),
       torchvision.transforms.functional.crop(
         test_labels[i], *crop_rect).permute(1,2,0)]
d2l.show_images(imgs[::3] + imgs[1::3] + imgs[2::3], 3, n, scale=2);
https://file.elecfans.com/web2/M00/A9/CD/poYBAGR9O_yAHBuoAAI1uB2HKv4586.svg
voc_dir = d2l.download_extract('voc2012', 'VOCdevkit/VOC2012')
test_images, test_labels = d2l.read_voc_images(voc_dir, False)
n, imgs = 4, []
for i in range(n):
  crop_rect = (0, 0, 480, 320)
  X = image.fixed_crop(test_images[i], *crop_rect)
  pred = label2image(predict(X))
  imgs += [X, pred, image.fixed_crop(test_labels[i], *crop_rect)]
d2l.show_images(imgs[::3] + imgs[1::3] + imgs[2::3], 3, n, scale=2);
https://file.elecfans.com/web2/M00/AA/47/pYYBAGR9O_6AVgqjAAI2AD9psJU710.svg

14.11.6. 概括

  • 全卷積網絡首先使用 CNN 提取圖像特征,然后通過1×1卷積層,最后通過轉置卷積將特征圖的高度和寬度轉換為輸入圖像的高度和寬度。

  • 在全卷積網絡中,我們可以使用雙線性插值的上采樣來初始化轉置卷積層。

14.11.7. 練習

  1. 如果我們在實驗中對轉置的卷積層使用Xavier初始化,結果會有怎樣的變化?

  2. 你能否通過調整超參數進一步提高模型的準確性?

  3. 預測測試圖像中所有像素的類別。

  4. 最初的全卷積網絡論文也使用了一些中間 CNN 層的輸出Long et al. , 2015嘗試實現這個想法。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • pytorch
    +關注

    關注

    2

    文章

    808

    瀏覽量

    13249
  • 全卷積網絡
    +關注

    關注

    0

    文章

    7

    瀏覽量

    2035
收藏 人收藏

    評論

    相關推薦

    使用PyTorch深度解析卷積神經網絡

    卷積神經網絡(CNN)是一種特殊類型的神經網絡,在圖像上表現特別出色。卷積神經網絡由Yan LeCun在1998年提出,可以識別給定輸入圖像
    發表于 09-21 10:12 ?837次閱讀

    連接神經網絡卷積神經網絡有什么區別

    連接神經網絡卷積神經網絡的區別
    發表于 06-06 14:21

    如何在PyTorch上學習和創建網絡模型呢?

    分。如果有興趣,建議嘗試下面的官方教程,盡管它是英文的。使用 PYTORCH 進行深度學習:60 分鐘閃電戰卷積神經網絡卷積神經網絡 (CN
    發表于 02-21 15:22

    卷積網絡FCN進行圖像分割

    Networks for Semantic Segmentation》在圖像語義分割挖了一個坑,于是無窮無盡的人往坑里面跳。 卷積網絡 Fully Convolutional Networks CNN
    發表于 09-26 17:22 ?630次閱讀

    PyTorch教程7.1之從連接層到卷積

    電子發燒友網站提供《PyTorch教程7.1之從連接層到卷積.pdf》資料免費下載
    發表于 06-05 11:50 ?0次下載
    <b class='flag-5'>PyTorch</b>教程7.1之從<b class='flag-5'>全</b>連接層到<b class='flag-5'>卷積</b>

    PyTorch教程7.2之圖像卷積

    電子發燒友網站提供《PyTorch教程7.2之圖像卷積.pdf》資料免費下載
    發表于 06-05 10:13 ?0次下載
    <b class='flag-5'>PyTorch</b>教程7.2之圖像<b class='flag-5'>卷積</b>

    PyTorch教程8.1之深度卷積神經網絡(AlexNet)

    電子發燒友網站提供《PyTorch教程8.1之深度卷積神經網絡(AlexNet).pdf》資料免費下載
    發表于 06-05 10:09 ?0次下載
    <b class='flag-5'>PyTorch</b>教程8.1之深度<b class='flag-5'>卷積</b>神經<b class='flag-5'>網絡</b>(AlexNet)

    PyTorch教程8.8之設計卷積網絡架構

    電子發燒友網站提供《PyTorch教程8.8之設計卷積網絡架構.pdf》資料免費下載
    發表于 06-05 10:02 ?0次下載
    <b class='flag-5'>PyTorch</b>教程8.8之設計<b class='flag-5'>卷積</b><b class='flag-5'>網絡</b>架構

    PyTorch教程14.10之轉置卷積

    電子發燒友網站提供《PyTorch教程14.10之轉置卷積.pdf》資料免費下載
    發表于 06-05 11:11 ?0次下載
    <b class='flag-5'>PyTorch</b>教程14.10之轉置<b class='flag-5'>卷積</b>

    PyTorch教程14.11卷積網絡

    電子發燒友網站提供《PyTorch教程14.11卷積網絡.pdf》資料免費下載
    發表于 06-05 11:19 ?0次下載
    <b class='flag-5'>PyTorch</b>教程<b class='flag-5'>14.11</b>之<b class='flag-5'>全</b><b class='flag-5'>卷積</b><b class='flag-5'>網絡</b>

    PyTorch教程16.3之情感分析:使用卷積神經網絡

    電子發燒友網站提供《PyTorch教程16.3之情感分析:使用卷積神經網絡.pdf》資料免費下載
    發表于 06-05 10:56 ?0次下載
    <b class='flag-5'>PyTorch</b>教程16.3之情感分析:使用<b class='flag-5'>卷積</b>神經<b class='flag-5'>網絡</b>

    PyTorch教程20.2之深度卷積生成對抗網絡

    電子發燒友網站提供《PyTorch教程20.2之深度卷積生成對抗網絡.pdf》資料免費下載
    發表于 06-05 10:21 ?2次下載
    <b class='flag-5'>PyTorch</b>教程20.2之深度<b class='flag-5'>卷積</b>生成對抗<b class='flag-5'>網絡</b>

    pytorch如何構建網絡模型

      利用 pytorch 來構建網絡模型有很多種方法,以下簡單列出其中的四種。  假設構建一個網絡模型如下:  卷積層--》Relu 層--》池化層--》
    發表于 07-20 11:51 ?0次下載

    卷積神經網絡的工作原理和應用

    卷積神經網絡(FCN)是深度學習領域中的一種特殊類型的神經網絡結構,尤其在計算機視覺領域表現出色。它通過全局平均池化或轉置卷積處理任意尺寸
    的頭像 發表于 07-11 11:50 ?1194次閱讀

    基于PyTorch卷積核實例應用

    在深度學習和計算機視覺領域,卷積操作是一種至關重要的技術,尤其在圖像處理和特征提取方面發揮著核心作用。PyTorch作為當前最流行的深度學習框架之一,提供了強大的張量操作功能和靈活的API,使得實現
    的頭像 發表于 07-11 15:19 ?485次閱讀
    主站蜘蛛池模板: 人妻 中文无码 中出| 做暖免费观看日本| 亚洲黄色在线| 3D动漫网站HOXXXxes| 把英语老师强奷到舒服动态图| 国产精品美女久久久久AV超清| 久久精品国产午夜伦班片| 欧美亚洲韩日午夜| 亚洲aaaa级特黄毛片| 2021精品国产综合久久| 国产精品VIDEOSSEX久久发布| 久久精品亚洲AV无码三区观看 | yellow日本动漫免费观看| 国产久久re6免费热在线| 久久久无码精品亚洲A片猫咪| 日韩欧美视频一区| 欲香欲色天天综合和网| 俄罗斯极品hd| 久久久性色精品国产免费观看 | 麻豆COMCN| 我年轻漂亮的继坶2中字在线播放| 中文字幕一区二区三区在线不卡 | 果冻传媒独家原创在线观看 | 欧美性色xo影院69| 亚洲人成电影网站色2017| xxx365| 久久草这在线观看免费| 日本一本道高清码v| 在线视频av大全色久久| 国产乱人偷精品视频A人人澡| 欧美6O老妪与小伙交| 亚洲午夜精品AV无码少妇| 嘟嘟嘟WWW在线观看视频高清| 考试考90就可以晚上和老师C| 微拍秒拍99福利精品小视频| 99视频国产在线| 久久久久久久网站| 学校女性奴sm训练调教| 成人区在线观看免费视频 | 欧美多毛的大隂道| 一二三区乱码不卡手机版|