色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于卷積多層感知器(MLP)的圖像分割網絡unext

lhl545545 ? 來源:CVer ? 作者:CVer ? 2022-09-27 15:12 ? 次閱讀

1. 摘要

UNet及其最新的擴展如TransUNet是近年來領先的醫學圖像分割方法。然而,由于這些網絡參數多、計算復雜、使用速度慢,因此不能有效地用于即時應用中的快速圖像分割。為此,我們提出了一種基于卷積多層感知器(MLP)的圖像分割網絡unext。我們設計了一種有效的UNeXt方法,即在前期采用卷積階段和在后期采用MLP階段。我們提出了一個標記化的MLP塊,在該塊中,我們有效地標記和投射卷積特征,并使用MLP來建模表示。

為了進一步提高性能,我們建議在輸入mlp時shift輸入的channel,以便專注于學習局部依賴性。在潛在空間中使用標記化的mlp減少了參數的數量和計算復雜度,同時能夠產生更好的表示,以幫助分割。該網絡還包括各級編碼器和解碼器之間的跳躍連接。測試結果表明,與目前最先進的醫學圖像分割架構相比,UNeXt的參數數量減少了72x,計算復雜度降低了68x,推理速度提高了10x,同時也獲得了更好的分割性能。

2. 網絡結構

2.1 網絡設計:

UNeXt是一個編碼器-解碼器體系結構,有兩個階段:

1) 卷積階段

2) tokenized MLP階段。

輸入圖像通過編碼器,其中前3個塊是卷積,下2個是tokenized MLP塊。解碼器有2個tokenized MLP塊,后面跟著3個卷積塊。每個編碼器塊減少特征分辨率2倍,每個解碼器塊增加特征分辨率2。跳躍連接也被應用在了編碼器和解碼器之間

a82f13d8-3e2d-11ed-9e49-dac502259ad0.png

作者減少了每個stage的通道數。

每個stage的通道數,對比標準的Unet:

UNeXt:32 64 128 160 256

UNet:64 128 256 512 1024

在這里面就減少了很多的參數量

2.2 卷積階段

有三個conv block,每個block都有一個卷積層(傳統Unet是兩個)、批量歸一化層和ReLU激活。我們使用的內核大小為3×3, stride為1,padding為1。編碼器的conv塊使用帶有池窗口2×2的max-pooling層,而解碼器的conv塊使用雙線性插值層對特征圖進行上采樣。我們使用雙線性插值而不是轉置卷積,因為轉置卷積基本上是可學習的上采樣,會導致產生更多可學習的參數

2.3 Shifted MLP

在shifted MLP中,在tokenize之前,我們首先移動conv features通道的軸線。這有助于MLP只關注conv特征的某些位置,從而誘導塊的位置。這里的直覺與Swin transformer類似,在swin中引入基于窗口的注意,以向完全全局的模型添加更多的局域性。由于Tokenized MLP塊有2個mlp,我們在一個塊中跨越寬度移動特征,在另一個塊中跨越高度移動特征,就像軸向注意力中一樣。我們對這些特征做了h個劃分,并根據指定的軸通過j個位置移動它們。這有助于我們創建隨機窗口,引入沿軸線的局部性。

a844412c-3e2d-11ed-9e49-dac502259ad0.jpgShift操作

圖中灰色是特征塊的位置,白色是移動之后的padding。

2.4 Tokenized MLP階段

a84ccf7c-3e2d-11ed-9e49-dac502259ad0.jpgimage-20220402001733482

在Tokenized MLP塊中,我們首先shift features并將它們投射到token中。為了進行token化,我們首先使用3x3conv把特征投射到E維,其中E是embadding維度(token的數量),它是一個超參數。然后我們將這些token傳遞給一個shifted MLP(跨越width)。接下來,特征通過 DW-Conv傳遞。然后我們使用GELU激活層。然后,我們通過另一個shifted MLP(跨越height)傳遞特征,該mlp把特征的尺寸從H轉換為了O。我們在這里使用一個殘差連接,并將原始標記添加為殘差。然后我們利用layer norm(LN),并將輸出特征傳遞到下一個塊。LN比BN更可取,因為它更有意義的是沿著token進行規范化,而不是在Tokenized MLP塊的整個批處理中進行規范化。

我們在這個塊中使用DWConv有兩個原因:

1)它有助于編碼MLP特征的位置信息。從中可以看出,在一個MLP塊中Conv層已經足夠對位置信息進行編碼,并且實際性能優于標準的位置編碼技術。當測試或者訓練分辨率不相同時,像ViT中的位置編碼技術需要插值,這通常會導致性能下降。

2)DWConv使用更少的參數,因此提高了效率。

Tokenized block的計算流程

a8691240-3e2d-11ed-9e49-dac502259ad0.png

所有這些計算都是在嵌入維數h上執行的,這個維數明顯小于特征的維數 (H/N)×(H/N) ,N是關于降維的2的因子。在我們的實驗中,除非另有說明,否則我們使用768。這種設計tokenized MLP block的方法有助于編碼有意義的特征信息,而不會對計算或參數貢獻太多。

3.實驗結果

在ISIC和BUSI數據集進行了實驗

a893c472-3e2d-11ed-9e49-dac502259ad0.png

在ISIC數據集的對比

a8ba4e80-3e2d-11ed-9e49-dac502259ad0.png

a8cea394-3e2d-11ed-9e49-dac502259ad0.png

a8eecce6-3e2d-11ed-9e49-dac502259ad0.png

4. 個人感悟

首先每個convolutional階段只有一個卷積層,極大的減少了運算量,是答主第一次見了。

其次是把MLP的模塊引入了Unet,算是很新穎了。

在Tokenized MLP block中使用DW- CONV,讓人眼前一亮。

審核編輯:彭靜
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 解碼器
    +關注

    關注

    9

    文章

    1143

    瀏覽量

    40717
  • 圖像分割
    +關注

    關注

    4

    文章

    182

    瀏覽量

    17995
  • 感知器
    +關注

    關注

    0

    文章

    34

    瀏覽量

    11841
  • MLP
    MLP
    +關注

    關注

    0

    文章

    57

    瀏覽量

    4241

原文標題:MICCAI 2022 | UNeXt:第一個基于卷積和MLP的快速醫學圖像分割網絡

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    使用全卷積網絡模型實現圖像分割

    OpenCv-C++-深度神經網絡(DNN)模塊-使用FCN模型實現圖像分割
    發表于 05-28 07:33

    如何使用Keras框架搭建一個小型的神經網絡多層感知器

    本文介紹了如何使用Keras框架,搭建一個小型的神經網絡-多層感知器,并通過給定數據進行計算訓練,最好將訓練得到的模型提取出參數,放在51單片機上進行運行。
    發表于 11-22 07:00

    基于MLP的快速醫學圖像分割網絡UNeXt相關資料分享

    緩慢。這篇文章提出了基于卷積多層感知器MLP)改進 U型架構的方法,可以用于圖像分割。設計了一
    發表于 09-23 14:53

    一文詳解CNN

    識別、語音識別等場景取得巨大的成功。 CNN的發展史: 提到CNN的發展史,就要提到多層感知器(Multi-Layer Perception, MLP)。(圖片來源于3Blue1Brown)
    發表于 08-18 06:56

    人工神經網絡在金相圖像分割中的應用研究

    摘要: 利用多層感知器神經網絡和自組織映射神經網絡對球墨鑄鐵、可鍛鑄鐵和灰鑄鐵的金相圖像進行了分割
    發表于 03-12 16:27 ?25次下載
    人工神經<b class='flag-5'>網絡</b>在金相<b class='flag-5'>圖像</b><b class='flag-5'>分割</b>中的應用研究

    人工智能–多層感知器基礎知識解讀

    感知器(Perceptron)是ANN人工神經網絡的一個概念,由Frank Rosenblatt于1950s第一次引入。 MLP多層感知器
    發表于 07-05 14:45 ?6124次閱讀

    聚焦語義分割任務,如何用卷積神經網絡處理語義圖像分割

    同一對象。作者將沿著該領域的研究脈絡,說明如何用卷積神經網絡處理語義圖像分割的任務。 更具體地講,語義圖像
    發表于 09-17 15:21 ?565次閱讀

    卷積網絡FCN進行圖像分割

    Networks for Semantic Segmentation》在圖像語義分割挖了一個坑,于是無窮無盡的人往坑里面跳。 全卷積網絡 Fully Convolutional Ne
    發表于 09-26 17:22 ?624次閱讀

    多層感知機(MLP)的設計與實現

    多層感知機(Multilayer Perceptron)縮寫為MLP,也稱作前饋神經網絡(Feedforward Neural Network)。它是一種基于神經
    的頭像 發表于 03-14 11:31 ?6884次閱讀
    <b class='flag-5'>多層</b><b class='flag-5'>感知</b>機(<b class='flag-5'>MLP</b>)的設計與實現

    PyTorch教程5.2之多層感知器的實現

    電子發燒友網站提供《PyTorch教程5.2之多層感知器的實現.pdf》資料免費下載
    發表于 06-05 15:32 ?0次下載
    PyTorch教程5.2之<b class='flag-5'>多層</b><b class='flag-5'>感知器</b>的實現

    使用多層感知器進行機器學習

    我們將使用一個極其復雜的微處理來實現一個神經網絡,該神經網絡可以完成與由少數晶體管組成的電路相同的事情,這個想法有些幽默。但與此同時,以這種方式思考這個問題強調了單層感知器作為一般分
    的頭像 發表于 06-24 11:17 ?554次閱讀
    使用<b class='flag-5'>多層</b><b class='flag-5'>感知器</b>進行機器學習

    卷積神經網絡算法有哪些?

    卷積神經網絡算法有哪些?? 卷積神經網絡(Convolutional Neural Network, CNN) 是一種基于多層
    的頭像 發表于 08-21 16:50 ?1606次閱讀

    深度神經網絡模型有哪些

    模型: 多層感知器(Multilayer Perceptron,MLP): 多層感知器是最基本的深度神經
    的頭像 發表于 07-02 10:00 ?1326次閱讀

    多層感知器、全連接網絡和深度神經網絡介紹

    多層感知器MLP)、全連接網絡(FCN)和深度神經網絡(DNN)在神經網絡領域中扮演著重要角色
    的頭像 發表于 07-11 17:25 ?4386次閱讀

    多層感知器的基本原理

    多層感知器MLP, Multi-Layer Perceptron)是一種前饋神經網絡,它通過引入一個或多個隱藏層來擴展單層感知器的功能,從
    的頭像 發表于 07-19 17:20 ?797次閱讀
    主站蜘蛛池模板: 午夜伦理 第1页| 深夜草逼逼| 日本电影小姐| 天美传媒麻豆精品| 亚洲国产在线午夜视频无| 亚洲人成77777在线视频| 伊人久久国产精品| 99国产精品久久人妻无码| 菠萝视频高清版在线观看| 国产成人AV永久免费观看| 国内精品久久久久久久999下| 精品亚洲国产熟女福利自在线| 老师你下面好紧夹死了| 青青草在线 视频| 午夜国产大片免费观看| 夜夜骑夜夜欢| my pico未删减在线观看| 国产成人a一在线观看| 久久精品国产视频澳门| 欧美日韩永久久一区二区三区| 四房播播开心五月| 印度12 13free| youjizz护士| 果冻传媒2021一二三在线观看| 老头xxx| 色-情-伦-理一区二区三区| 亚洲欧美中文字幕先锋| 99久久亚洲精品日本无码| 国产精品无码久久av| 老司机午夜影院试看区| 四川少妇大战4黑人| 最近韩国日本免费观看mv免费版| 超碰国产人人做人人爽| 黄色三级网站在线观看| 欧美在线看费视频在线| 亚洲第一色网站| JAVAPARSER丰满白老师| 狠狠婷婷综合久久久久久| 全免费A敌肛交毛片免费懂色AV| 亚洲精品国偷拍自产在线观看蜜臀| 99视频在线观看免费|