色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

單個CNN就能夠在多個數據集上實現SOTA

OpenCV學堂 ? 來源:機器之心 ? 作者:機器之心 ? 2022-07-21 10:15 ? 次閱讀

在 VGG、U-Net、TCN 網絡中... CNN 雖然功能強大,但必須針對特定問題、數據類型、長度和分辨率進行定制,才能發揮其作用。我們不禁會問,可以設計出一個在所有這些網絡中都運行良好的單一 CNN 嗎? 本文中,來自阿姆斯特丹自由大學、阿姆斯特丹大學、斯坦福大學的研究者提出了 CCNN,單個 CNN 就能夠在多個數據集(例如 LRA)上實現 SOTA !

1eb82160-083d-11ed-ba43-dac502259ad0.png

1998 年 LeCun 等人提出卷積神經網絡 (CNN),這是一類廣泛用于機器學習深度學習模型。由于 CNN 具有高性能和高效率等特點,使其在跨序列、視覺和高維數據的多個應用程序中實現 SOTA 性能。然而,CNN(以及一般的神經網絡)存在一個嚴重缺陷,這些架構必須針對特定應用進行定制,以便處理不同的數據長度、分辨率和維度。這反過來又導致大量特定于任務的 CNN 架構出現。 數據可以有許多不同的長度,例如圖像可以是 32x32 或 1024x1024。標準 CNN 存在的問題是,它們的卷積核是局部的,這需要為每個長度定制一個精心選擇的步長和池化層來捕獲整個上下文自定義架構。此外,許多數據本質上是連續的,在不同的分辨率下具有相同的語義,例如圖像可以在任意分辨率下捕獲,并具有相同的語義內容,音頻可以在 16kHz 或 44.1kHz 采樣,但人耳聽起來仍然是相同的。 然而,由于卷積核的離散性,傳統的 CNN 不能跨分辨率使用。當考慮具有相同 CNN 的不同維度數據時,這兩個問題會進一步加劇,例如序列(1D)、視覺(2D)和高維數據(3D、4D),因為不同的維度以不同的特征長度和分辨率運行,例如一秒音頻的長度很容易達到 16000,這與基準數據集中的圖像大小形成強烈對比。 在本文中,研究者提出了邁向通用 CNN 架構。其目標是構建一個單一的 CNN 架構,可以用于任意分辨率、長度和維度的數據。標準 CNN 需要特定于任務的架構,因為其卷積核的離散性將內核綁定到特定的數據分辨率,并且由于構建大型離散卷積核所需的大量參數,它們不適合對全局上下文進行建模。 因此,為了構建一個通用的 CNN 架構,關鍵是開發一個分辨率不可知的卷積層,該卷積層能夠以參數有效的方式對遠程依賴關系進行建模。該研究入選 ICML 2022 。

1ed26bce-083d-11ed-ba43-dac502259ad0.png

  • 論文地址:https://arxiv.org/pdf/2206.03398.pdf
  • 代碼地址:https://github.com/david-knigge/ccnn
本文的貢獻如下:
  • 該研究提出 Continuous CNN(CCNN):一個簡單、通用的 CNN,可以跨數據分辨率和維度使用,而不需要結構修改。CCNN 在序列 (1D)、視覺 (2D) 任務、以及不規則采樣數據和測試時間分辨率變化的任務上超過 SOTA;
  • 該研究對現有的 CCNN 方法提供了幾種改進,使它們能夠匹配當前 SOTA 方法,例如 S4。主要改進包括核生成器網絡的初始化、卷積層修改以及 CNN 的整體結構。
連續核卷積 連續核卷積將小型神經網絡1ee43fde-083d-11ed-ba43-dac502259ad0.png作為核生成器網絡,同時將卷積核參數化為連續函數。該網絡將坐標1eedaba0-083d-11ed-ba43-dac502259ad0.png映射到該位置的卷積核值:1ef62e42-083d-11ed-ba43-dac502259ad0.png(圖 1a)。通過將 K 個坐標1f020b40-083d-11ed-ba43-dac502259ad0.png向量通過 G_Kernel,可以構造一個大小相等的卷積核 K,即1f0bdcce-083d-11ed-ba43-dac502259ad0.png隨后,在輸入信號1f1556e6-083d-11ed-ba43-dac502259ad0.png和生成的卷積核1f1ee8fa-083d-11ed-ba43-dac502259ad0.png間進行卷積運算,以構造輸出特征表示1f2b7dae-083d-11ed-ba43-dac502259ad0.png,即1f374efe-083d-11ed-ba43-dac502259ad0.png

1f42603c-083d-11ed-ba43-dac502259ad0.png

任意數據維度的一般操作。通過改變輸入坐標 c_i 的維數 D,核生成器網絡 G_Kernel 可用于構造任意維數的卷積核。因此可以使用相同的操作來處理序列 D=1、視覺 D=2 和更高維數據 D≥3。 不同輸入分辨率的等效響應。如果輸入信號 x 有分辨率變化,例如最初在 8KHz 觀察到的音頻現在在 16KHz 觀察到,則與離散卷積核進行卷積以產生不同的響應,因為核將在每個分辨率下覆蓋不同的輸入子集。另一方面,連續核是分辨率無關的,因此無論輸入的分辨率如何,它都能夠識別輸入。 當以不同的分辨率(例如更高的分辨率)呈現輸入時,通過核生成器網絡傳遞更精細的坐標網格就足夠了,以便以相應的分辨率構造相同的核。對于以分辨率 r (1) 和 r (2) 采樣的信號 x 和連續卷積核 K,兩種分辨率下的卷積大約等于與分辨率變化成比例的因子:

1f574fa6-083d-11ed-ba43-dac502259ad0.jpg

CCNN:在 ND 中建模遠程依賴關系 具有連續核卷積的殘差塊改進。該研究對 FlexNet 架構進行了修改 ,其殘差網絡由類似于 S4 網絡的塊組成。CCNN 架構如下圖 2 所示。

1f61fc3a-083d-11ed-ba43-dac502259ad0.png

基于這些觀察,該研究構建了 FlexConv 的深度(depth-wise)可分離版本,其中通道(channel-wise)卷積是使用核生成器網絡1f750168-083d-11ed-ba43-dac502259ad0.png生成的核計算的,之后是從 N_in 到 N_out 進行逐點卷積。這種變化允許構建更廣泛的 CCNN—— 從 30 到 110 個隱藏通道,而不會增加網絡參數或計算復雜度。

正確初始化核生成器網絡 G_Kernel。該研究觀察到,在以前的研究中核生成器網絡沒有正確初始化。在初始化前,人們希望卷積層的輸入和輸出的方差保持相等,以避免梯度爆炸和消失,即 Var (x)=Var (y)。因此,卷積核被初始化為具有方差 Var (K)=gain^2 /(in channels ? kernel size) 的形式,其增益取決于所使用的非線性。 然而,神經網絡的初始化使輸入的 unitary 方差保留在輸出。因此,當用作核生成器網絡時,標準初始化方法導致核具有 unitary 方差,即 Var (K)=1。結果,使用神經網絡作為核生成器網絡的 CNN 經歷了與通道?內核大小成比例的特征表示方差的逐層增長。例如,研究者觀察到 CKCNNs 和 FlexNets 在初始化時的 logits 大約為 1e^19。這是不可取的,這可能導致訓練不穩定和需要低學習率。 為了解決這個問題,該研究要求 G_Kernel 輸出方差等于 gain^2 /(in_channels?kernel_size)而不是 1。他們通過、1f83ab5a-083d-11ed-ba43-dac502259ad0.png重新加權核生成器網絡的最后一層。因此,核生成器網絡輸出的方差遵循傳統卷積核的初始化,而 CCNN 的 logits 在初始化時呈現單一方差。

實驗結果 如下表 1-4 所示,CCNN 模型在所有任務中都表現良好。 首先是 1D 圖像分類 CCNN 在多個連續基準上獲得 SOTA,例如 Long Range Arena、語音識別、1D 圖像分類,所有這些都在單一架構中實現的。CCNN 通常比其他方法模型更小架構更簡單。 然后是 2D 圖像分類:通過單一架構,CCNN 可以匹配并超越更深的 CNN。

1f9235e4-083d-11ed-ba43-dac502259ad0.jpg

對 ND 進行遠程依賴建模的重要性。原則上可以將所有任務視為不考慮 2D 結構的序列任務,該研究只需改變進入核生成器網絡的坐標維數,就可以在多維空間上輕松定義 CCNN。有趣的是,該研究觀察到,通過在 LRA 基準測試中考慮圖像和 Pathfinder 任務的 2D 特性,可以獲得更好的結果(上表 3)。 在具有 2D 圖像的 PathFinder 中,最大的 CCNN 獲得了 96.00% 的準確率,比之前 SOTA 高出近 10 個點,并在扁平圖像上的表現明顯優于 CCNN。 此外,在原始 2D 數據上訓練的模型顯示出比它們的序列對應物更快的收斂(圖 3)。具有小卷積核的 2D CNN,例如 ResNet-18,由于中間池化層缺乏細粒度的全局上下文建模,無法解決 Pathfinder。

1fa137ec-083d-11ed-ba43-dac502259ad0.png

審核編輯 :李倩


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 架構
    +關注

    關注

    1

    文章

    515

    瀏覽量

    25488
  • 深度學習
    +關注

    關注

    73

    文章

    5504

    瀏覽量

    121220
  • cnn
    cnn
    +關注

    關注

    3

    文章

    352

    瀏覽量

    22237

原文標題:解決CNN固有缺陷, CCNN憑借單一架構,實現多項SOTA

文章出處:【微信號:CVSCHOOL,微信公眾號:OpenCV學堂】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    Mamba入局圖像復原,達成新SOTA

    MambaIRv2,更高性能、更高效率!另外還有ACM MM 2024的Freqmamba方法,圖像去雨任務中取得了SOTA性能! 顯然,這種基于Mamba的方法圖像復原領域,比
    的頭像 發表于 12-30 18:09 ?99次閱讀
    Mamba入局圖像復原,達成新<b class='flag-5'>SOTA</b>

    單個C2000?MCU使用FCL和SFRA進行雙軸電機控制

    電子發燒友網站提供《單個C2000?MCU使用FCL和SFRA進行雙軸電機控制.pdf》資料免費下載
    發表于 09-14 09:40 ?0次下載
    <b class='flag-5'>在</b><b class='flag-5'>單個</b>C2000?MCU<b class='flag-5'>上</b>使用FCL和SFRA進行雙軸電機控制

    CISC(復雜指令)與RISC(精簡指令)的區別  

    的例子如果要在RISC架構實現,將ADDRA, ADDRB中的數據讀入寄 存器,相乘和將結果寫回內存的操作都必須由軟件來實現,比如:MOV A, ADDRA; MOV B, ADDR
    發表于 07-30 17:21

    請問如何使用AT CIPSEND或AT CIPSENDBUF發送多個數據包?

    我可以使用 AT CIPSEND 發送單個數據包。但是我必須發送一系列二進制數據包。如何使用AT CISEND或AT CIPSENDBUF發送多個數據包,什么是正確的算法? 到目前為止,我嘗試
    發表于 07-15 07:37

    20個數據可以訓練神經網絡嗎

    當然可以,20個數據點對于訓練一個神經網絡來說可能非常有限,但這并不意味著它們不能用于訓練。實際,神經網絡可以訓練非常小的數據
    的頭像 發表于 07-11 10:29 ?936次閱讀

    CNN多個領域中的應用

    ,通過多層次的非線性變換,能夠捕捉到數據中的隱藏特征;而卷積神經網絡(CNN),作為神經網絡的一種特殊形式,更是圖像識別、視頻處理等領域展現出了卓越的性能。本文旨在深入探究深度學習、
    的頭像 發表于 07-08 10:44 ?1970次閱讀

    CNN的定義和優勢

    CNN是模型還是算法的問題,實際它兼具了兩者的特性,但更側重于作為一種模型存在。本文將從CNN的定義、結構、原理、應用等多個方面進行深入探討,旨在全面解析
    的頭像 發表于 07-05 17:37 ?4279次閱讀

    如何利用CNN實現圖像識別

    卷積神經網絡(CNN)是深度學習領域中一種特別適用于圖像識別任務的神經網絡結構。它通過模擬人類視覺系統的處理方式,利用卷積、池化等操作,自動提取圖像中的特征,進而實現高效的圖像識別。本文將從CNN的基本原理、構建過程、訓練策略以
    的頭像 發表于 07-03 16:16 ?1419次閱讀

    cnn卷積神經網絡三大特點是什么

    (Local Connectivity) 局部連接是CNN的核心特點之一,它允許網絡處理圖像時只關注局部區域的特征。與傳統的全連接神經網絡不同,CNN的卷積層只對輸入數據的局部區域進
    的頭像 發表于 07-03 09:26 ?1388次閱讀

    卷積神經網絡cnn模型有哪些

    (Convolutional Layer) 卷積層是CNN的核心,用于提取圖像的局部特征。卷積操作通過滑動窗口(濾波器或卷積核)輸入數據上進行計算,生成特征圖(Feature Map)。卷積核的權重在訓練
    的頭像 發表于 07-02 15:24 ?730次閱讀

    NB81是否支持OneNet SOTA功能?應該如何激活SOTA

    NB81是否支持OneNet SOTA功能? 可以支持,應該如何激活SOTA
    發表于 06-04 06:14

    基于毫米波雷達的手勢識別神經網絡

    出的網絡的有效性,我們將其與其他四種常用于動作識別的深度學習網絡進行了比較:CNN、3D-CNN、CNNLSTM和CNN-GRU。我們收集的手勢
    發表于 05-23 12:12

    旋變位置不變的情況下,當使能SOTA功能與關閉SOTA功能時,APP中DSADC采樣得到的旋變sin和cos兩者值不一樣,為什么?

    旋變位置不變的情況下,當使能SOTA功能與關閉SOTA功能時,APP中DSADC采樣得到的旋變sin和cos兩者值不一樣,用示波器采的輸入到MCU端的差分電壓是一樣的,難道是SOTA使能后影響了MCU芯片內部的等效阻抗嗎,有專家
    發表于 05-17 08:13

    stm32讀sd卡單個數據塊最后80個字節全是0,怎么crc還校驗正確?

    stm32 讀sd卡單個數據塊最后80個字節全是0,怎么crc還校驗正確。PS. 用的是SDIO口,4bit總線,1M的SDIO_CK.
    發表于 04-25 07:19

    eX700M系列HMI實現港口設備數據

    eX700M系列HMI幫助國內某信息化公司實現港口設備的數據采集、處理和云,推動港口設備信息化。
    的頭像 發表于 04-17 11:03 ?378次閱讀
    宏<b class='flag-5'>集</b>eX700M系列HMI<b class='flag-5'>實現</b>港口設備<b class='flag-5'>數據</b><b class='flag-5'>上</b>云
    主站蜘蛛池模板: 97超碰免费人妻中文| 巨胸美乳中文在线观看| 香港成人社区| 美女张开腿露出尿口扒开来摸动漫| 欧美性猛交AAA片| 国自产精品手机在线视频| abp-146| 亚洲欧美日韩精品久久奇米色影视| 欧美一第一页草草影院| 九九热久久只有精品2| 高清无码中文字幕影片| 97超碰在线视频人人av| 亚洲女人毛片| 天天噜日日噜夜夜噜| 欧美高清videossexo| 久久精品国产在热亚洲| 国产色婷婷精品人妻蜜桃成熟时| music radio在线收听| 中国农村真实bbwbbwbbw| 亚洲日韩一区精品射精| 午夜福利体验免费体验区| 日本精品无码久久久久APP| 男女XX00上下抽搐动态图| 巨乳中文无码亚洲| 久久99精品国产自在自线| 国产在线精品一区二区网站免费| 国产成人免费高清激情视频 | qvod小电影| 乱叫抽搐流白浆免费视频| 2017日日干| 亚洲成熟人网站| 清冷受被CAO的合不拢| 久久re6热在线视频精品| 广西美女色炮150p图| 91桃色污无限免费看| 一本道高清码| 色中色辩论区| 小货SAO边洗澡边CAO你动漫| 天堂无码人妻精品AV一区| 熟女人妻-蜜臀AV-首页| 天天综合亚洲综合网站|