色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

CNN根本無需理解圖像全局結構,一樣也能SOTA?

OpenCV學堂 ? 來源:量子位 ? 作者:量子位 ? 2022-06-09 10:51 ? 次閱讀

不給全圖,只投喂CNN一些看上去毫無信息量的圖像碎片,就能讓模型學會圖像分類。

更重要的是,性能完全不差,甚至還能反超用完整圖像訓練的模型。

796d0e56-e739-11ec-ba43-dac502259ad0.png

這么一項來自加州大學圣塔芭芭拉分校的新研究,這兩天引發不少討論。

咋地,這就是說,CNN根本無需理解圖像全局結構,一樣也能SOTA?

79a3bafa-e739-11ec-ba43-dac502259ad0.png

具體是怎么一回事,咱們還是直接上論文。

實驗證據

研究人員設計了這樣一個實驗:

他們在CIFAR-10、CIFAR-100、STL-10、Tiny-ImageNet-200以及Imagenet-1K等數據集上訓練ResNet。

特別的是,用于訓練的圖像是通過隨機裁剪得到的。

這個“隨機裁剪”,可不是往常我們會在數據增強方法中見到的那一種,而是完全不做任何填充。

舉個例子,就是對圖片做PyTorch的RandomCrop變換時,padding的參數填0。

得到的訓練圖像就是下面這個樣式的。即使你是閱圖無數的老司機,恐怕也分辨不出到底是個啥玩意兒。

79d0c3ce-e739-11ec-ba43-dac502259ad0.png

訓練圖像如此碎片化,模型的識圖能力又能達到幾成?

來看實驗結果:

79edc60e-e739-11ec-ba43-dac502259ad0.png

好家伙,在CIFAR-10上,用16×16的圖像碎片訓練出來的模型,測試準確率能達到91%,而用完整的32×32尺寸圖像訓練出來的模型,測試準確率也不過90%。

這一波,“殘缺版”CNN竟然完全不落下風,甚至還反超了“完整版”CNN。

要知道,被喂了碎片的CNN模型,看到的圖像甚至可能跟標簽顯示的物體毫無關系,只是原圖中背景的部分……

在STL-10、Tiny-Imagenet-200等數據集上,研究人員也得到了類似的結果。

不過,在CIFAR-100上,還是完整圖像訓練出來的模型略勝一籌。16×16圖像碎片訓練出的模型測試準確率為61%,而32×32完整圖像訓練出的模型準確率為68%。

所以,CNN為何會有如此表現?莫非它本來就是個“近視眼”?

研究人員推測,CNN能有如此優秀的泛化表現,是因為在這個實驗中,維度詛咒的影響被削弱了。

所謂維度詛咒(curse of dimensionality),是指當維數提高時,空間體積提高太快,導致可用數據變得稀疏。

而在這項研究中,由于CNN學習到的不是整個圖像的標簽,而是圖像碎片的標簽,這就在兩個方面降低了維度詛咒的影響:

圖像碎片的像素比完整圖像小得多,這減少了輸入維度

訓練期間可用的樣本數量增加了

生成熱圖

基于以上實驗觀察結果,研究人員還提出以熱圖的形式,來理解CNN的預測行為,由此進一步對模型的錯誤做出“診斷”。

就像這樣:

7a1871ce-e739-11ec-ba43-dac502259ad0.png

這些圖像來自于STL-10數據集。熱圖顯示,對于CNN而言,飛機圖像中最能“刺激”到模型的,不是飛機本身,而是天空。

同樣,在汽車圖像中,車輪才是CNN用來識別圖像的主要屬性。

論文地址: https://arxiv.org/abs/2205.10760

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 圖像分類
    +關注

    關注

    0

    文章

    96

    瀏覽量

    12121
  • 數據集
    +關注

    關注

    4

    文章

    1223

    瀏覽量

    25321
  • cnn
    cnn
    +關注

    關注

    3

    文章

    354

    瀏覽量

    22669

原文標題:不看全圖看局部,CNN性能竟然更強了

文章出處:【微信號:CVSCHOOL,微信公眾號:OpenCV學堂】歡迎添加關注!文章轉載請注明出處。

收藏 0人收藏

    評論

    相關推薦
    熱點推薦

    圖像采集卡和顯卡是一樣的嗎?從核心差異、工作原理與應用全解析

    不少朋友在做系統集成或設備選型時,經常會問個看似簡單但又容易混淆的問題:圖像采集卡和顯卡一樣嗎?個是“采圖”的,個是“顯圖”的,聽起來
    的頭像 發表于 05-14 09:52 ?207次閱讀
    <b class='flag-5'>圖像</b>采集卡和顯卡是<b class='flag-5'>一樣</b>的嗎?從核心差異、工作原理與應用全解析

    貼片電容和瓷片電容一樣嗎?

    貼片電容和瓷片電容并不完全一樣,它們在結構、材料、特點和應用等方面存在些差異。以下是對這兩種電容器的詳細比較: 、結構差異 貼片電容:
    的頭像 發表于 04-30 15:05 ?192次閱讀
    貼片電容和瓷片電容<b class='flag-5'>一樣</b>嗎?

    為什么要費這么大勁讓機器人像人一樣,而不是更實用的形態?

    基礎設施兼容性 :人類社會的物理環境(樓梯、門把手、工具、家具等)是為人體結構和動作設計的。人形機器人更容易直接融入這些環境,無需大規模改造基礎設施。 操作便利性 :人形機器人可以像人類一樣使用工具、開關門、搬運物
    的頭像 發表于 02-10 10:03 ?342次閱讀

    調試THS8200時圖像正常輸出,但是圖像很模糊不清怎么解決?

    我們在調試THS8200時圖像正常輸出,但是圖像很模糊不清,跟原來圖像相比差太遠了,您們提供
    發表于 01-17 07:18

    Mamba入局圖像復原,達成新SOTA

    MambaIRv2,更高性能、更高效率!另外還有ACM MM 2024上的Freqmamba方法,在圖像去雨任務中取得了SOTA性能! 顯然,這種基于Mamba的方法在圖像復原領域,比基于CN
    的頭像 發表于 12-30 18:09 ?743次閱讀
    Mamba入局<b class='flag-5'>圖像</b>復原,達成新<b class='flag-5'>SOTA</b>

    封裝一樣的磁棒電感通用嗎

    電子發燒友網站提供《封裝一樣的磁棒電感通用嗎.docx》資料免費下載
    發表于 10-28 11:15 ?0次下載

    使用的TPA3116和3118一樣,工作頻率越高IC的發熱越大,這樣的情況是否正常?

    我使用的TPA3116和3118一樣,工作頻率越高IC的發熱越大,這樣的情況是否正常啊。般我理解的 是工作頻率越高,效率就越高,發熱應該越小才對。特別是在沒有輸入信號的時候,靜態對比非常明顯
    發表于 10-28 07:40

    OPA361輸入為復合視頻,輸出視頻圖像畫面異常,跟過曝一樣,為什么?

    輸入為復合視頻,輸出視頻圖像畫面異常,跟過曝一樣,不知到是什么原因?
    發表于 08-19 06:24

    Stem32CubeIDE像Keil一樣指定不同文件下的代碼編譯嗎?

    Stem32CubeIDE像Keil一樣指定不同文件下的代碼編譯
    發表于 07-23 06:22

    圖像分割與語義分割中的CNN模型綜述

    圖像分割與語義分割是計算機視覺領域的重要任務,旨在將圖像劃分為多個具有特定語義含義的區域或對象。卷積神經網絡(CNN)作為深度學習的種核心模型,在
    的頭像 發表于 07-09 11:51 ?1835次閱讀

    CNN與RNN的關系?

    在深度學習的廣闊領域中,卷積神經網絡(CNN)和循環神經網絡(RNN)是兩種極為重要且各具特色的神經網絡模型。它們各自在圖像處理、自然語言處理等領域展現出卓越的性能。本文將從概念、原理、應用場景及代碼示例等方面詳細探討CNN與R
    的頭像 發表于 07-08 16:56 ?1561次閱讀

    如何利用CNN實現圖像識別

    卷積神經網絡(CNN)是深度學習領域中種特別適用于圖像識別任務的神經網絡結構。它通過模擬人類視覺系統的處理方式,利用卷積、池化等操作,自動提取圖像
    的頭像 發表于 07-03 16:16 ?2587次閱讀

    cnn卷積神經網絡分類有哪些

    卷積神經網絡(CNN)是種深度學習模型,廣泛應用于圖像分類、目標檢測、語義分割等領域。本文將詳細介紹CNN在分類任務中的應用,包括基本結構
    的頭像 發表于 07-03 09:28 ?1400次閱讀

    CNN模型的基本原理、結構、訓練過程及應用領域

    卷積神經網絡(Convolutional Neural Network,簡稱CNN)是種深度學習模型,廣泛應用于圖像識別、視頻分析、自然語言處理等領域。CNN模型的核心是卷積層
    的頭像 發表于 07-02 15:26 ?5633次閱讀

    深度神經網絡模型cnn的基本概念、結構及原理

    深度神經網絡模型CNN(Convolutional Neural Network)是種廣泛應用于圖像識別、視頻分析和自然語言處理等領域的深度學習模型。 引言 深度學習是近年來人工智能領域的研究熱點
    的頭像 發表于 07-02 10:11 ?1.1w次閱讀
    主站蜘蛛池模板: 好好的曰com久久 | 久久久久久久电影 | 午夜小视频免费观看 | 天堂草原天黑黑 | 免费99精品国产自在现线 | 天美麻豆成人AV精品视频 | 亚洲 国产 日韩 欧美 在线 | 青青草原在线新免费 | 亚洲福利天堂网福利在线观看 | ccc36色小姐电影 | 国产传媒精品1区2区3区 | 天天影视香色欲综合网 | 色AV色婷婷97人妻久久久 | 亚洲国产精品特色大片观看 | 明星三级电影 | 欧美又粗又长又大AAAA片 | 亚洲精品成人AV在线观看爽翻 | XXXchinese国产HD| 亚洲中文字幕国产综合 | 魔乳 堕乳漫画acg产卵 | 国产69精品久久久久人妻刘玥 | 国产精品99re6热在线播放 | 我和黑帮老大第365天第2季在线 | 恋夜影院安卓免费列表uc | 性欧美video另类hd高清 | 亚洲大片免费 | 国产伊人自拍 | 麻豆精品乱码WWW久久密 | 国产精品爽爽久久久久久竹菊 | 国产呦精品一区二区三区下载 | 蜜桃久久久亚洲精品成人 | 久久久中日AB精品综合 | 国产精品免费大片 | 高清午夜福利电影在线 | 成人国产在线观看 | 最近更新2019中文字幕国语 | 毛片免费在线播放 | 国产在线aaa片一区二区99 | 亚洲精品国产自在现线最新 | 国产亚洲精品久久孕妇呦呦你懂 | 好大太快了快插穿子宫了 |

    電子發燒友

    中國電子工程師最喜歡的網站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品