色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

ResNet本質上就干了一件事:降低數(shù)據中信息的冗余度。

DPVg_AI_era ? 來源:lp ? 2019-04-19 11:48 ? 次閱讀

本文作者重新審視了ResNet之所以工作的原因,得出結論:ResNet本質上就干了一件事:降低數(shù)據中信息的冗余度。

最近在總結完成語義分割任務的輕量級神經網絡時,看到了MobileNetV2中對于ReLU層的思考,于是我也回過頭重新審視ResNet之所以work的本質原因。以下是一些個人的見解,如有錯誤,還望及時指正。

在談及ResNet之前,我們先聊聊故事的背景。

我們知道,在神經網絡中,非線性激活層可以為模型引入了非線性,讓模型具有更強的擬合能力。如果只是單純的線性操作層的疊加,則完全可以等價為一個線性層,這就浪費了深度神經網絡的一身好本領。

所謂針無兩頭尖,那么非線性激活層會帶來一些什么問題呢?我們以ReLU為例來進行說明,其他非線性激活層亦同理。

首先,最直觀的,從實驗中我們可以注意到一個事實:ReLU 會造成的低維數(shù)據的坍塌(collapse)。顧名思義,即是說,低維度的feature在通過ReLU的時候,這個feature會像塌方了一樣,有一部分被毀掉了,或者說失去了。能恢復嗎?能,但是基本無法百分百還原了。

具體表現(xiàn)出來就是:若是我們對一個feature,先通過一個給定的變換規(guī)則T,將它映射到它的embeddingspace中,再在該embeddingspace中,利用一個ReLU去處理該feature,最后再把這個feature以同樣的變換規(guī)則(逆方向)給映射回原始空間,我們會發(fā)現(xiàn),這時,這個feature已經變得連親媽都不認得了。如圖↓

圖片來自《MobileNetV2:InvertedResidualsandLinearBottlenecks》

ReLU這個東西,其實就是一個濾波器,只不過這個濾波器的作用域不是信號處理中的頻域,而是特征域。那么濾波器又有什么作用呢?維度壓縮,俗話說就是降維啦:如果我們有m個feature被送入ReLU層,過濾剩下n個(n

那么,為什么低維數(shù)據流經非線性激活層會發(fā)生坍塌(信息丟失),而高維數(shù)據就不會呢?

打個簡單但不嚴謹?shù)谋确剑捍蠹叶加羞^年搶高鐵票的經驗吧?幾個人(維度低)幫你搶一張票,肯定沒有一群人(維度高)幫你搶一張票,成功的概率高啊。幾個人里面,大概率全軍覆沒,沒一個能幫上你忙的。而一群人里面,大概率總有那么一個手速驚人的單身青年,幫你搶到你心心念念的回家票。

在數(shù)據上也是一個道理,維度低的feature,分布到ReLU的激活帶上的概率小,因此經過后信息丟失嚴重,甚至可能完全丟失。而維度高的feature,分布到ReLU的激活帶上的概率大,雖然可能也會有信息的部分丟失,但是無傷大雅,大部分的信息仍然得以保留。所謂留得青山在,不愁沒柴燒嘛。更何況被ReLU截殺的信息,可能只是一些無用游民(冗余信息)。

那么數(shù)據的坍塌,是個很嚴重的事嗎?

那事兒可大了。如果把神經網絡比作一個人的話,你這就是給它的某個部位的血管里,丟了個血栓。

當信息無法流過ReLU時,該神經元的輸出就會變?yōu)?。而在反向傳播的過程中,ReLU對0值的梯度為0,即發(fā)生了梯度消失,這將導致神經元的權重無法再通過梯度下降法進行更新,這種現(xiàn)象被稱為特征退化。所以這個神經元相當于死掉了,喪失了學習能力。我們說,一旦神經元的輸出陷入0值,就無法恢復了。

那么,我們應該怎么去規(guī)避數(shù)據的坍塌呢?非線性激活層到底是個什么樣的東西?

其實,對于一個數(shù)據,利用非線性激活層對其進行激活,其實是從該數(shù)據的信息中提取出其潛在的稀疏性,但是這種提取的結果是否正確,就要分情況討論了。

對于一個M維的數(shù)據,我們可以將其看成是在M維空間中的一個M維流形(manifold)。而其中的有用信息,就是在該M維空間中的一個子空間(子空間的維度記為N維,N<=M)中的一個?N?維流形。非線性激活層相當于壓縮了這個?M?維空間的維度(還記得前面提過的維度壓縮嗎?)。若是該?M?維空間中的?M?維流形本來就不含有冗余信息(M=N),那么再對其進行維度壓縮,必然導致信息的丟失。

而維度低的數(shù)據其實就是這么一種情況:其信息的冗余度高的可能性本來就低,如果強行對其進行非線性激活(維度壓縮),則很有可能丟失掉有用信息,甚至丟失掉全部信息(輸出為全0)。

與非線性激活層不同的是,線性激活層并不壓縮特征空間的維度。于是,我們得到了一條使用激活層的原則:

對含有冗余信息的數(shù)據使用非線性激活(如ReLU),對不含冗余信息的數(shù)據使用線性激活(如一些線性變換)。

兩種類型的激活交替靈活使用,以同時兼顧非線性和信息的完整性。

由于冗余信息和非冗余信息所攜帶的有用信息是一樣多的,因此在設計網絡時,對內存消耗大的結構最好是用在非冗余信息上。

根據以上的原則設計出來的結構,聰明的你想到了什么?ResNet。不得不贊嘆KaimingHe的天才,ResNet這東西,描述起來固然簡單,但是對它的理解每深一層,就會愈發(fā)發(fā)現(xiàn)它的精妙及優(yōu)雅,從數(shù)學上解釋起來非常簡潔,非常令人信服,而且直切傳統(tǒng)痛點。

ResNet本質上就干了一件事:降低數(shù)據中信息的冗余度。

具體說來,就是對非冗余信息采用了線性激活(通過skipconnection獲得無冗余的identity部分),然后對冗余信息采用了非線性激活(通過ReLU對identity之外的其余部分進行信息提取/過濾,提取出的有用信息即是殘差)。

其中,提取 identity 這一步,就是 ResNet 思想的核心。

從本文的觀點來看,因為從數(shù)據中拿掉了非冗余信息的identity部分,會導致余下部分的信息冗余度變高。這就像從接近飽和的溶液中移走了一部分溶質,會使得剩下的溶液的飽和度降低,一個道理。

在這里也引用一下其他的一些觀點,方便大家可以從一個更全面的角度去看這個問題:

從特征復用的觀點來看,提取identity部分,可以讓網絡不用再去學習一個identitymapping(雖然是一樣的東西,但是畢竟又要從頭學起,講真,換你來試試,這其實真的不容易學到),而是直接學習residual。這就輕松愉快多了:站在巨人的肩膀上,做一點微小的工作什么的...

既然說了ResNet解決的痛點,也順便多說幾句它帶來的好處:

由于identity之外的其余部分的信息冗余度較高,因此在對其使用ReLU進行非線性激活時,丟失的有用信息也會較少,ReLU層輸出為0的可能性也會較低。這就降低了在反向傳播時ReLU的梯度消失的概率,從而便于網絡的加深,以大大地發(fā)揮深度網絡的潛能。

特征復用能加快模型的學習速度,因為參數(shù)的優(yōu)化收斂得快(從identity的基礎上直接學習殘差,總比從頭學習全部來得快)。

最后是兩個小tips:

如果一個信息可以完整地流過一個非線性激活層,則這個非線性激活層對于這個信息而言,相當于僅僅作了一個線性激活。

解決由非線性激活導致的反向傳播梯度消失的竅門,就是要提高進行非線性激活的信息的冗余度。

如果您覺得本文對您有所幫助,請高抬貴手點個贊~

接下來會填之前語義軟分割的坑和圖神經網絡的坑,還有一些雜七雜八的:如姿態(tài)估計網絡啦、deepSLAM啦、視覺跟蹤網絡啦、VQA啦...最近光忙著看paper和寫筆記了,有空再整理后發(fā)上來。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4772

    瀏覽量

    100855
  • 冗余
    +關注

    關注

    1

    文章

    111

    瀏覽量

    20238
  • resnet
    +關注

    關注

    0

    文章

    12

    瀏覽量

    3171

原文標題:對 ResNet 本質的一些思考

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    為什么做一件事或者學習FPGA每隔段時間就會感覺遇到瓶頸呢?

    一件事或者學習每隔段時間就會感覺遇到瓶頸
    發(fā)表于 07-30 08:59

    [原創(chuàng)]每天做好一件事

    每天做好一件事位畫家,舉辦過十幾次個人畫展。開始無論參觀者多少,臉上總是掛著微笑。有次,我問他:"你為什么每天都這么開心呢?"他給我講一件事情:小時后,我興趣非常廣泛,也很
    發(fā)表于 05-31 11:55

    什么叫做“每天6件事”,如何落實“每天6件事

    如何有效率地一一完成工作,而不是面對六難事?,F(xiàn)在把這六件事照順序解決。從第項開始。盡量避免干擾,若無法避免,要趕快解決,然后回到第一件事,迅速完成,做完以后就從表上劃掉,繼續(xù)做第二
    發(fā)表于 04-21 13:40

    學習C2000,大學里最值得干的一件事

    經??吹接芯W友發(fā)帖問相關DSP入門的問題,這里針對C2000入門來總結下: 從個人經驗來看,在大學選擇學習C2000是最值得干的一件事。 總體來說C2000的門檻比較高,只要你入門并深入學習了
    發(fā)表于 09-25 14:09

    干貨-背鉆工藝,超高速信號電路板必須要做的一件事!

    干貨-背鉆工藝,超高速信號電路板必須要做的一件事!https://bbs.elecfans.com/forum.php?mod=viewthread&tid=1417189&extra=更多知識,專注電子技術,請關注電子發(fā)燒友小組:臥龍會IT技術。打開文章點擊右上角加入小組。
    發(fā)表于 01-12 17:02

    提高電源冗余度的結構分析

    為了提高冗余度,不少使用"或"運算二極管的電源都可接入同個負載。在維護期間,當你拆去任何個電源時,希望負載的電源騷動盡可能最小。為了補償"或"運算二極管兩端的電
    發(fā)表于 07-14 10:34 ?860次閱讀
    提高電源<b class='flag-5'>冗余度</b>的結構分析

    小米神話被華為OV聯(lián)手打敗,只因為雷軍常做這三件事

    曾經的小米,多么傳奇的神話?結果卻被華為OV聯(lián)手打敗。越來越多的米粉轉成了米黑,只因為雷軍做了三件事。第一件事是饑餓營銷,第二件事是售后不給力,第三件事是經常吹牛。
    發(fā)表于 02-06 08:46 ?1581次閱讀

    冗余度桁架機械臂的容錯逆運動學仿真_趙普

    冗余度桁架機械臂的容錯逆運動學仿真_趙普
    發(fā)表于 03-19 11:41 ?0次下載

    10年專注一件事,OPPO品牌獲年輕用戶認可

    適應新的消費特點,滿足用戶需求,能堅持創(chuàng)新的品牌。其中,手機行業(yè)里的OPPO在品牌表現(xiàn)就尤為出色,從2008年開始OPPO就正式進軍手機領域,此后10年,OPPO專注于做好手機這一件事,不斷創(chuàng)造爆款
    發(fā)表于 05-11 09:46 ?831次閱讀

    什么叫冗余度

    冗余度,就是從安全角度考慮多余的個量,這個量就是為了保障儀器、設備或某項工作在非正常情況下也能正常運轉。網絡傳輸?shù)?b class='flag-5'>冗余在數(shù)據傳輸中,由于衰減或干擾會使
    發(fā)表于 11-21 10:21 ?4.9w次閱讀

    馬云從企業(yè)家到師者的決然轉身,教會給了人們的第一件事

    敢于直面改變,馬云從企業(yè)家到師者的決然轉身,教會給了人們的第一件事。馬云在采訪中拿比爾·蓋茨舉例子時說:“我永遠都無法和他樣富有,但是我能比他更早地退休?!?4歲,對個企業(yè)家來是風華正茂的年紀,掌控
    的頭像 發(fā)表于 09-13 11:59 ?2543次閱讀

    希捷就只做了一件事兒,對此,你怎么看?

    希捷就只做了一件事兒,對此,你怎么看? 都是做事情,想法不樣,或者說態(tài)度不樣,結果不樣,對嗎? 把事情當事兒做,想的是盡快把事兒做完,交代就可以了; 把事情 當事業(yè)做 ,并視為人
    發(fā)表于 10-21 00:01 ?264次閱讀

    如何正確看待人工智能時代的發(fā)展

     對AI抱有期待和對AI恐懼的兩類人,可能都沒有意識到,他們的期待和害怕本質上都是同一件事:AI太智能了。
    發(fā)表于 09-29 14:29 ?6729次閱讀

    為ADAS構建時需要考慮的6件事說明

    為ADAS構建時需要考慮的6件事說明。
    發(fā)表于 09-22 17:06 ?1次下載

    江波龍電子丨商業(yè)往事第69話:每一件事都可以有策略

    商業(yè)往事每月分享幾則有趣的商業(yè)小故事(中英雙語),邀請大家和我們起透過歷史故事,看存儲商業(yè)。每一件事都可以有策略本文總計2696字預計閱讀9分鐘(英文文章在中文文章之后)你渴望的任何東西,你幾乎
    的頭像 發(fā)表于 06-13 10:08 ?680次閱讀
    江波龍電子丨商業(yè)往事第69話:每<b class='flag-5'>一件事</b>都可以有策略
    主站蜘蛛池模板: 亚洲免费片| 被cao的奶水直喷高H| 国产在线午夜| 一个人在线观看的视频| 蜜桃成熟时33D在线嘟嘟网| yw193.c国产在线观看| 天龙八部慕容属性加点| 精品水蜜桃久久久久久久| 国产亚洲综合视频| 亚洲一区免费看| 欧美极限扩肛| 国产国产人免费观看在线视频| 美女张开让男生桶| 岛国大片在线观看完整版| 亚洲AV无码一区二区色情蜜芽 | 综合网伊人| 色宅男看片午夜大片免费看| 黑吊大战白女出浆| ⅹxx日本护土| 亚洲欧美日本中文子不卡| 黑人巨茎大战白人女40CMO| 最新国产在线视频| 午夜射精日本三级| 免费观看的毛片| 国产野外无码理论片在线观看| 91麻精品国产91久久久久| 跳蛋按摩棒玉势PLAY高H| 久久一本岛在免费线观看2020| 国产99青草全福视在线| 又亲又揉摸下面视频免费看 | 国产精品成人免费视频99| 91福利潘春春在线观看| 小小水蜜桃免费影院| 欧美人与动牲交ZOOZ特| 久久99影院| 国产日韩欧美高清免费视频| WWW国产精品内射熟女| 伊人久久免费| 性西欧俄罗斯极品| 日美欧韩一区二去三区| 毛片亚洲毛片亚洲毛片|