色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

訓練深度神經網絡的感覺就像買彩票,“打了折”的深度學習

DPVg_AI_era ? 來源:lq ? 2019-05-10 09:09 ? 次閱讀

MIT CSAIL近期發表文章《彩票假設:尋找稀疏可訓練的神經網絡》認為神經網絡就像中彩票并不是每一張都有用,但應設法找到最能中獎的那個,因此可通過消除神經網絡結構件不必要的連接(也稱修剪)適應低功率設備,在一系列條件下不斷重復該過程,神經網絡可縮小10%到20%,但并不影響準確率,甚至比原始網絡跟快。

根據齊魯晚報報道,最近威海一彩民獲得了1219萬大獎,可以說是非常幸運了,看的一眾神經網絡“煉丹師”們羨慕不已。

訓練深度神經網絡的感覺就像買彩票

HackerNews網友opwieurposiu就吐槽,做DNN其實根本和買彩票沒什么區別:先是收集訓練數據,然后寫一個python腳本,支付大約1美元的GPU時間,跑一下。所不同的是,你盯著的不是輪盤的轉針,而是損失函數圖。

95%的時間都是廢的,但是每隔一段時間你就會得到很大的回報。中獎的時候,你可能覺得自己真是個天才!但復盤的時候又發現,你根本不知道為什么A方式有效而B就不行。這種感覺,跟壓彩票非常相似。

1美元的神經網絡很小了。為了更好地學習,神經網絡就必須非常大,需要海量數據集,整個訓練過程可能要持續好多天。投入100美元、1000美元、10000美元……的時候,你可能感受到的不僅僅是經費在燃燒了。

可是,如果說,實際上神經網絡不一定要那么大呢?

不修剪了,把沒用的部分直接砍掉!

MIT CSAIL的兩位研究人員Jonathan Frankle和Michael Carbin發表過一篇論文《彩票假設:尋找稀疏的、可訓練的神經網絡》剛剛被評為ICLR最佳論文。

論文指出,神經網絡剪枝技術可以在不影響精度的前提下,將訓練網絡的參數數量減少90%以上,降低存儲需求并提高推理的計算性能。然而,當前的經驗是,剪枝產生的稀疏架構從一開始就很難訓,然而同時也能提高了效率。

Frankle和Carbin發現,一個標準的修剪技巧可以自然的顯露出一個子網絡,初始化該網絡就能提高訓練效率。因此他們提出了 “彩票假設”(lottery ticket hypothesis):任何密集、隨機初始化的前饋網絡,都包含一個子網絡,以便在隔離訓練時可以在最多相同數量的訓練迭代中,匹配原始網絡的準確性。

然而,在成功的找到這個子網絡之前,必須經過多次訓練和“修剪”整個網絡。這就好像你去買了一大包彩票,然后從里面找出中獎的那個。神經網絡的好處是,所有的彩票都在你的手中,你總能找出來中獎的那個。

如果能確切的定位到原始網絡中哪個子網絡跟最終預測相關,那么也就用不著多次訓練和“修建”,直接砍掉無關的部分即可。這樣又進一步的降低了工作量,提高了效率。這就意味著,要通過一種技巧,使得每次買彩票必中!

彩票假設也可能遷移學習產生影響,在這種情況下,為圖像識別等任務訓練的網絡可以幫助完成不同的任務。

“打了折”的深度學習

感謝大家對神經網絡的過度熱捧,使得越來越多的人感嘆于神經網絡的神奇效果,但很少有人理解訓練一個神經網絡有多難。一來成本高昂,二來耗時漫長。所以研究人員必須做出許多讓步,在模型的大小、訓練耗時和最終表現等多個方面進行權衡。

包括今天兩位主角提出的“彩票假設”的驗證過程。他們首先采用一種通用的方法,用最低的“權重”“修剪”連接來消除受過訓練的網絡的不必要連接,使其適用于智能手機等低功耗設備。

“彩票假設”的關鍵創新,是發現經過網絡訓練之后,修剪連接可能根本就沒有必要。為了測試這個假設,他們嘗試再次訓練完全相同的網絡,但沒有修剪連接。

重要的是,他們將每個連接“重置”到訓練開始時分配的權重。這些初始權重對于幫助中獎來說至關重要,沒有它們,被修剪的網絡將無法學習。通過修剪越來越多的連接,最終確定了哪些是可以刪掉而不影響模型預測能力。

為了驗證這一假設,他們在各種條件下在許多不同的網絡上重復了這個過程數萬次。實驗結果顯示MNIST和CIFAR10的“中獎彩票”的規模,始終要小于幾個全連接架構和卷積前饋架構的10%-20%。這樣的話,不僅深度網絡在體積上打了折扣,成本、耗時都大打折扣。

下一步,該團隊計劃探索為什么某些子網特別擅長學習,以及有效找出這些子網的方法。

Google已經用Python實現了彩票假設算法,并在Github上開源:

https://github.com/google-research/lottery-ticket-hypothesis

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4779

    瀏覽量

    101052
  • 深度學習
    +關注

    關注

    73

    文章

    5512

    瀏覽量

    121419
  • 遷移學習
    +關注

    關注

    0

    文章

    74

    瀏覽量

    5575

原文標題:ICLR最佳論文:MIT科學家提出彩票假設,神經網路縮小10倍并不影響結果

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    深度學習入門:簡單神經網絡的構建與實現

    深度學習中,神經網絡是核心模型。今天我們用 Python 和 NumPy 構建一個簡單的神經網絡神經網絡由多個
    的頭像 發表于 01-23 13:52 ?54次閱讀

    深度學習中的卷積神經網絡模型

    深度學習近年來在多個領域取得了顯著的進展,尤其是在圖像識別、語音識別和自然語言處理等方面。卷積神經網絡作為深度學習的一個分支,因其在圖像處理
    的頭像 發表于 11-15 14:52 ?393次閱讀

    FPGA在深度神經網絡中的應用

    隨著人工智能技術的飛速發展,深度神經網絡(Deep Neural Network, DNN)作為其核心算法之一,在圖像識別、語音識別、自然語言處理等領域取得了顯著成果。然而,傳統的深度神經網絡
    的頭像 發表于 07-24 10:42 ?773次閱讀

    殘差網絡深度神經網絡

    殘差網絡(Residual Network,通常簡稱為ResNet) 是深度神經網絡的一種 ,其獨特的結構設計在解決深層網絡訓練中的梯度消失
    的頭像 發表于 07-11 18:13 ?1164次閱讀

    pytorch中有神經網絡模型嗎

    當然,PyTorch是一個廣泛使用的深度學習框架,它提供了許多預訓練神經網絡模型。 PyTorch中的神經網絡模型 1. 引言
    的頭像 發表于 07-11 09:59 ?775次閱讀

    簡單認識深度神經網絡

    深度神經網絡(Deep Neural Networks, DNNs)作為機器學習領域中的一種重要技術,特別是在深度學習領域,已經取得了顯著的
    的頭像 發表于 07-10 18:23 ?1153次閱讀

    深度神經網絡概述及其應用

    深度神經網絡(Deep Neural Networks, DNNs)作為機器學習的一種復雜形式,是廣義人工神經網絡(Artificial Neural Networks, ANNs)的
    的頭像 發表于 07-04 16:08 ?1505次閱讀

    深度神經網絡與基本神經網絡的區別

    在探討深度神經網絡(Deep Neural Networks, DNNs)與基本神經網絡(通常指傳統神經網絡或前向神經網絡)的區別時,我們需
    的頭像 發表于 07-04 13:20 ?1034次閱讀

    深度神經網絡的設計方法

    深度神經網絡(Deep Neural Networks, DNNs)作為人工智能領域的重要技術之一,通過模擬人腦神經元之間的連接,實現了對復雜數據的自主學習和智能判斷。其設計方法不僅涉
    的頭像 發表于 07-04 13:13 ?526次閱讀

    bp神經網絡深度神經網絡

    BP神經網絡(Backpropagation Neural Network)是一種常見的前饋神經網絡,它使用反向傳播算法來訓練網絡。雖然BP神經網絡
    的頭像 發表于 07-03 10:14 ?929次閱讀

    卷積神經網絡訓練的是什么

    訓練過程以及應用場景。 1. 卷積神經網絡的基本概念 1.1 卷積神經網絡的定義 卷積神經網絡是一種前饋深度
    的頭像 發表于 07-03 09:15 ?483次閱讀

    深度學習與卷積神經網絡的應用

    隨著人工智能技術的飛速發展,深度學習和卷積神經網絡(Convolutional Neural Network, CNN)作為其中的重要分支,已經在多個領域取得了顯著的應用成果。從圖像識別、語音識別
    的頭像 發表于 07-02 18:19 ?1010次閱讀

    深度神經網絡模型cnn的基本概念、結構及原理

    深度神經網絡模型CNN(Convolutional Neural Network)是一種廣泛應用于圖像識別、視頻分析和自然語言處理等領域的深度學習模型。 引言
    的頭像 發表于 07-02 10:11 ?9894次閱讀

    深度神經網絡模型有哪些

    、Sigmoid或Tanh。 卷積神經網絡(Convolutional Neural Networks,CNN): 卷積神經網絡深度學習中最重
    的頭像 發表于 07-02 10:00 ?1591次閱讀

    利用深度循環神經網絡對心電圖降噪

    進行訓練。我們還研究了使用合成數據 集如何影響網絡性能。 我們建議使用深度循環去噪神經網絡(DRDNN) 對心電圖信號進行去噪。它們是一種深度
    發表于 05-15 14:42
    主站蜘蛛池模板: 亚洲一品AV片观看五月色婷婷 | 精品第一国产综合精品蜜芽 | 老湿司午夜爽爽影院榴莲视频 | 成人女人A级毛片免费软件 成人免费在线视频 | 国产精品人妻无码久久久2022 | 亚洲AV无码一区二区三区乱子伦 | 久久综合久综合久久鬼色 | 久久久擼擼擼麻豆 | jizzhd中国 | 97人妻久久久精品系列A片 | 国产成人理在线观看视频 | 香蕉动漫库 | 国内九一激情白浆发布 | 嫩草国产福利视频一区二区 | 好男人在线观看视频观看高清视频免费 | 婷婷精品国产亚洲AV在线观看 | 夜色55夜色66亚洲精品网站 | 伊人热人久久中文字幕 | 大胸美女被C得嗷嗷叫动态图 | 国产又粗又猛又爽黄老大爷 | 国产一卡2卡3卡4卡孕妇网站 | 美国一级大黄一片免费的网站 | 欧美性情一线免费http | 狠狠啪在线香蕉 | chinese国语露脸videos| 久久66热在线视频精品 | 精品国内自产拍在线观看视频 | 亚洲中文字幕无码爆乳APP | 大学生第一次破苞疼哭了 | 葵司中文第一次大战黑人 | 国产乱码免费卡1卡二卡3卡四卡 | 67194成在线观看免费 | 最美女人体内射精一区二区 | 99久久精品免费看国产免费 | 免费看a视频 | 国产成人精品电影 | 成人在线免费 | 日本调教网站 | 国产成人高清精品免费5388密 | 国产在线播放精品视频 | 高清不卡伦理电影在线观看 |