色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

PEMN:參數(shù)集約型掩碼網(wǎng)絡(luò)

CVer ? 來源:CVer ? 作者:CVer ? 2022-12-15 14:09 ? 次閱讀

NeurIPS 2022 | Parameter-Efficient Masking Networks,美國東北大學(xué),羅切斯特理工等,提出參數(shù)集約型掩碼網(wǎng)絡(luò),探索有限數(shù)量隨機數(shù)的表征能力并提升神經(jīng)網(wǎng)絡(luò)儲存和傳輸效率。

為了處理更復(fù)雜的任務(wù),近年來神經(jīng)網(wǎng)絡(luò)的規(guī)模也在不斷變大,如何高效的儲存和傳輸神經(jīng)網(wǎng)絡(luò)變得十分重要。另一方面,隨著彩票假說(Lottery Ticket Hypothesis (LTH))的提出,隨機稀疏神經(jīng)網(wǎng)絡(luò)最近展現(xiàn)出很強的潛力,如何利用這種潛力來提高網(wǎng)絡(luò)的存儲和傳輸效率也很值得探索。

來自美國東北大學(xué)和羅切斯特理工的研究者提出參數(shù)集約型掩碼網(wǎng)絡(luò)(Parameter-Efficient Masking Networks (PEMN))。作者首先探索了有限數(shù)量隨機數(shù)生成的隨機網(wǎng)絡(luò)的表征能力。實驗表明,即使網(wǎng)絡(luò)由有限數(shù)量的隨機數(shù)生成,通過選擇不同的子網(wǎng)絡(luò)結(jié)構(gòu),其依然具有很好的表征能力。通過這種探索性實驗,作者自然地提出使用一組有限數(shù)量隨機數(shù)作為prototype,結(jié)合一組mask來表達一個神經(jīng)網(wǎng)絡(luò)。因為有限數(shù)量的隨機數(shù)和二值的mask占用很少的儲存空間,作者以此來提出一種新的思路來進行網(wǎng)絡(luò)壓縮。文章已被NeurIPS 2022 接受。代碼已開源。

1a33b5fe-7c3d-11ed-8abf-dac502259ad0.png

Parameter-Efficient Masking Networks

論文地址: https://arxiv.org/abs/2210.06699

論文代碼: https://github.com/yueb17/PEMN

1. 相關(guān)研究

MIT研究人員提出彩票假說 Lottery Ticket Hypothesis (ICLR’19):在一個隨機初始化網(wǎng)絡(luò)中,存在一個彩票子網(wǎng)絡(luò)(winning ticket)在被單獨訓(xùn)練的情況下達到很好的效果。彩票假說探索了隨機稀疏網(wǎng)絡(luò)的可訓(xùn)練性。Uber研究人員提出Supermask (NeurIPS’19):在一個隨機初始化網(wǎng)絡(luò)中,存在一個子網(wǎng)絡(luò),可以直接用來做推斷而不需要訓(xùn)練。Supermask探索了隨機稀疏網(wǎng)絡(luò)的可用性。華盛頓大學(xué)研究人員提出Edge-Popup (CVPR’20):通過反向傳播學(xué)習(xí)子網(wǎng)絡(luò)的mask,大幅提升了隨機稀疏網(wǎng)絡(luò)的可用性。

2. 研究動機/流程

以上相關(guān)研究從不同角度探索了隨機稀疏網(wǎng)絡(luò)的潛力,如可訓(xùn)練性和可用性,其中可用性也可以理解為表征能力。在此工作中,作者感興趣的是由隨機數(shù)生成的神經(jīng)網(wǎng)絡(luò)在不訓(xùn)練權(quán)重的情況下有多強的表征能力。隨著對該問題的探索,作者提出了Parameter-Efficient Masking Networks (PEMN)。自然地,作者運用PEMN為網(wǎng)絡(luò)壓縮提供了一種新的思路,并作為一個例子對PEMN的潛在應(yīng)用場景進行探索。

3. 探索隨機數(shù)構(gòu)成的神經(jīng)網(wǎng)絡(luò)的表征能力

給定一個隨機網(wǎng)絡(luò),作者選擇Edge-Popup算法在其中選擇子網(wǎng)絡(luò)來探索其表征能力。不同的是,相對于對整個網(wǎng)絡(luò)進行隨機初始化,作者提出了三種參數(shù)集約型的網(wǎng)絡(luò)生成策略來使用一個prototype構(gòu)建隨機網(wǎng)絡(luò)。

One-layer: 選擇網(wǎng)絡(luò)中重復(fù)結(jié)構(gòu)的權(quán)重作為prototype來填充其他的與之結(jié)構(gòu)相同的網(wǎng)絡(luò)層。

Max-layer padding (MP): 選擇參數(shù)量最多的網(wǎng)絡(luò)層作為prototype并且截斷相應(yīng)的參數(shù)量來填充其他網(wǎng)絡(luò)層。

Random vector padding (RP): 選擇一定長度的隨機向量作為prototype并對其進行復(fù)制來填充整個網(wǎng)絡(luò)。

1a5d0a6c-7c3d-11ed-8abf-dac502259ad0.png

三種不同的隨機網(wǎng)絡(luò)生成策略把網(wǎng)絡(luò)中不重復(fù)參數(shù)值(unique values)的數(shù)量逐步變小,我們基于不同策略得到的隨機網(wǎng)絡(luò)來選擇子網(wǎng)絡(luò),從而探索了有限數(shù)量隨機數(shù)生成的隨機網(wǎng)絡(luò)的表征潛力。

1a86ae1c-7c3d-11ed-8abf-dac502259ad0.png

上圖展示了使用ConvMixer 和 ViT 網(wǎng)絡(luò)CIFAR10圖像分類的實驗結(jié)果。Y軸為準確率,X軸為使用不同策略得到的隨機網(wǎng)絡(luò)。隨之X軸的變大,隨機網(wǎng)絡(luò)中不重復(fù)隨機數(shù)數(shù)量逐漸變小 (RP后的數(shù)字表示相比較于MP,RP中不重復(fù)隨機數(shù)數(shù)量的比例)。根據(jù)實驗結(jié)果,我們觀察到即使隨機網(wǎng)絡(luò)只有非常有限的不重復(fù)隨機數(shù)(比如PR_1e-3),依然可以很好的維持選擇出來的子網(wǎng)絡(luò)的表征能力。至此,作者通過不同的隨機網(wǎng)絡(luò)生成策略,探索了有限數(shù)量隨機數(shù)構(gòu)成的神經(jīng)網(wǎng)絡(luò)的表征能力并觀察到即使不重復(fù)隨機數(shù)非常有限,其對應(yīng)的隨機網(wǎng)絡(luò)依然可以很好地對數(shù)據(jù)進行表征。同時作者基于這些隨機網(wǎng)絡(luò)生成策略,結(jié)合所得到的子網(wǎng)絡(luò)掩碼,提出了Parameter-Efficient Masking Networks(PEMN)這種新的神經(jīng)網(wǎng)絡(luò)類型。

4. 一種新的網(wǎng)絡(luò)壓縮思路

本文選擇了神經(jīng)網(wǎng)路壓縮為例來拓展PEMN的潛在應(yīng)用。具體來說,文中所提出的不同隨機網(wǎng)絡(luò)生成策略可以高效的使用prototype來代表完整的隨機網(wǎng)絡(luò),尤其是最細粒度的random vector padding (RP)策略。作者使用RP策略中的隨機向量prototype和與之對應(yīng)的一組子網(wǎng)絡(luò)掩碼來表示一個隨機網(wǎng)絡(luò)。在其中prototype需要保存浮點數(shù)格式,而掩碼只需要保存成二值格式。因為RP中的prototype長度可以很短(因為有限數(shù)量的不重復(fù)隨機數(shù)仍有很強的表征能力),所以表示一個神經(jīng)網(wǎng)絡(luò)的開銷會變得很小,即儲存一個長度有限的浮點數(shù)格式的隨機向量和一組二值格式的掩碼。相比較于傳統(tǒng)的稀疏網(wǎng)絡(luò)儲存子網(wǎng)絡(luò)的浮點值,本文提出了一種新的網(wǎng)絡(luò)壓縮思路用來高效的儲存和傳輸神經(jīng)網(wǎng)絡(luò)。

1aa0ec96-7c3d-11ed-8abf-dac502259ad0.png

在上圖中,作者使用PEMN對網(wǎng)絡(luò)進行壓縮并與傳統(tǒng)的網(wǎng)絡(luò)剪枝方法進行對比。實驗使用ResNet網(wǎng)絡(luò)在CIFAR數(shù)據(jù)集做圖像分類任務(wù)。我們觀察到,新的壓縮方案表現(xiàn)普遍優(yōu)于傳統(tǒng)的網(wǎng)絡(luò)剪枝,尤其是在很高的壓縮率下,PEMN仍然可以維持較好的準確率。

5. 結(jié)論

本文受近來隨機網(wǎng)絡(luò)展現(xiàn)出來的潛力所啟發(fā),提出不同種參數(shù)集約策略來構(gòu)建隨機神經(jīng)網(wǎng)絡(luò),進而探索了在只有有限的不重復(fù)隨機數(shù)的情況下所生成的隨機神經(jīng)網(wǎng)絡(luò)的表征潛力,并提出參數(shù)集約型掩碼網(wǎng)絡(luò)Parameter-Efficient Masking Networks (PEMN)。作者將PEMN應(yīng)用到網(wǎng)絡(luò)壓縮的場景中探索了其在實際應(yīng)用方面的潛力并且為網(wǎng)絡(luò)壓縮提供了一種新的思路。作者提供了廣泛的實驗,表明了即使隨機網(wǎng)絡(luò)中只有非常有限的不重復(fù)隨機數(shù),通過子網(wǎng)絡(luò)的選擇,其依然有較好的表征能力。此外,相比較于傳統(tǒng)剪枝算法,實驗表明新提出的方法可以取得更好的網(wǎng)絡(luò)壓縮效果,驗證了PEMN在該場景下的應(yīng)用潛力。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4774

    瀏覽量

    100890
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4620

    瀏覽量

    93048

原文標題:NeurIPS 2022 | PEMN:參數(shù)集約型掩碼網(wǎng)絡(luò)

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    子網(wǎng)掩碼反運算的步驟和應(yīng)用

    32位地址,主要用來區(qū)分IP地址中的網(wǎng)絡(luò)部分和主機部分。它是由一串連續(xù)的1和連續(xù)的0組成,其中的1表示網(wǎng)絡(luò)部分,0用來表示主機部分。子網(wǎng)掩碼與IP地址一起使用,用于確定IP地址的所屬網(wǎng)絡(luò)
    的頭像 發(fā)表于 12-09 09:27 ?141次閱讀

    一文分清IP地址、子網(wǎng)和子網(wǎng)掩碼的關(guān)系

    大家在進行IPv4地址配置時都看到過“子網(wǎng)掩碼”這樣的參數(shù)名,許多小伙伴都會疑惑這是個啥?有什么用呢? 下面帶領(lǐng)大家認識認識子網(wǎng)掩碼以及跟其密不可分的子網(wǎng)! 1 IP地址、子網(wǎng)和子網(wǎng)掩碼
    的頭像 發(fā)表于 12-07 10:20 ?1025次閱讀
    一文分清IP地址、子網(wǎng)和子網(wǎng)<b class='flag-5'>掩碼</b>的關(guān)系

    什么是小水電集約化管理?小水電集約化管理實現(xiàn)的價值

    小水電集約化管理,是指在集控運行中心通過網(wǎng)絡(luò)通道實現(xiàn)遠程對小水電站集群進行遠程控制、統(tǒng)一規(guī)范運行。以區(qū)域、流域為單元,集中相關(guān)資源和業(yè)務(wù),專業(yè)化分工,實現(xiàn)區(qū)域、流域內(nèi)水電站群集控運維、專業(yè)化的統(tǒng)一運營管理。
    的頭像 發(fā)表于 11-12 14:26 ?303次閱讀
    什么是小水電<b class='flag-5'>集約</b>化管理?小水電<b class='flag-5'>集約</b>化管理實現(xiàn)的價值

    Linux ifconfig網(wǎng)絡(luò)參數(shù)詳解

    ifconfig 主要是可以手動啟動、觀察與修改網(wǎng)絡(luò)接口的相關(guān)參數(shù)
    的頭像 發(fā)表于 10-24 17:31 ?595次閱讀

    日本東京ip和子網(wǎng)掩碼

    日本東京的IP地址和子網(wǎng)掩碼是緊密相連的,它們共同決定了網(wǎng)絡(luò)中設(shè)備的通信方式。下面rak小編將詳細介紹日本東京的IP地址和子網(wǎng)掩碼
    的頭像 發(fā)表于 10-12 10:13 ?330次閱讀

    電流反饋運放與電壓反饋運放

    ,選擇具有適當(dāng)增益帶寬積(GBW)、轉(zhuǎn)換速率(SR)和輸入/輸出阻抗等參數(shù)的CFA器件。 (2)設(shè)計輸入和輸出網(wǎng)絡(luò):根據(jù)所需的增益、帶寬和穩(wěn)定性等要求,設(shè)計合適的輸入和輸出網(wǎng)絡(luò)。這可能包括電阻、電容和電感
    發(fā)表于 09-10 09:47

    嵌入式學(xué)習(xí)-常見的shell命令之網(wǎng)絡(luò)相關(guān)命令

    配給任何主機,僅用作廣播地址(三)IP地址127.0.0.1為回環(huán)結(jié)構(gòu),用于本地進行軟件測試4)子網(wǎng)掩碼子網(wǎng)掩碼是一個32位的二進制地址,用來屏蔽原來網(wǎng)絡(luò)地址的劃分情況,從而獲得一個范圍小的,可以實際使用
    發(fā)表于 08-21 09:41

    常見的shell命令之網(wǎng)絡(luò)相關(guān)命令

    配給任何主機,僅用作廣播地址(三)IP地址127.0.0.1為回環(huán)結(jié)構(gòu),用于本地進行軟件測試4)子網(wǎng)掩碼子網(wǎng)掩碼是一個32位的二進制地址,用來屏蔽原來網(wǎng)絡(luò)地址的劃分情況,從而獲得一個范圍小的,可以實際使用
    發(fā)表于 08-20 09:50

    神經(jīng)網(wǎng)絡(luò)各個網(wǎng)絡(luò)參數(shù)的設(shè)定原則

    神經(jīng)網(wǎng)絡(luò)各個網(wǎng)絡(luò)參數(shù)的設(shè)定原則是一個復(fù)雜而關(guān)鍵的過程,它直接影響到網(wǎng)絡(luò)的性能和學(xué)習(xí)效果。以下將從網(wǎng)絡(luò)節(jié)點、初始權(quán)值、訓(xùn)練速率、動態(tài)
    的頭像 發(fā)表于 07-11 17:03 ?1094次閱讀

    矢量網(wǎng)絡(luò)分析儀怎么測量S參數(shù)

    矢量網(wǎng)絡(luò)分析儀(VNA)是一種用于測量射頻(RF)和微波網(wǎng)絡(luò)的散射參數(shù)(S參數(shù))的高精度儀器。
    的頭像 發(fā)表于 05-17 16:25 ?2313次閱讀

    LED顯示屏控制軟件參數(shù)配置方法

    基本參數(shù)是戶外LED屏的基礎(chǔ)參數(shù),如果設(shè)置不正確,則不能通信或不顯示以及顯示不正常。基本參數(shù)包括顯示屏寬高度、控制卡地址、波特率、IP地址、端口號、MAC地址、子網(wǎng)掩碼、網(wǎng)關(guān)、刷新頻率
    發(fā)表于 04-09 09:33 ?1513次閱讀
    LED顯示屏控制軟件<b class='flag-5'>參數(shù)</b>配置方法

    基于掩碼模型的LiDAR感知模型預(yù)訓(xùn)練策略

    對于每個被掩碼的網(wǎng)格,計算此網(wǎng)格中的點云數(shù)量,并通過將點云數(shù)量除以其在3D空間中的占用體積來得到對應(yīng)的密度真值。
    發(fā)表于 04-06 04:33 ?628次閱讀
    基于<b class='flag-5'>掩碼</b>模型的LiDAR感知模型預(yù)訓(xùn)練策略

    除了S參數(shù),還有哪些網(wǎng)絡(luò)參數(shù)呢?

    對于射頻人員來講,最熟悉的可能就是S參數(shù)了。但是除了S參數(shù)之外,其實還有其他很多網(wǎng)絡(luò)參數(shù)
    的頭像 發(fā)表于 02-27 16:35 ?1387次閱讀
    除了S<b class='flag-5'>參數(shù)</b>,還有哪些<b class='flag-5'>網(wǎng)絡(luò)</b><b class='flag-5'>參數(shù)</b>呢?

    G10指令可以對參數(shù)進行賦值,位參數(shù)可以嗎?

    G10指令可以對參數(shù)進行賦值,位參數(shù)可以嗎? G10指令是用于在加工程序中進行參數(shù)賦值的指令。它可以用于指定數(shù)值
    的頭像 發(fā)表于 02-18 10:49 ?893次閱讀

    請問如何在XMC4108中設(shè)置掩碼值和標識符值?

    如何設(shè)置掩碼值和標識符值? 其實我確實掩蓋了值但是沒有收到 RTR 消息。 我還是很困惑。 關(guān)于掩碼值和 id 值。
    發(fā)表于 01-18 08:02
    主站蜘蛛池模板: 医生含着我的奶边摸边做| 乱子伦在线观看中文字幕| 亚洲黄色在线播放| 两个人看的www免费高清直播| 成激人情在线影院920| 亚洲一区二区免费看| 色即是空 BT| 麻豆免费观看高清完整视频| 国产精品观看视频免费完整版| 97久久超碰中文字幕| 亚洲精品久久久久69影院| 日本人的xxxxxxxxx69| 伦理片qvod| 黄色三级视频在线| 国产99RE在线观看69热| 2021全国精品卡一卡二| 亚洲美女视频高清在线看| 日日撸影院在线| 毛片大全网站| 久久精品视在线-2| 黑人干亚洲人| 蜜桃成熟时2在线| 九九国产精品成人AV麻豆| 国产女人喷潮视频免费| 俄罗斯搜索引擎Yandex推广入口| 96.8在线收听| 在线观看qvod| 亚洲性夜色噜噜噜网站2258KK| 亚洲AV久久久噜噜噜噜| 偷偷鲁青春草原视频| 日本美女色| 人人碰79免费视频| 亲胸摸下面激烈免费网站| 免费的黄直播| 噜噜噜狠狠夜夜躁精品| 久久综合久综合久久鬼色| 久久精品国产96精品亚洲| 九九在线精品视频| 精品国产自在现线拍国语| 黄色网址在线看| 久久草这里全是精品香蕉频线观|