亚洲最大免费视频网,一级一黄在线观看视频免费,婷婷久草

NAS最近也很火，正好看到了這篇論文，解讀一下，這篇論文是基于DAG（directed acyclic graph）的，DAG包含了上億的 sub-graphs，為了防止全部遍歷這些模型，這篇論文設計了一種全新的采樣器，這種采樣器叫做Gradient-based search suing differential Architecture Sampler(GDAS)，該采樣器可以自行學習和優化，在這個的基礎上，在CIFAR-10上通過4 GPU hours就能找到一個最優的網絡結構。

目前主流的NAS一般是基于進化算法(EA)和強化學習（RL）來做的。EA通過權衡validation accuracy來決定是否需要移除一個模型，RL則是validation accuracy作為獎勵來優化模型生成。作者認為這兩種方法都很消耗計算資源。作者這篇論文中設計的GDAS方法可以在一個單v100 GPU上，用四小時搜索到一個優秀模型。

GDAS

這個采用了搜索robust neural cell來替代搜索整個網絡。如下圖，不同的操作（操作用箭頭表示）會計算出不同的中間結果（中間結果用cycle表示），前面的中間結果會加起來闖到后面。

在優化速度上，傳統的DAG存在一些問題：基于RL和EA的方法，需要獲得反饋都需要很長一段時間。而這篇論文提出的GDAS方法能夠利用梯度下降去做優化,具體怎么梯的下面會說到。此外，使用GDAS的方法可以sample出sub-graph，這意味著計算量要比DAG的方法小很多。

絕大多數的NAS方法可以歸為兩類：Macro search和micro search

Macro search

顧名思義，實際上算法的目的是想要發現一個完整的網絡結構。因此多會采用強化學習的方式。現有的方法很多都是使用Q-learning的方法來學習的。那么會存在的問題是，需要搜索的網絡數量會呈指數級增長。最后導致的結果就是網絡會更淺。

Micro Search

這種不是搜索整個神經網絡，而是搜索neural cells的方式。找到指定的neural cells后，再去堆疊。這種設計方式雖然能夠設計更深的網絡，但是依舊要消耗很長時間，比如100GPU days，超長。這篇文章就是在消耗上面做優化。

算法原理

DAG的搜索空間

前面也說了DAG是通過搜索所謂的neural cell而不是搜索整個網絡。每個cell由多個節點和節點間的激活函數構成。節點我們用來表示，節點的計算如下圖。每個節點有其余兩個節點（下面公式中的節點i和節點j)來生成，而中間會從一個函數集合中去sample函數出來，這個F數據集的組成是1)恒等映射 2)歸零 3)3x3 depthwise分離卷積 4)3x3 dilated depthwise 分離卷積 5)5x5 depthwise分離卷積 6)5x5 dilated depthwise 分離卷積。7）3x3平均池化 8) 3 x 3 最大池化。

那么生成節點I后，再去生成對應的cell。我們將cell的節點數記為B，以B=4為例，該cell實際上會包括7個節點，是前面兩層的cell的輸出（實際上也就是上面公式中的k和j)，而則是我們(1)中計算出來的結果。也就是該cell的output tensor實際上是四個節點的output的聯結。

將cell組裝為網絡

剛剛上面的這種叫做normal cell,作者還設計了一個reduction cell, 用于下采樣。這個reduction cell就是手動設計的了，沒有像normal cell那樣復雜。normal cell 的步長為1，reduction cell步長為2，最后的網絡實際上就是由這些cell組裝起來的。如下圖：

搜索模型參數

搭建的工作如上面所示，好像也還好，就像搭積木，這篇論文我覺得創新的地方在于它的搜索方法，特別是通過梯度下降的方式來更新參數，很棒。具體的搜索參數環節，它是這么做的：

首先我們的優化目標和手工設計的網絡別無二致，都是最大釋然估計：

而上式中的Pr，實際上可寫成：

這個實際上是node i和node j的函數分布，k則是F的基數。而Node可以表示為：

是從中sample出來的，而

這個實際上是node i和node j的函數分布，k則是F的基數。而Node可以表示為：

其中是從離散分布中間sample出來的函數。這里問題來了，如果直接去優化Pr，這里由于I是來自于一個離散分布，沒法對離散分布使用梯度下降方法。這里，作者使用了Gumbel-Max trick來解決離散分布中采樣不可微的問題，具體可以看這個問題下的回答

如何理解Gumbel-Max trick？

TL;DR: Gumbel Trick 是一種從離散分布取樣的方法，它的形式可以允許我們定義一種可微分的，離散分布的近似取樣，這種取樣方式不像「干脆以各類概率值的概率向量替代取樣」這么粗糙，也不像直接取樣一樣不可導（因此沒辦法應對可能的 bp ）。

于是這里將這個離散分布不可微的問題做了轉移，同時對應的優化目標變為：

這里有個的參數，可以控制的相似程度。注意在前向傳播中我們使用的是等式(5)，而在反向傳播中，使用的是等式(7)。結合以上內容，我們模型的loss是：

我們將最后學習到的網絡結構稱為A，每一個節點由前面T個節點連接而來，在CNN中，我們把T設為2，在RNN中，T設為1

在參數上，作者使用了SGD，學習率從0.025逐漸降到1e-3，使用的是cosine schedule。具體的參數和function F 設計上，可以去看看原論文。

總的來說，我覺得這篇論文最大的創新點是使用Gumbel-Max trick來使得搜索過程可微分，當然它中間也使用了一些手動設計的模塊（如reduction cell），所以速度會比其余的NAS更快，之前我也沒有接觸過NAS，看完這篇論文后對現在的NAS常用的方法以及未來NAS發展的趨勢還是有了更深的理解，推薦看看原文。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

神經網絡

神經網絡

+關注

關注
42

文章
4771

瀏覽量
100723
gpu

gpu

+關注

關注
28

文章
4729

瀏覽量
128903
強化學習

強化學習

+關注

關注
4

文章
266

瀏覽量
11250

原文標題：單v100 GPU，4小時搜索到一個魯棒的網絡結構

文章出處：【微信號：rgznai100，微信公眾號：rgznai100】歡迎添加關注！文章轉載請注明出處。

DVB-H網絡結構

DVB-H網絡結構DVB-H同樣采用單頻網（SFN），對頻率資源再用，每個單頻網的半徑大約40公里，內部由多個發射機和功率增強器覆蓋，發射機之間采用IP網聯接，每個發射機配有一

發表于 07-17 21:34

特斯拉V100 Nvlink是否支持v100卡的nvlink變種的GPU直通？

U/4029/SYS-4029GP-TVRT.cfm）我們正試圖做pci將GPU直接傳輸到VM中但是當我們通過pci設備并安裝驅動程序時，我們會從nvidia-nvlink模塊中獲得錯誤。是否支持v100卡的nvlink

發表于 09-12 16:25

神經網絡結構搜索有什么優勢？

，稍有不同就無法復現論文的結果。而網絡結構作為一種特殊的超參數，在深度學習整個環節中扮演著舉足輕重的角色。在圖像分類任務上大放異彩的ResNet、在機器翻譯任務上稱霸的Transformer等網絡結構

發表于 09-11 11:52

備貨Hi3519A V100 4K智能IP攝像頭SoC使用手冊分享

`Hi3519A V100是一款高性能、低功耗的4K智能IP攝像頭SoC，專為IP攝像頭、動作攝像頭、全景攝像頭、后視鏡和無人機設計。Hi3519A V100引入H.265/H.264

發表于 09-25 21:26

網絡結構與IP分組交換技術

《計算機體系結構—網絡篇1、2》之 網絡結構、IP分組交換技術、IP/MAC映射、NAT轉換等...

發表于 12-23 06:05

TD-SCDMA R4網絡結構和技術要求

TD-SCDMA R4網絡結構和技術要求:核心網演進過程R99網絡結構R4網絡結構

發表于 07-30 08:19 ?14次下載

環形網絡,環形網絡結構是什么?

環形網絡,環形網絡結構是什么? 這種結構的網絡形式主要應用于令牌網中，在這種網絡結構中各設備是直接通過電纜來串接的，最后形成

發表于 03-22 11:14 ?6183次閱讀

4G網絡結構及關鍵技術

4G網絡結構及關鍵技的精彩講解

發表于 11-10 17:19 ?115次下載

<b class='flag-5'>4</b>G<b class='flag-5'>網絡結構</b>及關鍵技術

魯棒性是什么意思_Robust為什么翻譯成魯棒性

的意思。它是系統在異常和危險情況下生存的關鍵。比如說，計算機軟件在輸入錯誤、磁盤故障、網絡過載或有意攻擊情況下，能否不死機、不崩潰，就是該軟件的魯棒性。魯

發表于 11-29 09:08 ?12.7w次閱讀

<b class='flag-5'>魯</b><b class='flag-5'>棒</b>性是什么意思_Robust為什么翻譯成<b class='flag-5'>魯</b><b class='flag-5'>棒</b>性

一種改進的深度神經網絡結構搜索方法

為提升網絡結構的尋優能力，提岀一種改進的深度神經網絡結構搜索方法。針對網絡結構間距難以度量的問題，結合神經

發表于 03-16 14:05 ?3次下載

<b class='flag-5'>一</b>種改進的深度神經<b class='flag-5'>網絡結構</b><b class='flag-5'>搜索</b>方法

基于YOLO-V5的網絡結構及實現行人社交距離風險提示

Yolov5的結構其實和Yolov4的結構還是有一定的相似之處的，但也有一些不同，這里還是按照從整體到

發表于 07-06 10:24 ?3595次閱讀

物聯網行業通用主板—卓越V100

? ? ? 卓越V100主板采用了聯發科MT6761四核處理器，其CPU采用Cortex-A53 構架設計，頻率高達2.0GHz，GPU為ARM Mali-G71。卓越V100主板為一

發表于 06-02 10:53 ?2148次閱讀

英偉達v100與A100的差距有哪些？

英偉達v100與A100的差距有哪些？在當今人工智能和深度學習技術日益發展的時代，高性能計算機顯卡已成為支持這些技術發展的關鍵。英偉達是高性能計算機顯卡領域的領導者之一，其v100和

發表于 08-22 16:46 ?2.3w次閱讀

魯棒性的含義以及如何提高模型的魯棒性？

魯棒性的含義以及如何提高模型的魯棒性？什么是魯棒性？魯

發表于 10-29 11:21 ?3440次閱讀

如何提高系統的魯棒性

在當今的技術環境中，系統面臨著各種挑戰，包括硬件故障、軟件缺陷、網絡攻擊和人為錯誤。魯棒性是指系統在面對這些挑戰時保持正常運行的能力。一、定義魯

發表于 11-11 10:17 ?342次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

單v100 GPU，4小時搜索到一個魯棒的網絡結構

評論