色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器學習全靠調參?谷歌發布顛覆性研究

新機器視覺 ? 來源:YXQ ? 2019-06-16 09:41 ? 次閱讀

機器學習全靠調參?這個思路已經過時了。

谷歌大腦團隊發布了一項新研究:

只靠神經網絡架構搜索出的網絡,不訓練,不調參,就能直接執行任務。

這樣的網絡叫做WANN,權重不可知神經網絡。

它在MNIST數字分類任務上,未經訓練和權重調整,就達到了92%的準確率,和訓練后的線性分類器表現相當。

除了監督學習,WANN還能勝任許多強化學習任務

團隊成員之一的大佬David Ha,把成果發上了推特,已經獲得了1300多贊:

那么,先來看看效果吧。

效果

谷歌大腦用WANN處理了3種強化學習任務。

(給每一組神經元,共享同一個權重。)

第一項任務,Cart-Pole Swing-Up。

這是經典的控制任務,一條滑軌,一臺小車,車上一根桿子。

小車在滑軌的范圍里跑,要把桿子從自然下垂的狀態搖上來,保持在直立的位置不掉下來。

(這個任務比單純的Cart-Pole要難一些:

Cart-Pole桿子的初始位置就是向上直立,不需要小車把它搖上來,只要保持就可以。)

難度體現在,沒有辦法用線性控制器 (Linear Controller) 來解決。每一個時間步的獎勵,都是基于小車到滑軌一頭的距離,以及桿子擺動的角度

WANN的最佳網絡 (Champion Network) 長這樣:

它在沒有訓練的狀態下,已經表現優異:

表現最好的共享權重,給了團隊十分滿意的結果:只用幾次擺動便達到了平衡狀態。

第二項任務,Bipedal Waker-v2。

一只兩足“生物”,要在隨機生成的道路上往前走,越過凸起,跨過陷坑。獎勵多少,就看它從出發到掛掉走了多長的路,以及電機扭矩的成本(為了鼓勵高效運動) 。

每條腿的運動,都是由一個髖關節、和一個膝關節來控制的。有24個輸入,會指導它的運動:包括“激光雷達”探測的前方地形數據,本體感受到的關節運動速度等等。

比起第一項任務中的低維輸入,這里可能的網絡連接就更多樣了:

所以,需要WANN對從輸入到輸出的布線方式,有所選擇。

這個高維任務,WANN也優質完成了。

你看,這是搜索出的最佳架構,比剛才的低維任務復雜了許多:

它在-1.5的權重下奔跑,長這樣:

第三項任務,CarRacing-v0

這是一個自上而下的 (Top-Down) 、像素環境里的賽車游戲。

一輛車,由三個連續命令來控制:油門、轉向、制動。目標是在規定的時間里,經過盡可能多的磚塊。賽道是隨機生成的。

研究人員把解釋每個像素 (Pixel Interpretation) 的工作交給了一個預訓練的變分自編碼器 (VAE) ,它可以把像素表征壓縮到16個潛在維度。

這16維就是網絡輸入的維度。學到的特征是用來檢測WANN學習抽象關聯 (Abstract Associations) 的能力,而不是編碼不同輸入之間顯式的幾何關系。

這是WANN最佳網絡,在-1.4共享權重下、未經訓練的賽車成果:

雖然路走得有些蜿蜒,但很少偏離跑到。

而把最佳網絡微調一下,不用訓練,便更加順滑了:

總結一下,在簡單程度和模塊化程度上,第二、三項任務都表現得優秀,兩足控制器只用了25個可能輸入中的17個,忽略了許多LIDAR傳感器和膝關節的速度。

WANN架構不止能在不訓練單個權重的情況下完成任務,而且只用了210個網絡連接(Connections) ,比當前State-of-the-Art模型用到的2804個連接,少了一個數量級。

做完強化學習,團隊又瞄準了MNIST,把WANN拓展到了監督學習的分類任務上。

一個普通的網絡,在參數隨機初始化的情況下,MNIST上面的準確率可能只有10%左右。

而新方法搜索到的網絡架構WANN,用隨機權重去跑,準確率已經超過了80%

如果像剛剛提到的那樣,喂給它多個權值的合集,準確率就達到了91.6%

對比一下,經過微調的權重,帶來的準確率是91.9%,訓練過的權重,可以帶來94.2%的準確率。

再對比一下,擁有幾千個權重的線性分類器:

也只是和WANN完全沒訓練、沒微調、僅僅喂食了一些隨機權重時的準確率相當。

論文里強調,MINST手寫數字分類是高維分類任務。WANN表現得非常出色。

并且沒有哪個權值,顯得比其他值更優秀,大家表現得十分均衡:所以隨機權重是可行的

不過,每個不同的權重形成的不同網絡,有各自擅長分辨的數字,所以可以把一個擁有多個權值的WANN,用作一個自給自足的合集 (Self-Contained Ensemble) 。

實現原理

不訓練權重參數獲得極高準確度,WANN是如何做到的呢?

神經網絡不僅有權重偏置這些參數,網絡的拓撲結構、激活函數的選擇都會影響最終結果。

谷歌大腦的研究人員在論文開頭就提出質疑:神經網絡的權重參數與其架構相比有多重要?在沒有學習任何權重參數的情況下,神經網絡架構可以在多大程度上影響給定任務的解決方案。

為此,研究人員提出了一種神經網絡架構的搜索方法,無需訓練權重找到執行強化學習任務的最小神經網絡架構。

谷歌研究人員還把這種方法用在監督學習領域,僅使用隨機權重,就能在MNIST上實現就比隨機猜測高得多的準確率。

論文從架構搜索、貝葉斯神經網絡、算法信息論、網絡剪枝、神經科學這些理論中獲得啟發。

為了生成WANN,必須將權重對網絡的影響最小化,用權重隨機采樣可以保證最終的網絡是架構優化的產物,但是在高維空間進行權重隨機采樣的難度太大。

研究人員采取了“簡單粗暴”的方法,對所有權重強制進行權重共享(weight-sharing),讓權重值的數量減少到一個。這種高效的近似可以推動對更好架構的搜索。

操作步驟

解決了權重初始化的問題,接下來的問題就是如何收搜索權重不可知神經網絡。它分為四個步驟:

1、創建初始的最小神經網絡拓撲群。

2、通過多個rollout評估每個網絡,并對每個rollout分配不同的共享權重值。

3、根據性能和復雜程度對網絡進行排序。

4、根據排名最高的網絡拓撲來創建新的群,通過競爭結果進行概率性的選擇。

然后,算法從第2步開始重復,在連續迭代中,產生復雜度逐漸增加的權重不可知拓撲(weight agnostic topologies )。

拓撲搜索

用于搜索神經網絡拓撲的操作受到神經進化算法(NEAT)的啟發。在NEAT中,拓撲和權重值同時優化,研究人員忽略權重,只進行拓撲搜索操作。

上圖展示了網絡拓撲空間搜索的具體操作:

一開始網絡上是最左側的最小拓撲結構,僅有部分輸入和輸出是相連的。

然后,網絡按以下三種方式進行更改:

1、插入節點:拆分現有連接插入新節點。

2、添加連接:連接兩個之前未連接的節點,添加新連接。

3、更改激活函數:重新分配隱藏節點的激活函數。

圖的最右側展示了權重在[2,2]取值范圍內可能的激活函數,如線性函數、階躍函數、正弦余弦函數、ReLU等等。

權重依然重要

WANN與傳統的固定拓撲網絡相比,可以使用單個的隨機共享權重也能獲得更好的結果。

雖然WANN在多項任務中取得了最佳結果,但WANN并不完全獨立于權重值,當隨機分配單個權重值時,有時也會失敗。

WANN通過編碼輸入和輸出之間的關系起作用,雖然權重的大小的重要性并不高,但它們的一致性,尤其是符號的一致性才是關鍵。

隨機共享權重的另一個好處是,調整單個參數的影響變得不重要,無需使用基于梯度的方法。

強化學習任務中的結果讓作者考慮推廣WANN方法的應用范圍。他們又測試了WANN在圖像分類基礎任務MNIST上的表現,結果在權重接近0時效果不佳。

有Reddit網友質疑WANN的結果,對于隨機權重接近于0的情況,該網絡的性能并不好,先強化學習實驗中的具體表現就是,小車會跑出限定范圍。

對此,作者給出解釋,在權重趨于0的情況下,網絡的輸出也會趨于0,所以后期的優化很難達到較好的性能。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6164

    瀏覽量

    105312
  • 機器學習
    +關注

    關注

    66

    文章

    8408

    瀏覽量

    132573

原文標題:谷歌發布顛覆性研究:不訓練不調參,AI自動構建超強網絡,告別煉丹一大步

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    依托Chiplet&高性能RDMA,奇異摩爾斬獲全國顛覆性技術創新大賽(未來制造領域賽)優勝獎

    ? ? 近日,第十三屆中國創新創業大賽顛覆性技術創新大賽(未來制造領域賽)獲獎結果出爐,奇異摩爾參賽項目【基于Chiplet+RDMA技術的下一代萬卡AI集群的全棧式互聯解決方案】榮獲優勝獎
    的頭像 發表于 12-19 09:39 ?252次閱讀
    依托Chiplet&amp;高性能RDMA,奇異摩爾斬獲全國<b class='flag-5'>顛覆性</b>技術創新大賽(未來制造領域賽)優勝獎

    Tata Communications即將推出Kaleyra AI:顛覆性人工智能驅動客戶互動

    面向未來的人工智能驅動旗艦產品組合——Kaleyra AI,旨在重新定義客戶互動的全新體驗。 這款顛覆性產品組合將首度推出三項獨具特色的功能,突破傳統通信工具的界限,開創全新互動體驗。 這款產品套件旨在與各類通信渠道及實時代理界面無縫對接,借助生成式人工智能(GenAI)營造簡潔流暢、個性化且極具
    的頭像 發表于 12-15 09:30 ?153次閱讀

    夢之墨榮獲全國顛覆性技術創新大賽優秀項目

    近日,第十三屆中國創新創業大賽顛覆性技術創新大賽(以下簡稱“大賽”)總決賽在杭州市余杭區圓滿結束。大賽聚焦技術革新,旨在引領未來產業的發展方向,促進科技創新成果的轉化,加速新質生產力的成長,是全國的重大賽事。
    的頭像 發表于 12-02 11:40 ?309次閱讀
    夢之墨榮獲全國<b class='flag-5'>顛覆性</b>技術創新大賽優秀項目

    三相200V轉380V帶零線顛覆性技術:出口日本變壓器引領行業潮流

    ? 三相200V轉380V帶零線顛覆性技術:出口日本變壓器引領行業潮流 ? 在全球電氣設備貿易的版圖中,日本市場以其獨特的電力標準和嚴格的技術要求著稱。面對這一挑戰,中國電力設備制造商不斷創新,推出
    的頭像 發表于 11-20 15:10 ?164次閱讀
    三相200V轉380V帶零線<b class='flag-5'>顛覆性</b>技術:出口日本變壓器引領行業潮流

    LSTM神經網絡的調技巧

    長短時記憶網絡(Long Short-Term Memory, LSTM)是一種特殊的循環神經網絡(RNN),它能夠學習長期依賴信息。在實際應用中,LSTM網絡的調是一個復雜且關鍵的過程,直接影響
    的頭像 發表于 11-13 10:01 ?528次閱讀

    魯棒機器學習中的重要

    機器學習領域,模型的魯棒是指模型在面對輸入數據的擾動、異常值、噪聲或對抗性攻擊時,仍能保持性能的能力。隨著人工智能技術的快速發展,機器學習
    的頭像 發表于 11-11 10:19 ?327次閱讀

    深視智能編《2024智能檢測裝備產業發展研究報告:機器視覺篇》

    為全面了解機器視覺檢測裝備產業發展情況,中國電子技術標準化研究院聯合業內龍頭企業、科研院所和產業聯盟等(編單位名單見附件),共同編制了《智能檢測裝備產業發展研究報告:
    的頭像 發表于 08-05 08:38 ?295次閱讀
    深視智能<b class='flag-5'>參</b>編《2024智能檢測裝備產業發展<b class='flag-5'>研究</b>報告:<b class='flag-5'>機器</b>視覺篇》

    谷歌發布革命AI天氣預測模型NeuralGCM

    在科技與自然科學的交匯點上,谷歌公司于7月23日宣布了一項重大突破——全新的人工智能天氣預測模型NeuralGCM。這一創新成果不僅融合了機器學習的前沿技術,還巧妙結合了傳統氣象學的精髓,其
    的頭像 發表于 07-23 14:24 ?489次閱讀

    【RISC-V信息速遞】反X86和ARM壟斷?很多人低估了RISC-V的顛覆性

    原文標題:【RISC-V信息速遞】反X86和ARM壟斷?很多人低估了RISC-V的顛覆性文章出處:【微信公眾號:RISCV國際人才培養認證中心】歡迎添加關注!文章轉載請注明出處。
    的頭像 發表于 06-08 08:36 ?223次閱讀
    【RISC-V信息速遞】反X86和ARM壟斷?很多人低估了RISC-V的<b class='flag-5'>顛覆性</b>

    手把手教學!HLK-LD2410B/C新手必看攻略!測試教程、模塊調一文詳解~

    HLK-LD2410B/C接線教程、參數解析、APP調教程、上位機調教程、常見異常情況自檢等等內容,一文匯總。 不管是萌新小白還是資深玩家,都可以快速入門。
    的頭像 發表于 05-31 14:48 ?5003次閱讀
    手把手教學!HLK-LD2410B/C新手必看攻略!測試教程、模塊<b class='flag-5'>調</b><b class='flag-5'>參</b>一文詳解~

    機器學習8大調技巧

    今天給大家一篇關于機器學習調技巧的文章。超參數調優是機器
    的頭像 發表于 03-23 08:26 ?612次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>8大<b class='flag-5'>調</b><b class='flag-5'>參</b>技巧

    華為顛覆性磁電硬盤省電90%!功耗不到2000W 省電多達90%

    有外媒報道稱,華為已經研發了一種顛覆性的磁電硬盤,將用于其下一代OceanStor Arctic存儲系統,相比傳統機械硬盤、磁帶存儲可大大降低成本和功耗。
    的頭像 發表于 03-08 15:13 ?2225次閱讀
    華為<b class='flag-5'>顛覆性</b>磁電硬盤省電90%!功耗不到2000W 省電多達90%

    谷歌模型框架是什么軟件?谷歌模型框架怎么用?

    谷歌模型框架通常指的是谷歌開發的用于機器學習和人工智能的軟件框架,其中最著名的是TensorFlow。TensorFlow是一個開源的機器
    的頭像 發表于 03-01 16:25 ?870次閱讀

    谷歌交互世界模型重磅發布

    谷歌模型
    北京中科同志科技股份有限公司
    發布于 :2024年02月28日 09:13:06

    字節跳動推出一款顛覆性視頻模型—Boximator

    在 Sora 引爆文生視頻賽道之前,國內的字節跳動也推出了一款顛覆性視頻模型——Boximator。
    的頭像 發表于 02-20 13:44 ?1102次閱讀
    字節跳動推出一款<b class='flag-5'>顛覆性</b>視頻模型—Boximator
    主站蜘蛛池模板: 欧美性喷潮xxxx| 在线观看成人免费| 憋尿调教绝望之岛| 久久国产精品萌白酱免费| 神马影院在线eecss伦理片| 91嫩草国产在线观看免费| 国产在线自天天人人| 色爱区综合激情五月综合激情| 在线看片亚洲| 国产专区亚洲欧美另类在线| 乳女教师欲乱动漫无修版动画| 757一本到午夜宫| 九九在线免费视频| 亚洲 欧美 国产 伦 综合| 成视频高清| 青青草国产精品| 96.8在线收听| 久久精品亚洲视频| 小莹的性荡生活40章| 草莓视频在线播放视频| 免费精品一区二区三区AA片| 在线播放午夜理论片| 好爽别插了无码视频| 无套暴躁白丝秘书| 国产3级在线观看| 日本视频中文字幕一区二区| 99热.com| 美女穿丝袜被狂躁动态图| 伊人久久天堂| 精品国产精品人妻久久无码五月天| 午夜伦理:伦理片| 国产成A人片在线观看| 色狐直播免费观看| 成年人在线视频免费观看| 欧美性爱-第1页| A国产一区二区免费入口| 男女牲交全过程免费播放| 18禁止看的免费污网站| 久久视频这里只精品99re8久| 夜月视频直播免费观看| 精品国产影院|