色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

什么是深度學習中優化算法

jf_78858299 ? 來源:人工智能大講堂 ? 作者:人工智能大講堂 ? 2023-02-13 15:31 ? 次閱讀

先大致講一下什么是深度學習中優化算法吧,我們可以把模型比作函數,一種很復雜的函數:h(f(g(k(x)))),函數有參數,這些參數是未知的,深度學習中的“學習”就是通過訓練數據求解這些未知的參數。

由于這個函數太復雜了,沒辦法進行直接求解,所以只能換個思路:衡量模型的輸出與真實標簽之間的差距,如果差距過大,則調整模型參數,然后重新計算差距,如此反復迭代,直至差距在接受范圍內。

深度學習中通過目標函數或者損失函數衡量當前參數的好壞,而調整模型參數的就是優化算法。

所謂優化, 就是利用關于最優解的信息,不斷逼近最優解, 目前深度學習中最常用的是梯度下降法, 梯度方向就是最優解的信息,因為梯度方向指向最優解方向, 沿著梯度方向前進即可靠近最優解。

到這里,你是不是覺得優化算法很簡單?其實,不然。讓我們進一步分析。

難點一:梯度(困難指數兩顆星)

所謂梯度下降法,當然要計算梯度,前面那個復合函數再加上損失函數,最終要優化的函數是這個樣子:L(h(f(g(k(x)))),y),L是損失函數,y是標簽值。

復合函數通過鏈式法則進行求導,例如f(g(x)),

圖片

圖片

這就要求g(x)和f(x)都得可導,對于神經網絡而言,卷積層和全連接層都可以看作是矩陣與向量乘法,是可導的,剩下的就是激活函數和損失函數,好在目前常用的MSE,交叉熵損失函數,Sigmoid,Relu激活函數都是可導的。

所以,梯度的問題不大。

難點二:凸優化和非凸優化( 困難指數五顆星

深度學習由于多個隱藏層的疊加所形成的復合函數,外加損失函數,最終的函數往往不是凸函數。

所謂凸函數,就是只有全局最優解,通過梯度下降最終都能找到這個最優解,對于機器學習中的線性回歸的損失函數:最小二乘而言,它是一個凸函數,也就是說能找到使損失函數達到最小值的全局最優解。

在非凸函數中,存在大量的局部最優解,局部極值隨著特征維度的增加呈指數增長,優化算法很大概率找不到全局最優解,這也是優化算法最苦惱的地方。

如果只有局部最優解,那情況還不算最糟糕,畢竟局部最優解意味著從所有維度看都是最小值或者最大值,更糟糕的是鞍點,這種情況雖然一階導數都為零,但二階導數不同向,也就是說從某些維度看是極小值,而從某些維度看卻是極大值。

而且,不幸的是,隨著特征向量維度的增加,鞍點的數量也是隨著指數級增加的。

那如何逃離鞍點?

這里再次注意:這里我們所說的梯度下降指的是:使用全部樣本的損失的平均值來更新參數,這就意味著梯度的精度非常高,會精確地逼近鞍點,但我們不希望這樣,我們希望能夠跳出鞍點,幸好,隨機梯度下降SGD或者其變體(比如Momentun、Adam、mini-batch)的出現很大程度上解決了該問題。

例如,mini-batch是指每次參數更新只是用一小批樣本,這是一種有噪聲的梯度估計,哪怕我們位于梯度為0的點,也經常在某個mini-batch下的估計把它估計偏了,導致往前或者往后挪了一步摔下馬鞍,也就是mini-batch的梯度下降法使得模型很容易逃離特征空間中的鞍點。

既然,局部極值點也可接受,且又能有方法逃離鞍點,到這里你覺得問題就結束了嗎?還沒有,其實,神經網絡中最讓人望而生畏的不是局部最優點和鞍點,而是平坦地區,這些地區一經進入很難逃離。

圖片

總結來說,人們認為的深度神經網絡“容易收斂到局部最優”,很可能是一種想象,實際情況是,我們可能從來沒有找到過“局部最優”,更別說全局最優了。

所以,與其擔憂陷入局部最優點怎么跳出來,更不如去考慮數據集要怎么做才能讓網絡更好學習,以及網絡該怎么設計才能更好的捕獲pattern,網絡該怎么訓練才能學到我們想讓它學習的知識。

最后,也要為優化算法鳴個不平。其實這并不是優化算法的問題。是損失函數和網絡結構的錯,是他們的復雜性導致優化問題是一個非凸優化問題,優化算是是來解決問題的,而不是制造問題。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 優化算法
    +關注

    關注

    0

    文章

    35

    瀏覽量

    9821
  • 函數
    +關注

    關注

    3

    文章

    4365

    瀏覽量

    63936
  • 深度學習
    +關注

    關注

    73

    文章

    5549

    瀏覽量

    122353
收藏 0人收藏
  • jf_657732991

評論

相關推薦
熱點推薦

目前主流的深度學習算法模型和應用案例

深度學習在科學計算獲得了廣泛的普及,其算法被廣泛用于解決復雜問題的行業。所有深度學習
的頭像 發表于 01-03 10:28 ?2660次閱讀
目前主流的<b class='flag-5'>深度</b><b class='flag-5'>學習</b><b class='flag-5'>算法</b>模型和應用案例

深度學習多種優化算法

深度學習,有很多種優化算法,這些算法需要在極高維度(通常參數有數百萬個以上)也即數百萬維的空
的頭像 發表于 08-28 09:52 ?2740次閱讀
<b class='flag-5'>深度</b><b class='flag-5'>學習</b><b class='flag-5'>中</b>多種<b class='flag-5'>優化</b><b class='flag-5'>算法</b>

深度模型優化學習課件下載

深度模型優化學習課件下載
發表于 04-07 16:21 ?3次下載
<b class='flag-5'>深度</b>模型<b class='flag-5'>中</b>的<b class='flag-5'>優化</b>與<b class='flag-5'>學習</b>課件下載

深度學習算法進行優化的處理器——NPU

NPU(Neural-network Processing Unit,嵌入式神經網絡處理器)是針對深度學習*算法進行優化的處理器。它能像人類神經網絡一樣快速、高效地處理大量數據,因此它
發表于 10-17 10:53 ?2747次閱讀

PyTorch教程-12.1. 優化深度學習

12.1. 優化深度學習? Colab [火炬]在 Colab 打開筆記本 Colab [mxnet] Open the notebook in Colab Colab
的頭像 發表于 06-05 15:44 ?725次閱讀
PyTorch教程-12.1. <b class='flag-5'>優化</b>和<b class='flag-5'>深度</b><b class='flag-5'>學習</b>

從淺層到深層神經網絡:概覽深度學習優化算法

優化算法一直以來是機器學習能根據數據學到知識的核心技術。而好的優化算法可以大大提高學習速度,加快
的頭像 發表于 06-15 11:20 ?918次閱讀
從淺層到深層神經網絡:概覽<b class='flag-5'>深度</b><b class='flag-5'>學習</b><b class='flag-5'>優化</b><b class='flag-5'>算法</b>

深度學習算法簡介 深度學習算法是什么 深度學習算法有哪些

深度學習算法簡介 深度學習算法是什么?深度
的頭像 發表于 08-17 16:02 ?9590次閱讀

深度學習算法工程師是做什么

深度學習算法工程師是做什么 深度學習算法工程師是一種高級技術人才,是數據科學
的頭像 發表于 08-17 16:03 ?1558次閱讀

什么是深度學習算法深度學習算法的應用

。 在深度學習,使用了一些快速的算法,比如卷積神經網絡以及深度神經網絡,這些算法在大量數據處理
的頭像 發表于 08-17 16:03 ?2472次閱讀

深度學習算法的選擇建議

深度學習算法的選擇建議 隨著深度學習技術的普及,越來越多的開發者將它應用于各種領域,包括圖像識別、自然語言處理、聲音識別等等。對于剛開始
的頭像 發表于 08-17 16:11 ?903次閱讀

深度學習算法庫框架學習

深度學習算法庫框架學習 深度學習是一種非常強大的機器學習
的頭像 發表于 08-17 16:11 ?901次閱讀

深度學習框架和深度學習算法教程

基于神經網絡的機器學習方法。 深度學習算法可以分為兩大類:監督學習和無監督學習。監督
的頭像 發表于 08-17 16:11 ?1308次閱讀

深度學習編譯工具鏈的核心——圖優化

等,需要調整優化網絡中使用的算子或算子組合,這就是深度學習編譯工具鏈的核心——圖優化。圖優化
的頭像 發表于 05-16 14:24 ?1465次閱讀
<b class='flag-5'>深度</b><b class='flag-5'>學習</b>編譯工具鏈<b class='flag-5'>中</b>的核心——圖<b class='flag-5'>優化</b>

深度學習算法在嵌入式平臺上的部署

隨著人工智能技術的飛速發展,深度學習算法在各個領域的應用日益廣泛。然而,將深度學習算法部署到資源
的頭像 發表于 07-15 10:03 ?2521次閱讀

NPU在深度學習的應用

設計的硬件加速器,它在深度學習的應用日益廣泛。 1. NPU的基本概念 NPU是一種專門針對深度學習
的頭像 發表于 11-14 15:17 ?1579次閱讀
主站蜘蛛池模板: 久久亚洲精品成人 | 香蕉59tv视频| 午夜免费国产体验区免费的 | 狠狠狠的在啪线香蕉 | 国产亚洲美女在线视频视频 | 国产SUV精品一区二区69 | 三级网址在线播放 | 快乐激情网 | 99久酒店在线精品2019 | 理论片午午伦夜理片久久 | 成人在线免费 | 男人扒开添女人下部口述 | 两个女人互添下身高潮自视频 | 香蕉 在线播放 | 芒果影院网站在线观看 | 国产老师开裆丝袜喷水漫画 | 国产精品伦理一二三区伦理 | 国产真实强被迫伦姧女在线观看 | WINDOWSCHANNEL老太 | 无限资源在线看影院免费观看 | 俄罗斯14一18处交 | 被吊起玩弄的女性奴 | 久久精品黄色 | 久久伊人男人的天堂网站 | 在线 日韩 欧美 国产 社区 | 网红刘婷hd国产高清 | 欲乱艳荡少寡妇全文免费 | 暖暖视频在线观看高清... | 精选国产AV精选一区二区三区 | 高hbl双性浪荡古代 高h 大尺度纯肉 np快穿 | 99久久99久久久精品齐齐鬼色 | 日本 稀土矿| 亚洲第一页在线播放 | 精品一区二区三区色花堂 | younv 学生国产在线视频 | 午夜熟女插插XX免费视频 | 久久99re7在线视频精品 | 亚洲欧美综合乱码精品成人网 | 和尚扒开双腿蹂躏 | 在线亚洲中文字幕36页 | 在线自拍亚洲视频欧美 |

電子發燒友

中國電子工程師最喜歡的網站

  • 2931785位工程師會員交流學習
  • 獲取您個性化的科技前沿技術信息
  • 參加活動獲取豐厚的禮品