機(jī)器學(xué)習(xí)中梯度下降法的過程

最優(yōu)化問題是機(jī)器學(xué)習(xí)算法中非常重要的一部分，幾乎每一個機(jī)器學(xué)習(xí)算法的核心都是在處理最優(yōu)化問題。

本文中我將介紹一些機(jī)器學(xué)習(xí)領(lǐng)域中常用的且非常掌握的最優(yōu)化算法，看完本篇文章后你將會明白：

? 什么是梯度下降法？

? 如何將梯度下降法運(yùn)用到線性回歸模型中？

? 如何利用梯度下降法處理大規(guī)模的數(shù)據(jù)？

? 梯度下降法的一些技巧

讓我們開始吧！

梯度下降法

梯度下降法是一個用于尋找最小化成本函數(shù)的參數(shù)值的最優(yōu)化算法。當(dāng)我們無法通過分析計算（比如線性代數(shù)運(yùn)算）求得函數(shù)的最優(yōu)解時，我們可以利用梯度下降法來求解該問題。

梯度下降法的直覺體驗

想象一個你經(jīng)常用來吃谷物或儲存受過的大碗，成本函數(shù)的形狀類似于這個碗的造型。

碗表面上的任一隨機(jī)位置表示當(dāng)前系數(shù)對應(yīng)的成本值，碗的底部則表示最優(yōu)解集對應(yīng)的成本函數(shù)值。梯度下降法的目標(biāo)就是不斷地嘗試不同的系數(shù)值，然后評估成本函數(shù)并選擇能夠降低成本函數(shù)的參數(shù)值。重復(fù)迭代計算上述步驟直到收斂，我們就能獲得最小成本函數(shù)值對應(yīng)的最優(yōu)解。

梯度下降法的過程

梯度下降法首先需要設(shè)定一個初始參數(shù)值，通常情況下我們將初值設(shè)為零（coefficient=0coefficient=0），接下來需要計算成本函數(shù) cost=f（coefficient）cost=f（coefficient）或者cost=evaluate（f（coefficient））cost=evaluate（f（coefficient））。然后我們需要計算函數(shù)的導(dǎo)數(shù)（導(dǎo)數(shù)是微積分的一個概念，它是指函數(shù)中某個點(diǎn)處的斜率值），并設(shè)定學(xué)習(xí)效率參數(shù)（alpha）的值。

coefficient=coefficient?（alpha?delta）

重復(fù)執(zhí)行上述過程，直到參數(shù)值收斂，這樣我們就能獲得函數(shù)的最優(yōu)解。

你可以看出梯度下降法的思路多么簡單，你只需知道成本函數(shù)的梯度值或者需要優(yōu)化的函數(shù)情況即可。接下來我將介紹如何將梯度下降法運(yùn)用到機(jī)器學(xué)習(xí)領(lǐng)域中。

批量梯度下降法

所有的有監(jiān)督機(jī)器學(xué)習(xí)算法的目標(biāo)都是利用已知的自變量（X）數(shù)據(jù)來預(yù)測因變量（Y）的值。所有的分類和回歸模型都是在處理這個問題。

機(jī)器學(xué)習(xí)算法會利用某個統(tǒng)計量來刻畫目標(biāo)函數(shù)的擬合情況。雖然不同的算法擁有不同的目標(biāo)函數(shù)表示方法和不同的系數(shù)值，但是它們擁有一個共同的目標(biāo)——即通過最優(yōu)化目標(biāo)函數(shù)來獲取最佳參數(shù)值。

線性回歸模型和邏輯斯蒂回歸模型是利用梯度下降法來尋找最佳參數(shù)值的經(jīng)典案例。

我們可以利用多種衡量方法來評估機(jī)器學(xué)習(xí)模型對目標(biāo)函數(shù)的擬合情況。成本函數(shù)法是通過計算每個訓(xùn)練集的預(yù)測值和真實(shí)值之間的差異程度（比如殘差平方和）來度量模型的擬合情況。

我們可以計算成本函數(shù)中每個參數(shù)所對應(yīng)的導(dǎo)數(shù)值，然后通過上述的更新方程進(jìn)行迭代計算。

在梯度下降法的每一步迭代計算后，我們都需要計算成本函數(shù)及其導(dǎo)數(shù)的情況。每一次的迭代計算過程就被稱為一批次，因此這個形式的梯度下降法也被稱為批量梯度下降法。

批量梯度下降法是機(jī)器學(xué)習(xí)領(lǐng)域中常見的一種梯度下降方法。

隨機(jī)梯度下降法

處理大規(guī)模的數(shù)據(jù)時，梯度下降法的運(yùn)算效率非常低。因為梯度下降法在每次迭代過程中都需要計算訓(xùn)練集的預(yù)測情況，所以當(dāng)數(shù)據(jù)量非常大時需要耗費(fèi)較長的時間。當(dāng)你處理大規(guī)模的數(shù)據(jù)時，你可以利用隨機(jī)梯度下降法來提高計算效率。該算法與上述梯度下降法的不同之處在于它對每個隨機(jī)訓(xùn)練樣本都執(zhí)行系數(shù)更新過程，而不是在每批樣本運(yùn)算完后才執(zhí)行系數(shù)更新過程。

隨機(jī)梯度下降法的第一個步驟要求訓(xùn)練集的樣本是隨機(jī)排序的，這是為了打亂系數(shù)的更新過程。因為我們將在每次訓(xùn)練實(shí)例結(jié)束后更新系數(shù)值，所以系數(shù)值和成本函數(shù)值將會出現(xiàn)隨機(jī)跳躍的情況。通過打亂系數(shù)更新過程的順序，我們可以利用這個隨機(jī)游走的性質(zhì)來避免模型不收斂的問題。

除了成本函數(shù)的計算方式不一致外，隨機(jī)梯度下降法的系數(shù)更新過程和上述的梯度下降法一模一樣。對于大規(guī)模數(shù)據(jù)來說，隨機(jī)梯度下降法的收斂速度明顯高于其他算法，通常情況下你只需要一個小的迭代次數(shù)就能得到一個相對較優(yōu)的擬合參數(shù)。

梯度下降法的一些建議

本節(jié)列出了幾個可以幫助你更好地掌握機(jī)器學(xué)習(xí)中梯度下降算法的技巧：

? 繪制成本函數(shù)隨時間變化的曲線：收集并繪制每次迭代過程中所得到的成本函數(shù)值。對于梯度下降法來說，每次迭代計算都能降低成本函數(shù)值。如果無法降低成本函數(shù)值，那么可以嘗試減少學(xué)習(xí)效率值。

? 學(xué)習(xí)效率：梯度下降算法中的學(xué)習(xí)效率值通常為0.1，0.001或者0.0001。你可以嘗試不同的值然后選出最佳學(xué)習(xí)效率值。

? 標(biāo)準(zhǔn)化處理：如果成本函數(shù)不是偏態(tài)形式的話，那么梯度下降法很快就能收斂。隱蔽你可以事先對輸入變量進(jìn)行標(biāo)準(zhǔn)化處理。

? 繪制成本均值趨勢圖：隨機(jī)梯度下降法的更新過程通常會帶來一些隨機(jī)噪聲，所以我們可以考慮觀察10次、100次或1000次更新過程誤差均值變化情況來度量算法的收斂趨勢。

總結(jié)

本文主要介紹了機(jī)器學(xué)習(xí)中的梯度下降法，通過閱讀本文，你了解到：

? 最優(yōu)化理論是機(jī)器學(xué)習(xí)中非常重要的一部分。

? 梯度下降法是一個簡單的最優(yōu)化算法，你可以將它運(yùn)用到許多機(jī)器學(xué)習(xí)算法中。

? 批量梯度下降法先計算所有參數(shù)的導(dǎo)數(shù)值，然后再執(zhí)行參數(shù)更新過程。

? 隨機(jī)梯度下降法是指從每個訓(xùn)練實(shí)例中計算出導(dǎo)數(shù)并執(zhí)行參數(shù)更新過程。

閱讀全文

機(jī)器學(xué)習(xí)(130423) 機(jī)器學(xué)習(xí)(130423)

探討機(jī)器學(xué)習(xí)與深度學(xué)習(xí)基本概念與運(yùn)算過程

人工智慧隸屬于大範(fàn)疇，包含了機(jī)器學(xué)習(xí)（Machine Learning）與深度學(xué)習(xí)（Deep Learning）。如下圖所示，我們最興趣的深度學(xué)習(xí)則是規(guī)範(fàn)于機(jī)器學(xué)習(xí)之中的一項分支，而以下段落將簡單介紹機(jī)器學(xué)習(xí)與深度學(xué)習(xí)的差異。

2020-12-18 15:45:31

3870

25個機(jī)器學(xué)習(xí)面試題，你都會嗎？

`機(jī)器學(xué)習(xí)有非常多令人困惑及不解的地方，很多問題都沒有明確的答案。但在面試中，如何探查到面試官想要提問的知識點(diǎn)就顯得非常重要了。在本文中，作者給出了 25 個非常有意思的機(jī)器學(xué)習(xí)面試問題，這些

2018-09-29 09:39:54

學(xué)習(xí)單片機(jī)過程中對編譯原理的學(xué)習(xí)理解精選資料推薦

學(xué)習(xí)單片機(jī)過程中對編譯原理的學(xué)習(xí)理解編譯原理的理解幾個問題編譯原理的理解1.預(yù)處理這個階段預(yù)處理器將按照預(yù)處理命令進(jìn)行宏展開，其中,頭文件例如 Stm32f10x.h 中的內(nèi)容將會被完全替換到包含

2021-07-14 08:12:09

機(jī)器學(xué)習(xí)新手必學(xué)的三種優(yōu)化算法（牛頓法、梯度下降法、最速下降法）

法、梯度下降法、最速下降法）進(jìn)行了介紹和比較，并結(jié)合算法的數(shù)學(xué)原理和實(shí)際案例給出了優(yōu)化算法選擇的一些建議。閱讀本文的基礎(chǔ)準(zhǔn)備線性代數(shù)多變量微積分對凸函數(shù)的基本知識我們都知道，機(jī)器學(xué)習(xí)中最重要的內(nèi)容之一

2019-05-07 08:30:00

機(jī)器學(xué)習(xí)的創(chuàng)新/開發(fā)和應(yīng)用能力

機(jī)器學(xué)習(xí)的未來在工業(yè)領(lǐng)域采用機(jī)器學(xué)習(xí)機(jī)器學(xué)習(xí)和大數(shù)據(jù)工業(yè)人工智能生態(tài)系統(tǒng)

2020-12-16 07:47:35

機(jī)器學(xué)習(xí)的未來

機(jī)器學(xué)習(xí)的未來在工業(yè)領(lǐng)域采用機(jī)器學(xué)習(xí)機(jī)器學(xué)習(xí)和大數(shù)據(jù)

2021-01-27 06:02:18

梯度下降法姿態(tài)解算

由陀螺儀數(shù)據(jù)+加速度計數(shù)據(jù) 或者陀螺儀數(shù)據(jù)+加速度計數(shù)據(jù)+電子羅盤數(shù)據(jù) 得到姿態(tài)數(shù)據(jù)。

2014-04-07 19:11:09

梯度更新算法的選擇

深度學(xué)習(xí)入門（四）梯度更新算法的選擇(附執(zhí)行代碼)

2020-06-09 11:02:14

AI工程師 10 個深度學(xué)習(xí)方法

梯度下降的一個直觀理解就是想象一條源自山頂?shù)暮恿鳌＿@條河流會沿著山勢的方向流向山麓的最低點(diǎn)，而這也正是梯度下降法的目標(biāo)。我們所期望的最理想的情況就是河流在到達(dá)最終目的地（最低點(diǎn)）之前不會停下。在機(jī)器學(xué)習(xí)

2019-03-07 20:17:28

TensorFlow優(yōu)化器種類及其用法詳解

。隨機(jī)梯度下降：在隨機(jī)梯度下降中，一次提供一個訓(xùn)練樣本用于更新權(quán)重和偏置，從而使損失函數(shù)的梯度減小，然后再轉(zhuǎn)向下一個訓(xùn)練樣本。整個過程重復(fù)了若干個循環(huán)。由于每次更新一次，所以它比 Vanilla 快

2020-07-28 14:39:34

keras內(nèi)置的7個常用的優(yōu)化器介紹

，隨機(jī)梯度下降，小批量梯度下降法。它們的學(xué)習(xí)率是固定的。 1.1 基礎(chǔ)梯度下降算法顧名思義，梯度下降法的計算過程就是沿梯度下降的方向求解極小值（使得損失函數(shù)最小，也即準(zhǔn)確率最高）。假設(shè)

2023-08-18 06:32:13

labview中如何進(jìn)行圖像的梯度化

labview中如何進(jìn)行圖像的梯度化請大神指點(diǎn)迷津{:4_107:}

2013-12-17 18:51:34

什么是機(jī)器學(xué)習(xí)? 機(jī)器學(xué)習(xí)基礎(chǔ)入門

模型這組讀數(shù)是否與一臺空閑的、正在運(yùn)行的或壞掉的機(jī)器相對應(yīng)。在這個過程中 TinyML 是如此重要，如此開創(chuàng)性。那么 TinyML 適合哪里呢？如果還不清楚的話，機(jī)器學(xué)習(xí)是一個數(shù)據(jù)密集型的過程。當(dāng)您

2022-06-21 11:06:37

從梯度下降法、牛頓法到擬牛頓法它們的聯(lián)系與區(qū)別是什么

從梯度下降法、牛頓法到擬牛頓法，淺談它們的聯(lián)系與區(qū)別

2020-05-21 11:06:52

分享一個自己寫的機(jī)器學(xué)習(xí)線性回歸梯度下降算法

單變量線性回歸算法，利用Batch梯度梯度下降算法迭代計算得到誤差最小的代價函數(shù)theta0,theta1。調(diào)節(jié)學(xué)習(xí)率a可以觀察擬合得到的函數(shù)和代價函數(shù)誤差收斂情況。

2018-10-02 21:48:58

回歸預(yù)測之入門

的方法，在stanford機(jī)器學(xué)習(xí)開放課最后的部分會推導(dǎo)最小二乘法的公式的來源，這個來很多的機(jī)器學(xué)習(xí)和數(shù)學(xué)書上都可以找到，這里就不提最小二乘法，而談?wù)?b class="flag-6" style="color: red">梯度下降法。梯度下降法是按下面的流程進(jìn)行的： 1

2018-10-15 10:19:03

圖像識別究竟是如何做到識別出不同的物體的

上一回為大家介紹了人工智能的基本概念和算法，講到了梯度下降法、神經(jīng)網(wǎng)絡(luò)、機(jī)器學(xué)習(xí)的基本概念，還沒看過的小伙伴可以點(diǎn)擊這里。人工智能有一個重要領(lǐng)域就是圖像識別。比如：有許多軟件可以通過拍照的方法識別

2021-08-31 08:35:35

如何學(xué)習(xí)機(jī)器學(xué)習(xí)

【吳恩達(dá)機(jī)器學(xué)習(xí)】學(xué)習(xí)筆記13（Normal Equation& 與梯度下降比較）

2020-04-26 11:05:59

如何更新權(quán)重實(shí)現(xiàn)梯度下降

實(shí)現(xiàn)梯度下降

2019-07-15 10:09:11

接地電阻測試儀怎么使用電位下降法

疊時，就可以測量電阻。在這種情況下，電阻區(qū)域外的所有體積都非常接近相同的電位，這樣就可以開發(fā)以下測量方法。　　接地電阻測試儀怎么使用電位下降法　　為了可以避免電極H的接地電阻引入誤差，使用了第三電極S。在

2021-12-03 17:11:56

最值得學(xué)習(xí)的機(jī)器學(xué)習(xí)編程語言

如果你對人工智能和機(jī)器學(xué)習(xí)感興趣，而且正在積極地規(guī)劃著自己的程序員職業(yè)生涯，那么你肯定面臨著一個問題：你應(yīng)該學(xué)習(xí)哪些編程語言，才能真正了解并掌握 AI 和機(jī)器學(xué)習(xí)？可供選擇的語言很多，你需要通過戰(zhàn)略

2021-03-02 06:22:38

深度學(xué)習(xí)技術(shù)的開發(fā)與應(yīng)用

逼近1.函數(shù)逼近器2.線性函數(shù)逼近3.常見的特征表示方法4.價值迭代+離散化方法5.Fitted Q Iteration6.策略迭代+最小二乘7.預(yù)測學(xué)習(xí)+隨機(jī)梯度下降法8.控制學(xué)習(xí)+隨機(jī)梯度下降法

2022-04-21 14:57:39

超前角是什么

永磁同步電機(jī)的矢量控制策略（十三）13.1 弱磁控制（超前角）在前面我們了解電壓極限環(huán)和電流極限環(huán)的概念后，學(xué)習(xí)了一種基于梯度下降法的電流修正計算的弱磁控制。基于梯度下降法，在此我們介紹另外一種弱磁

2021-08-27 06:27:26

通過Excel表格來學(xué)習(xí)機(jī)器學(xué)習(xí)算法

五步解析機(jī)器學(xué)習(xí)難點(diǎn)—梯度下降【轉(zhuǎn)】

2019-09-27 11:12:18

斯坦福公開課 - 吳恩達(dá) 機(jī)器學(xué)習(xí) | 多元梯度下降法 #機(jī)器學(xué)習(xí)

人工智能

AI苦行僧發(fā)布于 2022-01-05 14:21:40

斯坦福公開課 - 吳恩達(dá) 機(jī)器學(xué)習(xí) | 多元梯度下降法II 學(xué)習(xí)率 #機(jī)器學(xué)習(xí)

機(jī)器人

AI苦行僧發(fā)布于 2022-01-05 14:23:30

吳恩達(dá)《深度學(xué)習(xí)》系列課 - 10.梯度下降法#深度學(xué)習(xí)

人工智能

AI苦行僧發(fā)布于 2022-01-06 20:55:01

吳恩達(dá)《深度學(xué)習(xí)》系列課 - 61.Mini-batch 梯度下降法#深度學(xué)習(xí)

人工智能

AI苦行僧發(fā)布于 2022-01-10 18:25:35

火電站負(fù)荷調(diào)度混沌變步長混合遺傳算法

結(jié)合混沌運(yùn)動的遍歷性和遺傳算法的群體搜索性,提出一種基于混沌變尺度梯度下降的混合遺傳算法,應(yīng)用于電廠負(fù)荷優(yōu)化調(diào)度。算法采用梯度下降法對遺傳變異獲得的優(yōu)良個體進(jìn)行局

2009-02-05 12:13:16

用基于計算機(jī)隨機(jī)模擬的下降法求解報童問題

采用計算機(jī)隨機(jī)模擬加上傳統(tǒng)的梯度下降法，求解了報童每天賣報的期望收益最大的訂報量，并給出了迭代變化圖，結(jié)果表明此算法對于報童問題是相當(dāng)有效的。對于企業(yè)訂貨等問

2009-09-16 10:49:18

4-4-梯度下降模塊 #硬聲新人計劃 #機(jī)器學(xué)習(xí) #人工智能 #算法

人工智能機(jī)器學(xué)習(xí)

fly發(fā)布于 2022-09-07 11:17:13

#硬聲創(chuàng)作季人工智能基礎(chǔ)—機(jī)器學(xué)習(xí)入門完整版教程：11.使用梯度下降法對損失函數(shù)進(jìn)行優(yōu)化

人工智能機(jī)器學(xué)習(xí)

Mr_haohao發(fā)布于 2022-09-21 10:27:19

#硬聲創(chuàng)作季人工智能基礎(chǔ)—機(jī)器學(xué)習(xí)入門完整版教程：12.梯度下降法方法介紹

人工智能機(jī)器學(xué)習(xí)

Mr_haohao發(fā)布于 2022-09-21 10:34:04

#硬聲創(chuàng)作季深度學(xué)習(xí)：84 梯度下降法介紹

人工智能深度學(xué)習(xí)

Mr_haohao發(fā)布于 2022-09-21 14:51:36

#硬聲創(chuàng)作季深度學(xué)習(xí)：88 梯度下降法案例介紹

人工智能深度學(xué)習(xí)

Mr_haohao發(fā)布于 2022-09-21 14:53:25

#硬聲創(chuàng)作季機(jī)器學(xué)習(xí)入門到精通：3-實(shí)現(xiàn)梯度下降優(yōu)化模塊

人工智能機(jī)器學(xué)習(xí)

Mr_haohao發(fā)布于 2022-09-24 09:38:39

#硬聲創(chuàng)作季機(jī)器學(xué)習(xí)入門到精通：4-梯度下降模塊

人工智能機(jī)器學(xué)習(xí)

Mr_haohao發(fā)布于 2022-09-24 10:01:23

#硬聲創(chuàng)作季機(jī)器學(xué)習(xí)入門到精通：6-梯度下降通俗解釋

人工智能機(jī)器學(xué)習(xí)

Mr_haohao發(fā)布于 2022-09-24 10:47:38

#硬聲創(chuàng)作季機(jī)器學(xué)習(xí)的關(guān)鍵算法：3-實(shí)現(xiàn)梯度下降優(yōu)化模塊

人工智能機(jī)器學(xué)習(xí)

Mr_haohao發(fā)布于 2022-10-09 12:55:33

#硬聲創(chuàng)作季機(jī)器學(xué)習(xí)_15.4.1 梯度下降

機(jī)器學(xué)習(xí)

深海狂鯊發(fā)布于 2022-10-29 11:21:43

#硬聲創(chuàng)作季機(jī)器學(xué)習(xí)_16.4.2 實(shí)現(xiàn)梯度下降

機(jī)器學(xué)習(xí)

深海狂鯊發(fā)布于 2022-10-29 11:21:58

#硬聲創(chuàng)作季機(jī)器學(xué)習(xí)_17.4.3 梯度下降的直觀理解

機(jī)器學(xué)習(xí)

深海狂鯊發(fā)布于 2022-10-29 11:22:12

#硬聲創(chuàng)作季機(jī)器學(xué)習(xí)_19.4.5 線性回歸中的梯度下降

機(jī)器學(xué)習(xí)

深海狂鯊發(fā)布于 2022-10-29 11:22:42

#硬聲創(chuàng)作季機(jī)器學(xué)習(xí)_20.4.6 運(yùn)行梯度下降

機(jī)器學(xué)習(xí)

深海狂鯊發(fā)布于 2022-10-29 11:23:11

#硬聲創(chuàng)作季機(jī)器學(xué)習(xí)_24.5.4 多元線性回歸的梯度下降法

機(jī)器學(xué)習(xí)

深海狂鯊發(fā)布于 2022-10-29 11:24:11

#硬聲創(chuàng)作季機(jī)器學(xué)習(xí)_27.6.3 檢查梯度下降是否收斂

機(jī)器學(xué)習(xí)

深海狂鯊發(fā)布于 2022-10-29 11:24:56

#硬聲創(chuàng)作季機(jī)器學(xué)習(xí)_36.9.1 梯度下降實(shí)現(xiàn)

機(jī)器學(xué)習(xí)

深海狂鯊發(fā)布于 2022-10-29 11:27:30

[2.2.1]--梯度下降

機(jī)器學(xué)習(xí)

jf_90840116發(fā)布于 2022-12-10 19:15:12