视频久久,我叫白小飞第三季在线观看完整版,天天中文

深度學習已經成熟到可以教給高中生了么?

我思考的這個問題，源于不久前我收到的?封來自某大公司產品經理的郵件。

我喜歡將私人通訊郵件公開于眾，所以我將郵件內容摘在下面：

來自:M.

你好 Ali, ...

你如何訓練團隊里的年輕成員，使得他們有更好的直覺和預判?我團隊里的工程師經常從其他科研員那「借鑒」超參數的值，但他們太擔心要自己去調整參數了。...

我對著這封郵件思考了數日，卻沒有辦法找到?個有條理的答案。

如果說應該有正確答案的話，我想回復說：也許她的工程師應該要有這種擔心。

如果你是個工程師，你拿到了這個神經網絡，然后你被要求去改進這個網絡在某個數據集上的表現。你也許會假設這每層都是有它自己的作用和功能，但在深度學習領域，我們目前還沒有統的語言和詞匯去描述這些功效。我們教授深度學習的方法和我們教授其他科學學科的方法很不同。

幾年前我迷上了光學。在光學領域，你會堆疊好幾層不同的組件以處理輸的光源。例如下圖，就是相機的鏡頭：

師法自然淺談深度學習的多重角度

要設計這樣的系統，你從最簡單的組件開始堆疊，這些組件往往以知名的發明者命名。然后通過仿真，你可以判斷你的設計是否符合你的要求，然后再添加不同的組件去修正先前設計的缺陷。

緊接著你會各種數學優化過程去調整這些組件的參數，例如鏡面的形狀、位置和傾斜角度等等，去最大程度實現你的設計目標。你就重復如此仿真、修改、調優的過程。

這很像我們設計深度網絡的過程。

上圖里所有的 36 個元素都是故意加?這個堆疊的系統，以用于修正某項具體的偏差的。這樣的設計需要非常精確的解釋模型去描述什么樣的元素能夠對透過它的光有什么樣的效應。這個模型往往是關于這個元素的作用的，例如說折射、反射、衍射、散射和波前校正。

師法自然淺談深度學習的多重角度

?們不害怕這樣的設計過程。每年，美國培養的許多?程師都能設計出有的鏡頭，他們并不為這樣的作感到擔心害怕。

這并不是因為光學很容易，而是因為我們對光學的模型了然在心。

現代光學是通過抽象出不同層級的知識內容去教授的。

師法自然淺談深度學習的多重角度

在最頂級，也是最容易的層級，是幾何光學。幾何光學是對波光學的抽象，光射線于于表達簡單的矢量波光學的波前矢量。而波光學?是對麥克斯韋方程的進?步簡化。麥克斯韋方程由能由量子力學推導而出，量子力學則超出了我的理解范圍。

每?個層級都是通過作出?些簡化的假定由緊鄰的下?個層級推導?出，所以每?個層級能夠比上?個層級解釋更為復雜的現象。

師法自然淺談深度學習的多重角度

我花了不少時間在頂四層抽象里設計系統。

這就是當今我們教授光學的方法。但相關理論并非總是如此按層級來組織。在百年前，這些理論還是在?個相互矛盾的狀態中共存。實踐家們只能依賴于近乎道聽途說的光學理論。

但這并沒有阻止伽利略打造性能不錯的望遠鏡，而且是在牛頓形式化幾何光學前近?個世紀的時間點上。因為伽利略對于如何造出能夠放大數?倍的望遠鏡有足夠好的解釋模型。但他對光學的理解，卻不足以讓他的望遠鏡能夠修正色差或者獲得廣視角。

在這些光學理論被抽象總結出來之前，每?項理論都需要從光的最基本概念出發。這就牽涉到要作出?套涵蓋許多也許不切實際的假設。牛頓的幾何光學把光假定作?束束可以被吸引、排斥的固體粒??；莞箘t? 由「以太」作為介質的縱波去描述光，也就是說用類似聲波的方式去構建光。麥克斯韋也假設光經由以太傳播。你從麥克斯韋方程的系數的名字也能窺得這種思路的??。

愚蠢的模型，確實。但它們可量化且有預測的能力。

這些假設，我們今天聽來也許覺得很愚蠢，但它們可量化而且有預測的能力。你可以隨意代入數字于其中并得到精準的量化預測。這對于工程師而言極其有用。

尋找用于描述每層深度學習網絡作用的模塊化語言

如果我們能夠像討論光纖穿越每?層鏡頭元素的作用那樣去討論神經網絡每?層的作用，那么設計神經網絡將會變得更容易。

我們說卷積層就像在輸?上滑動相應濾波器，然后說池化是處理了對應的非線性。但這只是非常低層次的描述，就像用麥克斯韋方程去解釋鏡頭的作用。

也許我們應該依賴于更高級抽象描述，具體表達某個量被神經網絡的層級如何改變了，好比我們用鏡頭的具體作用去解釋它如何彎曲光線那樣。

如果這種抽象也能夠量化，使得你只需要代?具體數值到某個公式里，它就能告訴你?個大概的量化分析，這樣你就能更好地設計你的網絡了。

我們離這樣的語言還很遠。我們先從簡單點的開始

上?也許只是我被自己的幻想帶跑了。

我們從簡單點的開始。我們對深度學習的運作方式有很多解釋模型。下?我會羅列?系列值得解釋的現象，然后我們看看?些現有的模型對這些現象解釋的能力有多強。

在開始之前，我得承認這種努力也許最后是徒勞的。光學花了 300 年在打磨自己的模型之上，而我只花了? 個周六下午，所以這只能算是博客上的?些個?觀點和想法。

現象：隨機梯度下降 (SGD) 的隨機初始化足夠好了。但細微的數字錯誤或者步長會使 SGD 失效。

很多?在實踐中發現，對于如何累積梯度的細微調整，可以導致對整個測試集表現的巨大變化。例如說你只用GPU而不是 CPU 去訓練，結果可能會截然不同。

現象：淺的局部最優值意味著比深的局部最優值更好的泛化能力。

這種說法很時髦。有些?認為它是真的。有些?則用實際數據反駁。另外也有?給出了這個現象的變種。眾說紛紜，爭議目前不斷。

這個現象也許有爭議性，但我還是先放在這里。

現象：批標準化層 (Batch Norm) 可以給 SGD 提速。

這個基本無爭議，我只能提供?個小例外。

現象：即使有很多局部最優和鞍點，SGD 也表現卓越。

這個說法也包含了幾個小的點。經常有人聲稱深度學習的損失表面充斥著鞍點和局部最優。也有不同的說法，要不就認為梯度下降可以遍歷這些區域，要不就認為梯度下降可以不遍歷這些區域，但都能給出泛化能力不錯的答案。也有說損失表面其實也沒那么不堪。

現象：Dropout 勝于其他隨機化策略。

我不知道如何正確分類類似 Dropout 的做法，所以我就稱之為「隨機化策略」了。

現象：深度網絡能夠記憶隨機標簽，但它們能泛化。

證據很直白，我的朋友們親自見證并主張這種說法。

對這些現象的解釋

對應上面列舉的這些現象，我在下面列舉我覺得最能解釋這些現象的理論，這些理論均來自我上面引用的論文。

師法自然淺談深度學習的多重角度

先別激動，原因如下：

1. 我們嘗試解釋的這些現象部分有爭議。

2. 我沒辦法把這些解釋按照抽象層級組織好。光學好教學的特性也沒辦法在這?重現。

3. 我懷疑部分我引用的理論不正確。

我想說的是

有很多人正在加?這個領域，然而我們能夠給他們傳授的不過是近乎道聽途說的經驗和?些預訓練好的深度網絡，然后就叫他們去繼續創新。我們甚?都不能認同我們要解釋的這些現象。所以我認為我們離能夠在高中教授這些內容還有很遠的距離。

那我們如何才能離這?步近點?

最好的不過是我們能夠就每?層深度網絡的功能作用，按照不同層級的抽象，給出對應的解釋模型。例如說，神經網絡里的折射、散射和衍射會是怎么樣的?也許你早就用具體的功能去思考神經網絡，但我們就這些概念還沒有統?的語言。

我們應該把?系列確認的現象組織起來，然后才來進行理論上的解釋。例如說神經網絡里的牛頓環、磁光克爾效應和法拉第現象會是怎樣的?

我和一小批同事已經開始了?項重大的實踐工作，嘗試去分類構建適合我們領域的解釋模型，去形式化它們，并且用實驗去驗證它們。這項工作是巨大的，我認為第?步應該是構建?個分層級的深度學習解釋模型，以用于高中的教學。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

神經網絡

神經網絡

+關注

關注
42

文章
4773

瀏覽量
100890
牛頓

牛頓

+關注

關注
0

文章
6

瀏覽量
6356
深度學習

深度學習

+關注

關注
73

文章
5507

瀏覽量
121272

原文標題：解釋深度學習的新角度，來自光學的啟發

文章出處：【微信號：AItists，微信公眾號：人工智能學家】歡迎添加關注！文章轉載請注明出處。

NPU在深度學習中的應用

隨著人工智能技術的飛速發展，深度學習作為其核心驅動力之一，已經在眾多領域展現出了巨大的潛力和價值。NPU（Neural Processing Unit，神經網絡處理單元）是專門為深度學習

發表于 11-14 15:17 ?690次閱讀

GPU深度學習應用案例

能力，可以顯著提高圖像識別模型的訓練速度和準確性。例如，在人臉識別、自動駕駛等領域，GPU被廣泛應用于加速深度學習模型的訓練和推理過程。二、自然語言處理自然語言處理（NLP）是

發表于 10-27 11:13 ?415次閱讀

AI大模型與深度學習的關系

AI大模型與深度學習之間存在著密不可分的關系，它們互為促進，相輔相成。以下是對兩者關系的介紹：一、深度學習是AI大模型的基礎技術支撐：深度

發表于 10-23 15:25 ?905次閱讀

利用Matlab函數實現深度學習算法

在Matlab中實現深度學習算法是一個復雜但強大的過程，可以應用于各種領域，如圖像識別、自然語言處理、時間序列預測等。這里，我將概述一個基本的流程，包括環境設置、數據準備、模型設計、訓練過程、以及測試和評估，并提供一個基于Mat

發表于 07-14 14:21 ?2306次閱讀

深度學習中的時間序列分類方法

的發展，基于深度學習的TSC方法逐漸展現出其強大的自動特征提取和分類能力。本文將從多個角度對深度學習在時間序列分類中的應用進行綜述，探討常用

發表于 07-09 15:54 ?1028次閱讀

深度學習中的無監督學習方法綜述

深度學習作為機器學習領域的一個重要分支，近年來在多個領域取得了顯著的成果，特別是在圖像識別、語音識別、自然語言處理等領域。然而，深度

發表于 07-09 10:50 ?818次閱讀

深度學習在視覺檢測中的應用

能力，還使得機器能夠模仿人類的某些智能行為，如識別文字、圖像和聲音等。深度學習的引入，極大地推動了人工智能技術的發展，特別是在圖像識別、自然語言處理、語音識別等領域取得了顯著成果。

發表于 07-08 10:27 ?753次閱讀

深度學習與nlp的區別在哪

深度學習和自然語言處理（NLP）是計算機科學領域中兩個非常重要的研究方向。它們之間既有聯系，也有區別。本文將介紹深度學習與NLP的區別。

發表于 07-05 09:47 ?973次閱讀

深度學習的基本原理與核心算法

隨著大數據時代的到來，傳統機器學習方法在處理復雜模式上的局限性日益凸顯。深度學習（Deep Learning）作為一種新興的人工智能技術，以其強大的非線性表達能力和自學習能力，在圖像識

發表于 07-04 11:44 ?2192次閱讀

深度學習常用的Python庫

深度學習常用的Python庫，包括核心庫、可視化工具、深度學習框架、自然語言處理庫以及數據抓取庫等，并詳細分析它們的功能和優勢。

發表于 07-03 16:04 ?666次閱讀

深度學習與卷積神經網絡的應用

到自然語言處理，深度學習和CNN正逐步改變著我們的生活方式。本文將深入探討深度學習與卷積神經網絡的基本概念、工作原理及其在多個領域的應用，并

發表于 07-02 18:19 ?929次閱讀

深度學習與傳統機器學習的對比

在人工智能的浪潮中，機器學習和深度學習無疑是兩大核心驅動力。它們各自以其獨特的方式推動著技術的進步，為眾多領域帶來了革命性的變化。然而，盡管它們都屬于機器學習的范疇，但

發表于 07-01 11:40 ?1430次閱讀

深度解析深度學習下的語義SLAM

隨著深度學習技術的興起，計算機視覺的許多傳統領域都取得了突破性進展，例如目標的檢測、識別和分類等領域。近年來，研究人員開始在視覺SLAM算法中引入深度學習技術，使得

發表于 04-23 17:18 ?1320次閱讀

為什么深度學習的效果更好？

導讀深度學習是機器學習的一個子集，已成為人工智能領域的一項變革性技術，在從計算機視覺、自然語言處理到自動駕駛汽車等廣泛的應用中取得了顯著的成功。深度

發表于 03-09 08:26 ?639次閱讀

什么是深度學習？機器學習和深度學習的主要差異

2016年AlphaGo 擊敗韓國圍棋冠軍李世石，在媒體報道中，曾多次提及“深度學習”這個概念。

發表于 01-15 10:31 ?1101次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

師法自然淺談深度學習的多重角度

評論

NPU在深度學習中的應用

GPU深度學習應用案例

AI大模型與深度學習的關系

利用Matlab函數實現深度學習算法

深度學習中的時間序列分類方法

深度學習中的無監督學習方法綜述

深度學習在視覺檢測中的應用

深度學習與nlp的區別在哪

深度學習的基本原理與核心算法

深度學習常用的Python庫

深度學習與卷積神經網絡的應用

深度學習與傳統機器學習的對比

深度解析深度學習下的語義SLAM

為什么深度學習的效果更好？

什么是深度學習？機器學習和深度學習的主要差異

搜索歷史

師法自然 淺談深度學習的多重角度

評論

師法自然淺談深度學習的多重角度