在很多人眼里,深度學習是一個非常神奇的技術,是人工智能的未來,是機器學習的圣杯。今天大恒圖像帶您一起揭開他神秘的面紗,了解什么才是深度學習。
當我們在網絡上搜索“深度學習”的時候往往還能搜到“人工智能”以及“機器學習”這兩個關鍵詞。有很多人甚至認為深度學習就是人工智能,其實這些概念之間還是有一些區別的。因此,在介紹它的工作原理之前,為了讓大家更好的了解深度學習,我們先來介紹一下這幾個概念之間的區別和聯系。
人工智能到目前為止還只是一個概念。它是由麻省理工學院的約翰·麥卡錫于1956年在達特矛斯會議上提出的。在會上人們把人工智能定義為一門可以讓機器的行為看起來像人一樣智能的技術,但是至今為止我們還沒能實現這個夢想。伴隨著隨著計算機技術的發展以及學者們不斷的探索,雖然我們目前無法實現理想中的人工智能,但已經找到了一些實現它的途徑,那就是機器學習。機器學習不同于我們之前提到的理想中的人工智能。它可以使機器具有一定的決策能力。它是一種對已知數據進行學習和分類的分類器。有人認為這并不是真正的智能,于是人們把理想中的人工智能稱為強人工智能,而相對的把機器學習稱為弱人工智能。我們現在耳熟能詳的深度學習則是一種實現機器學習的算法。所以從算法的角度上來說深度學習只是一個分類器而已。
深度學習的核心算法是CNN神經網絡,即卷積神經網絡。這個網絡早在1989年就已經問世了,最初人們用它解決手寫字符的識別問題,但是受限于當時計算機的硬件水平,其處理速度較慢,并沒有推廣到其他應用領域。1999年gpu的問世為卷積神經網絡重回歷史舞臺提供了良好的條件。借助gpu高效的處理能力,卷積神經網絡算法開始走向應用。它優秀的分類能力逐漸被各個應用領域所認可。而當Alpha Go戰勝了圍棋冠軍李世石以后,人們對深度學習技術的期望更是達到了頂峰。但是我相信,很快人們就會發現深度學習只是我們目前掌握的一種新的非線性分類器。它和其他分類器一樣都需要通過訓練才能夠實現分類的功能。比如通過水果圖像的訓練,它就可以幫助我們判斷圖像中水果的種類。
作為一個機器學習的分類器,深度學習在很多特征模糊的分類領域均有不錯的表現,比如在自動駕駛和照片分類等應用領域。相比于其他的分類器,深度學習不僅可以對圖像的特征進行分類,還可以通過訓練對圖像中的特征進行學習。這種特性對于一些特征不易描述的圖像分類任務是大有裨益的。
是什么給了深度學習如此大的神通呢?這就要從它所特有的卷積神經網絡說起了。
常用邊緣提取卷積算法
原圖 sobelY sobel X
卷積是一種積分變換的數學方法,在圖像處理中應用廣泛。很多我們常用的圖像濾波器都是通過卷積實現的。比如使用3x3所有元素全為1的卷積核對圖像進行運算后可以去除圖像噪聲,突顯圖像整體特征。又比如使用高斯核對圖像進行運算可以在保留邊緣的情況下對圖像噪聲進行抑制。此外許多我們熟知的邊緣提取算法也是由特定卷積核實現的,如canny,sobel,Laplace等。由此我們不難看出,不同的卷積核可以幫我們強化圖像中不同的特征。但是如何選擇正確的卷積核卻是一件非常困難的事情,需要擁有豐富圖像處理經驗的程序員才能辦到。而深度學習最大優勢就在于可通過權值訓練的方式對卷積核進行訓練。
CNN神經網絡
上圖為一個卷積神經網絡(CNN)的結構圖。輸入圖像經過卷積、池化,再卷積再池化的過程,最后將所有圖像數據轉化為特征向量并輸入到全連接層獲得最終的分類結果。
一個卷積神經網絡可以擁有多個卷積層,不同的卷積層可以設置不同的卷積核尺寸和數目。通過卷積,我們可以生成一組特征圖像供后續算法使用。與圖像濾波處理不同的是,卷積核中的每一個元素并非人為指定,而是通過計算獲得。在這里我們將卷積核中的每個元素作為網絡的權值,并通過訓練逐步修改它們。理論上來說,我們可以把圖像上的每個像素都作為一個特征值直接輸入到全連接層中,但是,那樣會導致神經網絡太過復雜。于是我們采用卷積層這種共享權值的方式簡化我們的網絡。我們所說的權值共享,并不是指同一個卷積核中所有權值都相同,而是說在對整張圖像進行卷積的過程中卷積核是不變的,圖像中所有像素都享有相同卷積核權值。通過權值共享,可以降低網絡的訓練負擔,縮短分類時間,使網絡更加實用。
一般,在卷積層的后面都會緊跟著一個池化層。在池化層中,特征圖像會被降采樣。降采樣的方法也有很多,比如選取指定范圍內數值最大的特征或者使用該范圍所有特征的平均值作為新特征圖的特征值。
池化層可以幫助我們減少后續特征圖像的運算量。此外,采樣處理相當于變相縮小圖像,這也使得在后續的卷積層中對圖像概況訓練成為可能。例如,在較淺的網絡中我們可以訓練出類似sobel的檢測指定邊緣方向的卷積核,而在較深層則能夠訓練出凸顯折線或者其他形狀的卷積核。
在經過一系列的卷積層和池化層后,特征數據會被送入全連接層進行分類。全連接層是一種被稱為多層感知器(MLP)的非線性分類器。它具有很好的非線性分類能力。拋開深度學習技術不談,這種分類器也可以單獨使用,只不過輸入的特征需要人為提取,而不像卷積神經網絡中由前面的網絡計算獲得。通過全連接層的分類,我們最終可以獲得樣本被分為所有類別的概率,統計這些概率,我們就可以獲得最終的分類結果。
通過上文的介紹,相信大家對卷積神經網絡的結構已經有了一定的了解。從網絡的結構上我們不難看出,卷積神經網絡非常適合進行模糊特征的分類,而合理的網絡結構以及合適的參數是網絡能否成功分類的關鍵。如果你想自己搭建網絡,就要了解網絡中各層的用途以及相互作用關系,這需要一定的數學功底。當然從應用角度上來講,我們可以直接使用別人搭建好的網絡或者算法庫,已縮短我們的研發周期。
-
神經網絡
+關注
關注
42文章
4771瀏覽量
100715 -
機器學習
+關注
關注
66文章
8406瀏覽量
132565 -
深度學習
+關注
關注
73文章
5500瀏覽量
121111
原文標題:深度學習
文章出處:【微信號:machine_vision_1,微信公眾號:機器視覺智能檢測】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論