色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

【連載】深度學習筆記2:手寫一個單隱層的神經網絡

人工智能實訓營 ? 2018-08-06 17:36 ? 次閱讀

筆記1中我們利用 numpy 搭建了神經網絡最簡單的結構單元:感知機。筆記2將繼續學習如何手動搭建神經網絡。我們將學習如何利用 numpy 搭建一個含單隱層的神經網絡。單隱層顧名思義,即僅含一個隱藏層的神經網絡,抑或是成為兩層網絡。

繼續回顧一下搭建一個神經網絡的基本思路和步驟:

  • 定義網絡結構(指定輸出層、隱藏層、輸出層的大小)

  • 初始化模型參數

  • 循環操作:執行前向傳播/計算損失/執行后向傳播/權值更新

定義網絡結構

假設 X 為神經網絡的輸入特征矩陣,y標簽向量。則含單隱層的神經網絡的結構如下所示:

640?wx_fmt=png

網絡結構的函數定義如下:

deflayer_sizes(X,Y):
n_x=X.shape[0]#sizeofinputlayer
n_h=4#sizeofhiddenlayer
n_y=Y.shape[0]#sizeofoutputlayer
return(n_x,n_h,n_y)

其中輸入層和輸出層的大小分別與 Xyshape 有關。而隱層的大小可由我們手動指定。這里我們指定隱層的大小為4。

初始化模型參數

假設 W1 為輸入層到隱層的權重數組、b1 為輸入層到隱層的偏置數組;W2 為隱層到輸出層的權重數組,b2 為隱層到輸出層的偏置數組。于是我們定義參數初始化函數如下:

def initialize_parameters(n_x, n_h, n_y):
  W1 = np.random.randn(n_h, n_x)*0.01
  b1 = np.zeros((n_h, 1))
  W2 = np.random.randn(n_y, n_h)*0.01
  b2 = np.zeros((n_y, 1)) 

assert (W1.shape == (n_h, n_x))
assert (b1.shape == (n_h, 1))
assert (W2.shape == (n_y, n_h))
assert (b2.shape == (n_y, 1)) parameters = {"W1": W1,
"b1": b1,
"W2": W2,
"b2": b2}

return parameters

其中對權值的初始化我們利用了 numpy 中的生成隨機數的模塊 np.random.randn ,偏置的初始化則使用了 np.zero 模塊。通過設置一個字典進行封裝并返回包含初始化參數之后的結果。

前向傳播

在定義好網絡結構并初始化參數完成之后,就要開始執行神經網絡的訓練過程了。而訓練的第一步則是執行前向傳播計算。假設隱層的激活函數為 tanh 函數, 輸出層的激活函數為 sigmoid 函數。則前向傳播計算表示為:

640?wx_fmt=png


定義前向傳播計算函數為:

def forward_propagation(X, parameters):  # Retrieve each parameter from the dictionary "parameters"
  W1 = parameters['W1']
  b1 = parameters['b1']
  W2 = parameters['W2']
  b2 = parameters['b2']  
# Implement Forward Propagation to calculate A2 (probabilities) Z1 = np.dot(W1, X) + b1 A1 = np.tanh(Z1) Z2 = np.dot(W2, Z1) + b2 A2 = sigmoid(Z2)
assert(A2.shape == (1, X.shape[1]))
cache = {"Z1": Z1, "A1": A1, "Z2": Z2, "A2": A2}
return A2, cache

從參數初始化結果字典里取到各自的參數,然后執行一次前向傳播計算,將前向傳播計算的結果保存到 cache 這個字典中, 其中 A2 為經過 sigmoid 激活函數激活后的輸出層的結果。

計算當前訓練損失

前向傳播計算完成后我們需要確定以當前參數執行計算后的的輸出與標簽值之間的損失大小。與筆記1一樣,損失函數同樣選擇為交叉熵損失:

640?wx_fmt=png

定義計算損失函數為:

def compute_cost(A2, Y, parameters):
  m = Y.shape[1] # number of example
  # Compute the cross-entropy cost
  logprobs = np.multiply(np.log(A2),Y) + np.multiply(np.log(1-A2), 1-Y)
  cost = -1/m * np.sum(logprobs)
  cost = np.squeeze(cost)   # makes sure cost is the dimension we expect.

  assert(isinstance(cost, float))  
return cost
執行反向傳播

當前向傳播和當前損失確定之后,就需要繼續執行反向傳播過程來調整權值了。中間涉及到各個參數的梯度計算,具體如下圖所示:

640?wx_fmt=png

根據上述梯度計算公式定義反向傳播函數:

def backward_propagation(parameters, cache, X, Y):
  m = X.shape[1]  
# First, retrieve W1 and W2 from the dictionary "parameters". W1 = parameters['W1'] W2 = parameters['W2']
# Retrieve also A1 and A2 from dictionary "cache". A1 = cache['A1'] A2 = cache['A2']
# Backward propagation: calculate dW1, db1, dW2, db2. dZ2 = A2-Y dW2 = 1/m * np.dot(dZ2, A1.T) db2 = 1/m * np.sum(dZ2, axis=1, keepdims=True) dZ1 = np.dot(W2.T, dZ2)*(1-np.power(A1, 2)) dW1 = 1/m * np.dot(dZ1, X.T) db1 = 1/m * np.sum(dZ1, axis=1, keepdims=True) grads = {"dW1": dW1,
"db1": db1,
"dW2": dW2,
"db2": db2}
return grads

將各參數的求導計算結果放入字典 grad 進行返回。

這里需要提一下的是涉及到的關于數值優化方面的知識。在機器學習中,當所學問題有了具體的形式之后,機器學習就會形式化為一個求優化的問題。不論是梯度下降法、隨機梯度下降、牛頓法、擬牛頓法,抑或是 Adam 之類的高級的優化算法,這些都需要花時間掌握去掌握其數學原理。

640?wx_fmt=gif

權值更新

迭代計算的最后一步就是根據反向傳播的結果來更新權值了,更新公式如下:

640?wx_fmt=png

由該公式可以定義權值更新函數為:

def update_parameters(parameters, grads, learning_rate = 1.2):  # Retrieve each parameter from the dictionary "parameters"
  W1 = parameters['W1']
  b1 = parameters['b1']
  W2 = parameters['W2']
  b2 = parameters['b2']  
# Retrieve each gradient from the dictionary "grads" dW1 = grads['dW1'] db1 = grads['db1'] dW2 = grads['dW2'] db2 = grads['db2']
# Update rule for each parameter W1 -= dW1 * learning_rate b1 -= db1 * learning_rate W2 -= dW2 * learning_rate b2 -= db2 * learning_rate parameters = {"W1": W1,
"b1": b1,
"W2": W2,
"b2": b2}
return parameters

這樣,前向傳播-計算損失-反向傳播-權值更新的神經網絡訓練過程就算部署完成了。當前了,跟筆記1一樣,為了更加 pythonic 一點,我們也將各個模塊組合起來,定義一個神經網絡模型:

def nn_model(X, Y, n_h, num_iterations = 10000, print_cost=False):
  np.random.seed(3)
  n_x = layer_sizes(X, Y)[0]
  n_y = layer_sizes(X, Y)[2]  
# Initialize parameters, then retrieve W1, b1, W2, b2. Inputs: "n_x, n_h, n_y". Outputs = "W1, b1, W2, b2, parameters". parameters = initialize_parameters(n_x, n_h, n_y) W1 = parameters['W1'] b1 = parameters['b1'] W2 = parameters['W2'] b2 = parameters['b2']
# Loop (gradient descent) for i in range(0, num_iterations):
# Forward propagation. Inputs: "X, parameters". Outputs: "A2, cache". A2, cache = forward_propagation(X, parameters)
# Cost function. Inputs: "A2, Y, parameters". Outputs: "cost". cost = compute_cost(A2, Y, parameters)
# Backpropagation. Inputs: "parameters, cache, X, Y". Outputs: "grads". grads = backward_propagation(parameters, cache, X, Y)
# Gradient descent parameter update. Inputs: "parameters, grads". Outputs: "parameters". parameters = update_parameters(parameters, grads, learning_rate=1.2)
# Print the cost every 1000 iterations if print_cost and i % 1000 == 0:
print ("Cost after iteration %i: %f" %(i, cost))

return parameters

以上便是本節的主要內容,利用 numpy 手動搭建一個含單隱層的神經網路。從零開始寫起,打牢基礎,待到結構熟練,原理吃透,再去接觸一些主流的深度學習框架才是學習深度學習的最佳途徑。

本文來自《自興動腦人工智能》項目部:凱文。






聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4779

    瀏覽量

    101052
  • AI
    AI
    +關注

    關注

    87

    文章

    31490

    瀏覽量

    269918
  • 人工智能
    +關注

    關注

    1795

    文章

    47642

    瀏覽量

    239702
收藏 人收藏

    評論

    相關推薦

    深度學習入門:簡單神經網絡的構建與實現

    深度學習中,神經網絡是核心模型。今天我們用 Python 和 NumPy 構建簡單的神經網絡
    的頭像 發表于 01-23 13:52 ?54次閱讀

    深度學習中的卷積神經網絡模型

    深度學習近年來在多個領域取得了顯著的進展,尤其是在圖像識別、語音識別和自然語言處理等方面。卷積神經網絡作為深度學習
    的頭像 發表于 11-15 14:52 ?393次閱讀

    如何編寫BP神經網絡

    傳播過程,即誤差從輸出反向傳播回輸入,并據此調整網絡參數。本文將詳細闡述如何編寫BP神經網絡
    的頭像 發表于 07-11 16:44 ?633次閱讀

    神經網絡中的卷積、池化與全連接

    深度學習中,卷積神經網絡(Convolutional Neural Network, CNN)是種特別適用于處理圖像數據的神經網絡結構。
    的頭像 發表于 07-11 14:18 ?6789次閱讀

    神經網絡模型的基本結構是什么

    神經網絡模型是種常見的深度學習模型,它由輸入、隱藏
    的頭像 發表于 07-11 10:59 ?1011次閱讀

    神經網絡模型的優缺點

    神經網絡模型是種常見的深度學習模型,它由輸入、兩
    的頭像 發表于 07-11 10:58 ?629次閱讀

    PyTorch神經網絡模型構建過程

    PyTorch,作為廣泛使用的開源深度學習庫,提供了豐富的工具和模塊,幫助開發者構建、訓練和部署神經網絡模型。在
    的頭像 發表于 07-10 14:57 ?541次閱讀

    深度神經網絡與基本神經網絡的區別

    在探討深度神經網絡(Deep Neural Networks, DNNs)與基本神經網絡(通常指傳統神經網絡或前向神經網絡)的區別時,我們需
    的頭像 發表于 07-04 13:20 ?1034次閱讀

    深度學習與卷積神經網絡的應用

    隨著人工智能技術的飛速發展,深度學習和卷積神經網絡(Convolutional Neural Network, CNN)作為其中的重要分支,已經在多個領域取得了顯著的應用成果。從圖像識別、語音識別
    的頭像 發表于 07-02 18:19 ?1010次閱讀

    卷積神經網絡一層的作用

    卷積神經網絡(Convolutional Neural Networks,簡稱CNN)是深度學習算法,廣泛應用于圖像識別、自然語言處理等領域。本文將詳細介紹卷積
    的頭像 發表于 07-02 15:28 ?1748次閱讀

    構建神經網絡模型方法有幾種

    構建神經網絡模型是深度學習領域的核心任務之。本文將詳細介紹構建神經網絡模型的幾種方法,包括前饗神經網絡
    的頭像 發表于 07-02 10:15 ?417次閱讀

    深度神經網絡模型cnn的基本概念、結構及原理

    深度神經網絡模型CNN(Convolutional Neural Network)是種廣泛應用于圖像識別、視頻分析和自然語言處理等領域的深度學習
    的頭像 發表于 07-02 10:11 ?9894次閱讀

    深度神經網絡模型有哪些

    深度神經網絡(Deep Neural Networks,DNNs)是類具有多個隱藏神經網絡,它們在許多領域取得了顯著的成功,如計算機視
    的頭像 發表于 07-02 10:00 ?1592次閱讀

    利用深度循環神經網絡對心電圖降噪

    一個是它們由堆疊在起的多個 (> 2) 組成 - 這 種方法也稱為深度學習。這種深層
    發表于 05-15 14:42

    助聽器降噪神經網絡模型

    抑制任務是語音增強領域的重要學科, 隨著深度神經網絡的興起,提出了幾種基于深度模型的音頻處理新方法[1,
    發表于 05-11 17:15
    主站蜘蛛池模板: 嫩草成人影院 | 久久伊人中文字幕有码 | 国产在线观看成人 | 亚洲三级在线视频 | 大迪克黑人异族 | 99在线精品国自产拍不卡 | 国产人妻麻豆蜜桃色69 | 3acg同人漫画禁图h | 白白操在线视频 | 亚洲综合春色另类久久 | 国产乱码二卡3卡四卡 | 国色天香视频在线社区 | 国产精品自在在线午夜蜜芽tv在线 | 欧美视频毛片在线播放 | 亚洲 欧美 国产 在线 日韩 | 亚洲性爱城 | 久久偷拍免费2017 | 妖精视频免费高清观看 | 国产精品嫩草影院在线观看免费 | 91久久偷偷看嫩草影院无费 | 偷偷鲁青春草原视频分类 | 蜜芽在线播放免费人成日韩视频 | 国产欧美亚洲综合第一页 | 野花香在线观看免费高清播放视频 | 日韩精品久久久久久久电影 | 中文字幕在线观看亚洲日韩 | 涩涩视频在线看 | 欧美白妞大战非洲大炮 | 麻豆精品国产剧情观看 | 国产精品久久vr专区 | 金发欧美一区在线观看 | 香港论理午夜电影网 | 美女禁处受辱漫画 | 精品第一国产综合精品蜜芽 | 免费精品国产人妻国语麻豆 | 久久学生精品国产自在拍 | 99久久久国产精品免费蜜臀 | 国产欧美无码亚洲毛片 | 龙腾亚洲人成电影网站 | adc影院欢迎您大驾光临入口 | 久久久久久88色偷偷 |