色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

清空

搜索熱詞

0

聊天消息
系統(tǒng)消息
評論與回復(fù)

查看更多

查看更多

查看更多

VIP于到期續(xù)費(fèi)

登錄后你可以

下載海量資料
學(xué)習(xí)在線課程
觀看技術(shù)視頻
寫文章/發(fā)帖/加入社區(qū)

會員中心

电子发烧友

开通电子发烧友VIP会员尊享10大特权

海量资料免费下载

精品直播免费看

优质内容免费畅学

课程9折专享价

低至0.4元/天，开通VIP

創(chuàng)作中心

發(fā)布

創(chuàng)作活動

完善資料讓更多小伙伴認(rèn)識你，還能領(lǐng)取20積分哦，立即完善>

3天內(nèi)不再提示

關(guān)于訓(xùn)練神經(jīng)網(wǎng)絡(luò)的37個小建議！

這個網(wǎng)絡(luò)在過去12個小時中一直在進(jìn)行訓(xùn)練。一切看起來都很好：梯度在流動，損失在降低。但是接下來的預(yù)測結(jié)果是：所有都是0，所有都是背景，沒有檢測到任何東西。“我做錯了什么？”—我問我的電腦，電腦沒睬我。

你從哪里開始檢查你的模型是否正在輸出垃圾(例如預(yù)測所有輸出的平均值，或者它的準(zhǔn)確性非常差)？

由于一些原因，網(wǎng)絡(luò)可能不會進(jìn)行訓(xùn)練。在許多調(diào)試的過程中，我經(jīng)常發(fā)現(xiàn)自己在執(zhí)行相同的檢查。我把我的經(jīng)驗(yàn)和最好的想法整理在這個方便的列表里。我希望它們對你也有用。

如何使用這個指南？

很多事情都可能出錯。但其中一些更有可能出現(xiàn)問題。我通常以這張簡短的清單作為緊急第一反應(yīng)：

從一個已知對這類數(shù)據(jù)有效的簡單模型開始(例如，圖像的VGG)。如果可能的話，使用標(biāo)準(zhǔn)的損失。關(guān)閉所有花哨的功能，例如正則化和數(shù)據(jù)擴(kuò)充。如果對模型進(jìn)行finetune，請仔細(xì)檢查預(yù)處理，因?yàn)轭A(yù)處理應(yīng)該與原始模型的訓(xùn)練相同。驗(yàn)證輸入數(shù)據(jù)是否正確。

從一個很小的數(shù)據(jù)集(2-20個樣本)開始。對其進(jìn)行過擬合，并逐漸添加更多數(shù)據(jù)。

開始逐步添加所有遺漏的部分：增強(qiáng)/正則化，自定義損失函數(shù)，嘗試更復(fù)雜的模型。

如果上面的步驟沒有什么用，那么就從下面的列表開始，逐一驗(yàn)證。

一 . 數(shù)據(jù)集的問題

1. 檢查你的輸入數(shù)據(jù)

檢查你正在向網(wǎng)絡(luò)提供的輸入數(shù)據(jù)是否有意義。例如，我不止一次地搞混了圖像的寬度和高度。有時，我會不小心把輸入全部搞成了0。或者我會反復(fù)的使用相同batch。因此，打印/顯示兩個batch的輸入和目標(biāo)輸出，并確保它們是正確的。

2. 嘗試隨機(jī)的輸入

嘗試傳遞隨機(jī)數(shù)而不是實(shí)際數(shù)據(jù)，看看錯誤的現(xiàn)象是否相同。如果是的話，這是一個確定的信號，表明你的網(wǎng)絡(luò)在某個時候正在把數(shù)據(jù)變成垃圾。試著一層一層地調(diào)試看看哪里出錯了。

3. 檢查你的數(shù)據(jù)加載

你的數(shù)據(jù)可能沒有問題，但是將輸入傳遞到網(wǎng)絡(luò)的代碼可能會有問題。在任何操作之前打印第一層的輸入并檢查它。

4. 確保輸入連接到了輸出

檢查一些輸入樣本的標(biāo)簽是否正確。還要確保對輸入樣本的變換對輸出標(biāo)簽的作用是相同的。

5. 輸入和輸出之間的關(guān)系是不是太隨機(jī)了？

也許輸入和輸出之間關(guān)系的非隨機(jī)部分與隨機(jī)部分相比太小了(有人可能會說股票價格是這樣的)。也就是說，輸入與輸出的關(guān)系并不充分。由于這取決于數(shù)據(jù)的性質(zhì)，因此沒有一種通用的方法來檢測這一點(diǎn)。

6. 數(shù)據(jù)集中是否有太多的噪聲？

有一次，當(dāng)我從一個食品網(wǎng)站上抓取圖像數(shù)據(jù)集時，這種情況發(fā)生在我身上。有太多不好的標(biāo)簽，網(wǎng)絡(luò)無法學(xué)習(xí)。手動檢查一些輸入樣本，看看標(biāo)簽是不是正確。

噪聲的截止點(diǎn)有待討論，因?yàn)楸疚脑谑褂?0%損壞標(biāo)簽的MNIST上獲得了超過50%的準(zhǔn)確性。

7. 打亂數(shù)據(jù)集

如果你的數(shù)據(jù)集沒有被打亂，并且有一個特定的順序(按標(biāo)簽排序)，這可能會對學(xué)習(xí)產(chǎn)生負(fù)面的影響。打亂你的數(shù)據(jù)集，以避免這種情況。確保你在進(jìn)行打亂的時候，是把輸入和標(biāo)簽一起打亂的。

8. 減少類別的不均衡

每一個類別B的圖像就有1000個類別A的圖像？你可能需要平衡損失函數(shù)或嘗試其他類別不平衡的方法。

9. 你有足夠的訓(xùn)練樣本嗎？

如果你正在從頭開始訓(xùn)練一個網(wǎng)絡(luò)，你可能需要大量的數(shù)據(jù)。對于圖像分類，人們說每個類需要1000個或更多的圖像。

10. 確保你的batch里不只包含同一個標(biāo)簽

這可能發(fā)生在排過序的數(shù)據(jù)集中(即前10k個樣本包含相同的類)。通過打亂數(shù)據(jù)集很容易修復(fù)。

11. 減少batch size

這篇文章指出大的batch size會降低模型的泛化能力。

附加1. 使用標(biāo)準(zhǔn)的數(shù)據(jù)集（如mnist, cifar10 ）

在測試新網(wǎng)絡(luò)架構(gòu)或編寫新代碼時，首先使用標(biāo)準(zhǔn)數(shù)據(jù)集，而不是你自己的數(shù)據(jù)。這是因?yàn)檫@些數(shù)據(jù)集有很多參考結(jié)果，而且它們被證明是“可解的”。不會出現(xiàn)標(biāo)簽噪聲、訓(xùn)練/測試分布差異、數(shù)據(jù)集難度過大等問題。

II . 數(shù)據(jù)歸一化/增強(qiáng)

12. 特征標(biāo)準(zhǔn)化

你是否標(biāo)準(zhǔn)化了你的輸入使其均值和單位方差為零？

13. 你是不是用了太多的數(shù)據(jù)增強(qiáng)？

增強(qiáng)具有規(guī)律性的效果。太多的這些與其他形式的正則化(權(quán)值的L2，dropout等等)結(jié)合在一起會導(dǎo)致網(wǎng)絡(luò)欠擬合。

14. 檢查你的預(yù)訓(xùn)練模型的預(yù)處理

如果你使用的是預(yù)訓(xùn)練模型，請確保你使用的歸一化和預(yù)處理與訓(xùn)練時的模型相同。例如，圖像像素應(yīng)該在[0,1]、[- 1,1]還是[0,255]范圍內(nèi)?

15. 檢查訓(xùn)練/驗(yàn)證/測試集的預(yù)處理

CS231n指出了一個常見的陷阱：

“……任何預(yù)處理統(tǒng)計數(shù)據(jù)(例如數(shù)據(jù)平均值)必須僅對訓(xùn)練數(shù)據(jù)進(jìn)行計算，然后應(yīng)用于驗(yàn)證/測試數(shù)據(jù)。” 例如，計算平均值并從整個數(shù)據(jù)集中的每幅圖像中減去它，然后將數(shù)據(jù)分割為train/val/test分割是錯誤的。"

同時，檢查每個樣本或batch的預(yù)處理的不同之處。

III . 實(shí)現(xiàn)中的問題

16.嘗試解決這個問題的更簡單的版本的問題

這將有助于找到問題所在。例如，如果目標(biāo)輸出是物體的類別和坐標(biāo)，請嘗試只預(yù)測物體的類別。

17.看看“隨機(jī)”時候的正確的損失

再次來自優(yōu)秀的CS231n：使用小參數(shù)進(jìn)行初始化，沒有正則化。例如，如果我們有10個類，在隨機(jī)的情況下意味著我們將有10%的時候會得到正確的類，Softmax損失是正確類的概率的負(fù)對數(shù)，因此：-ln(0.1) = 2.302.

在此之后，試著增加正則化強(qiáng)度，這會增加損失。

18. 檢查你的損失函數(shù)

如果你實(shí)現(xiàn)了自己的loss函數(shù)，那么檢查它的bug并添加單元測試。通常，我自己寫的損失可能是不正確的，并以一種微妙的方式損害了網(wǎng)絡(luò)的性能。

19. 驗(yàn)證損失的輸入

如果你使用的是框架提供的loss函數(shù)，請確保你傳遞給它的是它所期望的。例如，在PyTorch中，我會混淆NLLLoss和CrossEntropyLoss，因?yàn)榍罢咝枰猻oftmax輸入，而后者不需要。

20. 調(diào)整損失的權(quán)重

如果你的損失由幾個較小的損失函數(shù)組成，請確保它們相對于每個損失函數(shù)的大小是正確的。這可能涉及測試不同的損失權(quán)重組合。

21. 使用其他的度量方法進(jìn)行監(jiān)控

有時候，損失并不能很好地預(yù)測你的網(wǎng)絡(luò)是否訓(xùn)練的好。如果可以，使用其他指標(biāo)，如準(zhǔn)確性。

22. 測試所有的自定義的層

你自己實(shí)現(xiàn)了網(wǎng)絡(luò)中的一些層嗎？反復(fù)檢查以確保它們按照預(yù)期工作。

23. 檢查“凍結(jié)”的層和變量

檢查你是否無意中禁用了一些層/變量的梯度的更新。

24. 增加網(wǎng)絡(luò)的大小

也許你的網(wǎng)絡(luò)的表達(dá)能力不足以得到目標(biāo)函數(shù)。嘗試在全連接的層中添加更多的層或更多的隱藏單元。

25. 檢查隱藏維度的錯誤

如果你的輸入看起來像(k, H, W) =(64, 64, 64)那么很容易忽略與錯誤維度相關(guān)的錯誤。對輸入維度使用奇怪的數(shù)字(例如，每個維度使用不同的素數(shù))，并檢查它們?nèi)绾卧诰W(wǎng)絡(luò)中傳播。

26. 梯度檢查

如果你手動實(shí)現(xiàn)梯度下降，檢查梯度，確保你的反向傳播工作正常。

IV. 訓(xùn)練問題

27. 處理小數(shù)據(jù)集

過擬合數(shù)據(jù)的一個子集，并確保它能工作。例如，用一兩個樣本來訓(xùn)練，看看你的網(wǎng)絡(luò)是否能學(xué)會區(qū)分它們。再繼續(xù)使用每個類的更多樣本。

28. 檢查權(quán)值初始化

如果不確定的話，使用Xavier或He初始化。另外，初始化可能會導(dǎo)致錯誤的局部最小值，所以嘗試不同的初始化，看看是否有幫助。

29. 改變你的超參數(shù)

也許你使用了一組特別糟糕的超參數(shù)。如果可行，嘗試網(wǎng)格搜索。

30. 減少正則化

過多的正則化會導(dǎo)致網(wǎng)絡(luò)嚴(yán)重欠擬合。減少正規(guī)化，如dropout、、權(quán)重/偏置L2正規(guī)化等。在優(yōu)秀的“Prac tical Deep Learning for coders”課程中，Jeremy Howard建議首先擺脫欠擬合。這意味著你需要對訓(xùn)練數(shù)據(jù)進(jìn)行充分的過擬合，然后再解決過擬合問題。

31. 多給點(diǎn)時間

也許你的網(wǎng)絡(luò)需要更多的時間來訓(xùn)練，才能開始做出有意義的預(yù)測。如果你的損失在穩(wěn)步減少，那就讓它繼續(xù)訓(xùn)練吧。

32. 從訓(xùn)練模式切換到測試模式

有些框架具有Batch Norm、drop等層，在訓(xùn)練和測試期間的行為有所不同。切換到適當(dāng)?shù)哪Ｊ娇赡苡兄谀愕木W(wǎng)絡(luò)進(jìn)行正確的預(yù)測。

33. 訓(xùn)練可視化

監(jiān)控每一層的激活值、權(quán)重和更新。確保它們大小匹配。例如，參數(shù)更新的大小(權(quán)重和偏差)應(yīng)該是1-e3。

考慮一個可視化庫，比如Tensorboard和Crayon。必要時，你還可以打印權(quán)重/偏置/激活值。

尋找平均值比0大得多的層激活。嘗試 Batch Norm或ELUs。

Deeplearning4j指出在權(quán)重和偏差直方圖中應(yīng)該能看到：
對于權(quán)值，這些直方圖在一段時間后應(yīng)該有一個近似的高斯分布。對于偏置，這些直方圖通常從0開始，通常以近似高斯分布結(jié)束(LSTM是一個例外)。注意那些發(fā)散到+/-∞的參數(shù)。留意那些變得很大的偏置。如果類的分布非常不平衡，這種情況有時會發(fā)生在分類的輸出層。

檢查層的更新，他們應(yīng)該是一個高斯分布。

34. 嘗試不同的優(yōu)化器

你選擇的優(yōu)化器不應(yīng)該會導(dǎo)致你的網(wǎng)絡(luò)不訓(xùn)練，除非你選擇了特別糟糕的超參數(shù)。然而，對于一個任務(wù)，適當(dāng)?shù)膬?yōu)化器可以幫助在最短的時間內(nèi)獲得最多的訓(xùn)練。你正在使用的算法的論文中應(yīng)該會指定優(yōu)化器。如果不是，我傾向于使用Adam或使用動量的SGD。

查看Sebastian Ruder的excellent post了解更多關(guān)于梯度下降優(yōu)化器的信息。

35. 梯度爆炸/消失

檢查層的更新，因?yàn)楹艽蟮闹悼梢詫?dǎo)致梯度爆炸。梯度剪裁可能會有所幫助。

檢查層的激活。來自Deeplearning4j的是一條很好的指導(dǎo)方針：“一個好的激活值的標(biāo)準(zhǔn)差在0.5到2.0之間。顯著地超出這個范圍可能意味著激活值的消失或爆炸”

36. 增大/降低學(xué)習(xí)率

較低的學(xué)習(xí)率會導(dǎo)致模型非常緩慢地收斂。

高學(xué)習(xí)率將在開始時迅速減少損失，但可能很難找到一個好的解決方案。

把你當(dāng)前的學(xué)習(xí)速度乘以0.1或10。

37. 克服NaNs

在訓(xùn)練RNN時，獲得NaN (Non-a-Number)是一個更大的問題。一些解決方法：

降低學(xué)習(xí)速率，特別是在前100次迭代中獲得NaNs時。

NaNs可以由除以0或ln(0)或負(fù)數(shù)得到。

Russell Stewart有很多關(guān)于如何處理NaNs的建議()。

嘗試逐層評估你的網(wǎng)絡(luò)，并查看NaNs出現(xiàn)在哪里。

英文原文：https://blog.slavv.com/37-reasons-why-your-neural-network-is-not-working...

編輯：jq

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)

+關(guān)注

關(guān)注
42

文章
4814

瀏覽量
103772
AI

AI

+關(guān)注

關(guān)注
88

文章
35249

瀏覽量
280469
rnn

rnn

+關(guān)注

關(guān)注
0

文章
89

瀏覽量
7121

評論

发布文章

精選推薦
更多

文章

資料

帖子

基于睿擎派輕松玩轉(zhuǎn)Modbus工業(yè)通信

RT-Thread官方賬號
6小時前

191 閱讀

凡億Allegro Skill工藝輔助之Gerber設(shè)置導(dǎo)出

凡億PCB
8小時前

247 閱讀

IGBT元件的短路和過電壓保護(hù)

青島佳恩半導(dǎo)體有限公司
9小時前

301 閱讀

中微愛芯觸摸軟件調(diào)試指南

無錫中微愛芯電子有限公司
9小時前

214 閱讀

Meta的AI之路，為何節(jié)節(jié)敗退？

腦極體
10小時前

392 閱讀

LED數(shù)碼管驅(qū)動電路大全

哼小曲
710

10積分

1566下載

霍爾傳感器設(shè)計技巧

o_dream
0.30 MB

免費(fèi)

32下載

Verilator高性能Verilog HDL模擬器與lint系統(tǒng)

哈哈哈
4.49 MB

2積分

1下載

老樹洞安全存儲技術(shù)

劉埃生
0.48 MB

2積分

3下載

wwsearch企業(yè)微信檢索引擎

張杰
31.72 MB

2積分

1下載

【RA-Eco-RA6M4開發(fā)板評測】4、配合DA16200實(shí)現(xiàn)網(wǎng)頁監(jiān)控開發(fā)板

EPTmachine
23小時前

155 閱讀

XTAL晶體振蕩器是怎么工作的？一文看懂壓電原理與工程應(yīng)用

五三一
23小時前

100 閱讀

不同PWM調(diào)制方式對無刷直流電機(jī)調(diào)速的影響

jf_89421697
23小時前

254 閱讀

【VisionFive 2單板計算機(jī)試用體驗(yàn)】VisionFive 2燒錄Ubuntu

jf_43382582
23小時前

283 閱讀

【RA-Eco-RA6M4開發(fā)板評測】2、移植FreeRTOS_CLI和添加自定義指令

EPTmachine
23小時前

330 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

華秋（原“華強(qiáng)聚豐”）：

電子發(fā)燒友

華秋開發(fā)

華秋電路(原"華強(qiáng)PCB")

華秋商城(原"華強(qiáng)芯城")

華秋智造

My ElecFans

APP
網(wǎng)站地圖

設(shè)計技術(shù)

可編程邏輯

電源/新能源

MEMS/傳感技術(shù)

測量儀表

嵌入式技術(shù)

制造/封裝

模擬技術(shù)

RF/無線

接口/總線/驅(qū)動

處理器/DSP

EDA/IC設(shè)計

存儲技術(shù)

光電顯示

EMC/EMI設(shè)計

連接器

行業(yè)應(yīng)用

LEDs

汽車電子

音視頻及家電

通信網(wǎng)絡(luò)

醫(yī)療電子

人工智能

虛擬現(xiàn)實(shí)

可穿戴設(shè)備

機(jī)器人

安全設(shè)備/系統(tǒng)

軍用/航空電子

移動通信

工業(yè)控制

便攜設(shè)備

觸控感測

物聯(lián)網(wǎng)

智能電網(wǎng)

區(qū)塊鏈

新科技

特色內(nèi)容

專欄推薦

學(xué)院

設(shè)計資源

設(shè)計技術(shù)

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術(shù)文章

產(chǎn)品地圖

品牌地圖

社區(qū)

小組

論壇

問答

評測試用

企業(yè)服務(wù)

產(chǎn)品

資料

文章

方案

企業(yè)

供應(yīng)鏈服務(wù)

硬件開發(fā)

華秋電路

華秋商城

華秋智造

nextPCB

BOM配單

媒體服務(wù)

網(wǎng)站廣告

在線研討會

活動策劃

新聞發(fā)布

新品發(fā)布

小測驗(yàn)

設(shè)計大賽

華秋

關(guān)于我們

投資關(guān)系

新聞動態(tài)

加入我們

聯(lián)系我們

舉報投訴

社交網(wǎng)絡(luò)

微博

移動端

發(fā)燒友APP

硬聲APP

WAP

聯(lián)系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內(nèi)容合作

黃晶晶：huangjingjing@elecfans.com

內(nèi)容合作（海外）

張迎輝：mikezhang@elecfans.com

供應(yīng)鏈服務(wù) PCB/IC/PCBA

江良華：lanhu@huaqiu.com

投資合作

曾海銀：zenghaiyin@huaqiu.com

社區(qū)合作

劉勇：liuyong@huaqiu.com

關(guān)注我們的微信

下載發(fā)燒友APP

電子發(fā)燒友觀察

電子工程師社區(qū)

1-32層PCB打樣·中小批量

元器件現(xiàn)貨·全球代購·SmartBOM

SMT貼片·PCBA加工

PCB Manufacturer

華秋簡介

企業(yè)動態(tài)

聯(lián)系我們

企業(yè)文化

企業(yè)宣傳片

加入我們

版權(quán)所有 ? 湖南華秋數(shù)字科技有限公司

長沙市望城經(jīng)濟(jì)技術(shù)開發(fā)區(qū)航空路6號手機(jī)智能終端產(chǎn)業(yè)園2號廠房3層（0731-88081133）
電子發(fā)燒友 （電路圖） 湘公網(wǎng)安備43011202000918 工商網(wǎng)監(jiān) 湘ICP備2023018690號-1

感谢您访问我们的网站，您可能还对以下资源感兴趣：
色哟哟视频在线观看|色哟哟视频在线|色哟哟欧美15最新在线|色哟哟免费在线观看|国产l精品国产亚洲区在线观看|国产l精品国产亚洲区久久
在线观看日韩www视频免费

主站蜘蛛池模板：在线观看免费国产成人软件 | 久久久久综合网 | 精品久久久亚洲精品中文字幕 | 99免费视频观看 | 亚洲字幕在线观看 | 国产一区二区在线观看免费 | 国产精品人妻一区免费看8C0M | 免费毛片试看 | 卫生间被教官做好爽HH视频 | 蜜芽视频在线观看视频免费播放 | 麻豆成人啪啪色婷婷久久 | 中文视频在线 | 国产二区自拍 | 国产精品你懂得 | 91黄色影院 | 亚洲中文字幕无码一去台湾 | 蜜芽tv在线www| 我们中文在线观看免费完整版 | 久久AV国产麻豆HD真实乱 | 四虎永久在线精品免费A | 久久综合久综合久久鬼色 | 亚洲精品久久无码AV片银杏 | 超碰在线观看 | 日韩在线av免费视久久 | 亚州综合网 | 色戒床震视频片段 | 国产精品日韩欧美一区二区三区 | 一进一出抽搐gif免费60秒 | 乌克兰10一12x video | 好紧的小嫩嫩17p | 国产精品日本不卡一区二区 | 欧美乱妇狂野欧美在线视频 | 欧美黑人巨大性极品hd欧 | 桃花色影院| 在线亚洲色拍偷拍在线视频 | RUNAWAY韩国动漫免费网 | 99re久久热最新地址一 | 国产AV一区二区三区日韩 | 久久婷婷久久一区二区三区 | 小学生偷拍妈妈视频遭性教育 | 欧美成人momandson |

電子發(fā)燒友

中國電子工程師最喜歡的網(wǎng)站

與2931785位工程師會員交流學(xué)習(xí)
獲取您個性化的科技前沿技術(shù)信息
參加活動獲取豐厚的禮品