為特定任務尋找最合適的優化機器學習算法是一件耗時費力的工作,因為沒有一種算法能適用于所有任務。IBM的研究人員提出“神經突變”進化算法,可以為機器學習任務自動選擇最合適的算法,選擇速度提升了50000倍,錯誤率僅上升0.6%.
機器學習系統并非是“生而平等”的。沒有一種算法能應對所有的機器學習任務,這就讓尋找最優的機器學習算法成為一項艱巨又耗時的工作。不過這個問題現在有希望解決了,最近IBM的研究人員開發了一套能夠自動選擇AI優化算法的系統。
IBM愛爾蘭研究院的數據科學家Martin Wistuba,在其近日發表的博客文章中介紹了自己開發的這套系統。他聲稱,該系統將自動選擇優化AI算法的速度提升了5萬倍,錯誤率僅上升了0.6%。
Wistuba表示,這套進化算法系統能將選擇適當的機器學習架構的時間縮減至幾個小時,讓每個人都能有條件對深度學習網絡架構進行優化。
面向機器學習的神經網絡突變算法
該方法將卷積神經網絡架構視為神經細胞序列,然后應用一系列突變,以找到一種結構,可以提升給定數據集和機器學習任務的神經網絡的性能。
這種方法大大縮短了網絡訓練時間。這些突變會改變網絡結構,但不會改變網絡的預測,網絡的結構變化可能包括添加新的層、添加新連接或擴展內核或現有層。
保留原函數的神經網絡突變示例。右側的體系結構是突變后的網絡,但與左側的體系結構具有相同的預測結果(由相同顏色表示)
實驗評估:速度提升5萬倍,錯誤率僅上升0.6%
實驗中,研究人員將新神經進化方法與CIFAR-10和CIFAR-100數據集上的圖像分類任務的其他幾種方法進行了比較。這些數據集通常用于訓練機器學習和計算機視覺算法的圖像集。
與最先進的人工設計架構、基于強化學習的架構搜索方法、以及基于進化算法的其他自動化方法的結果相比,結構突變算法在分類錯誤上稍高出前幾種方法,但耗時要少得多,比其他方法快了50000倍,錯誤率最多僅比基準數據集CIFAR-10上的最有力競爭對手高出0.6%。
下圖所示為算法的優化過程。在圖2中,每個點代表不同的結構,連接線代表突變。不同顏色所示為每個結構的精度,x軸表示時間。可以看到,準確率在前10個小時內迅速上升,之后緩慢上升、最后趨于穩定。
深度學習網絡設計的進化算法優化
圖示為隨時間推移,進化算法的優化過程
下圖所示為隨著時間的推移,深度學習網絡結構的演變情況。
網絡結構隨時間的演變,圖中某些中間狀態未顯示
實際上,自動算法選擇并不新鮮。谷歌在智能手機面部識別和目標檢測上也在使用這類方法,如果IBM這一的系統性能確實如其所言,它可能代表著該領域內的一次重大進步。
將來,研究人員希望將這種優化集成到IBM的云服務中,并將其提供給客戶。此外還計劃將其擴展到更大的數據集上,如ImageNet和其他類型的數據,如時間序列和文本、自然語言處理任務等。
Wistuba將于9月在愛爾蘭都柏林舉行的歐洲機器學習和數據庫知識發現會議(ECML-PKDD)會議上介紹這種方法。
-
神經網絡
+關注
關注
42文章
4772瀏覽量
100838 -
機器學習
+關注
關注
66文章
8422瀏覽量
132714 -
數據集
+關注
關注
4文章
1208瀏覽量
24723
原文標題:神經網絡突變自動選擇AI優化算法,速度提升50000倍!
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論