深度學習受到大規模的炒作,人們恨不得在各個地方都使用神經網絡,但確實在每一個地方都適用么?我們將在下面的章節中進行討論,閱讀完它后,您將知道神經網絡的主要缺點,并且當您為當前的機器學習問題選擇正確類型的算法時,您將有一個粗略的指導原則。您還將了解我們現在面臨的機器學習中的主要問題。
為什么深度學習受到炒作?
深度學習有目前正在進行炒作的四個主要原因,包括數據、計算能力、算法本身和市場營銷。我們將在下面的章節中討論它們中的每一個。
1.數據
增加深度學習的受歡迎程度的一個因素是2018年可用的大量數據,這些數據是在過去幾年和幾十年中收集的。這使得神經網絡能夠真正發揮他們的潛力,因為他們獲得的數據越多越好。
相比之下,傳統的機器學習算法肯定會達到一個水平,更多的數據不會提高其性能。下面的圖表說明了這一點:
2.計算能力
另一個非常重要的原因是現在可用的計算能力,這使我們能夠處理更多的數據。根據人工智能的領先人物Ray Kurzweil的說法,計算能力在每個時間單位會乘以一個常數因子(例如,每年增加一倍),而不是逐漸增加。這意味著計算能力呈指數增長。
3.算法
提高Deep Learning流行度的第三個因素是算法本身的進步。算法開發中的出現最近的突破主要是由于使它們比以前運行得更快,這使得使用越來越多的數據成為可能。
4.營銷
營銷可能也是一個很重要的因素。神經網絡幾十年來(第一次在1944年提出),已經經歷了一些炒作,但過去處于沒有人想相信和投資的時代。 “深度學習”這個詞組給了它一個新的花哨的名字,這使得新的炒作成為可能,這也是許多人錯誤地認為深度學習是一個新創造的領域的原因。
此外,其他因素也促成了深度學習的營銷,例如漢森機器人技術的“人形”機器人Sophia,在大眾中引起了廣泛的爭議,以及機器學習主要領域的幾項突破,使其成為大眾媒體等等。
神經網絡與傳統算法
當你應該使用神經網絡或傳統的機器學習算法,這是一個難以回答的問題,因為它很大程度上取決于你試圖解決的問題。這也是由于“沒有免費的午餐定理”,它大致表明沒有“完美”的機器學習算法,在任何問題上都能表現出色。對于每一個問題,一個特定的方法是適合的,能取得良好的效果,而另一種方法或許會失敗,但這可能是機器學習最有趣的部分之一。
這也是您需要精通幾種算法的原因,以及為什么通過練習獲得優秀機器學習工程師或數據科學家的較好的方法。在這篇文章中會為您提供一些指導方針,幫助您更好地理解何時應使用哪種類型的算法。
神經網絡的主要優勢在于其幾乎超越了其他所有機器學習算法的能力,但是這有一些缺點,我們將在本文中討論并重點關注。就像我之前提到的那樣,決定是否應該使用深度學習主要取決于您正在嘗試解決的問題。例如,在癌癥檢測中,高性能至關重要,因為性能越好,可以治療的人越多。但也有機器學習問題,傳統的算法提供的不僅僅是滿意的結果。
1.黑盒子
神經網絡最為人所知的缺點可能就是它們的“黑盒子”性質,這意味著你不知道神經網絡如何以及為什么會產生一定的輸出。例如,當你將一張貓的圖像放入神經網絡,并預測它是一輛汽車時,很難理解是什么導致它產生這個預測。當你具有人類可解釋的特征時,理解其錯誤的原因要容易得多。在比較中,像決策樹這樣的算法是非常容易理解的。這很重要,因為在某些領域,可解釋性非常重要。
這就是為什么很多銀行不使用神經網絡來預測一個人是否有信譽,因為他們需要向客戶解釋為什么他們沒有獲得貸款。否則,這個人可能會覺得受到銀行的錯誤威脅,因為他不明白他為什么沒有獲得貸款,這可能導致他改變對該銀行的看法,像Quora這樣的網站也是如此。如果他們因為機器學習算法而決定刪除用戶帳戶,他們需要向用戶解釋為什么他們已經完成了它。我懷疑他們是否會滿意電腦所給的答案。
在機器學習的推動下,其他情景將是重要的商業決策。你能想象一個大公司的首席執行官會在不明白為什么應該完成的情況下做出價值數百萬美元的決定嗎?僅僅因為“計算機”說他需要這樣做。
2.開發持續時間
盡管像Keras這樣的庫使得神經網絡的開發非常簡單,但是有時您需要更多地控制算法的細節,例如,當您試圖解決機器學習中的難題時。
然后你可能會使用Tensorflow,它為你提供了更多的機會,但因為它也更復雜,開發需要更長的時間(取決于你想要構建的)。那么對于公司管理層來說,如果真的值得他們昂貴的工程師花費數周時間來開發一些東西,那么問題就會出現,用更簡單的算法可以更快地解決問題。
3.數據量
與傳統的機器學習算法相比,神經網絡通常需要更多的數據,至少有數千甚至數百萬個標記樣本。這不是一個容易解決的問題,如果使用其他算法,許多機器學習問題可以用較少的數據很好地解決。
盡管有些情況下神經網絡很少處理數據,但大多數情況下他們不處理。在這種情況下,像樸素貝葉斯這樣的簡單算法可以很好地處理少數數據。
4.計算昂貴
通常,神經網絡比傳統算法在計算上更昂貴。最先進的深度學習算法,實現真正深度的神經網絡的成功訓練,可能需要幾周時間才能完全從頭開始進行訓練。大多數傳統的機器學習算法花費的時間少于幾分鐘到幾個小時或幾天。
神經網絡所需的計算能力很大程度上取決于數據的大小,但也取決于網絡的深度和復雜程度。例如,具有一層和50個神經元的神經網絡將比具有1000棵樹的隨機森林快得多。相比之下,具有50層的神經網絡將比僅有10棵樹的隨機森林慢得多。
現在你可能會知道神經網絡對于某些任務比較適用,但對其他人來說并不一定適用。您了解到,大量的數據、更多的計算能力、更好的算法和智能營銷增加了深度學習的受歡迎程度,并使其成為目前最熱門的領域之一。最重要的是,您已經了解到,神經網絡幾乎可以擊敗所有其他機器學習算法以及與之相伴隨的缺點。最大的缺點是它們的“黑盒子”性質,增加開發時間(取決于您的問題)、所需的數據量以及它們大部分計算成本高昂。
結論
深度學習目前可能仍舊有點過度炒作的情況,并且超過期望完成的事情。但這并不意味著它沒有用處。我認為我們生活在機器學習復興中,因為它越來越民主化,越來越多的人可以用它來構建有用的產品。機器學習可以解決很多問題,我相信這將在未來幾年內發生。
其中一個主要問題是只有少數人了解可以用它做些什么,并知道如何建立成功的數據科學團隊,為公司帶來真正的價值。一方面,我們擁有博士級工程師,他們是機器學習背后的理論天才,但可能缺乏對商業方面的理解。另一方面,我們有首席執行官和管理職位的人員,他們不知道深度學習可以做些什么,并認為它將在未來幾年解決所有問題。我們需要更多的人來填補這個空白,這將產生更多對我們社會有用的產品。
評論
查看更多