深度學習在語音識別、圖像理解、自動駕駛汽車、自然語言處理、搜索引擎優化等方面提供了顯著的功能和進步。你知道嗎,盡管深度學習的范圍如此廣闊,但人工智能的這種變體在第三次迭代中,也就是現在的21世紀,獲得了巨大的轟動。隨著gpu的出現,深度學習可以在大量基準測試和實際應用程序上超越競爭對手。即使是計算機視覺(深度學習的常見用例之一)社區也相當懷疑,直到2011年AlexNet在ImageNet上擊敗了所有競爭對手。
盡管在這些發展之后,深度學習模式仍存在許多局限性,阻礙了它在當今的大規模應用。例如,模型不具有可伸縮性和旋轉不變性,當物體姿態異常時,很容易對圖像進行錯誤分類。讓我們關注一些常見的缺點。
一個主要的缺點是深度學習算法需要大量的數據集進行訓練。舉例來說,對于語音識別程序,需要形成多種方言、人口統計學和時間尺度的數據來獲得期望的結果。雖然像谷歌和微軟這樣的大型科技巨頭能夠收集并擁有豐富的數據,但有好主意的小公司可能無法做到這一點。此外,有時訓練模型所需的數據已經很稀疏或不可用,這是很有可能的。
此外,在更大的架構下,深度學習模型需要更多的數據來產生可行的結果。在這樣的場景中,重用數據可能不是一個合適的想法,數據擴充在某種程度上可能是有用的,但是擁有更多的數據總是首選的解決方案。此外,由于復雜的數據模型,訓練深度學習模型是一件非常昂貴的事情。有時,它們需要昂貴的gpu和數百臺機器,這就增加了用戶的成本。
其次,在基準數據集上表現良好的深度學習模型在數據集之外的真實圖像上可能會嚴重失敗。為了說明這一點,考慮一個深度學習算法,它學習到校車總是黃色的,但是,突然,校車變成藍色,它將需要重新訓練。相反,一個5歲的孩子認出這輛車是一輛藍色校車是沒有問題的。此外,他們也無法在與訓練環境幾乎不同的情況下有效地執行任務。例如,Google的DeepMind訓練了一個系統來擊敗49款Atari游戲;然而,每次該系統擊敗一款游戲時,它都必須經過再訓練才能擊敗下一款游戲。
這給我們帶來了深度學習的另一個局限性,即雖然模型可能非常擅長將輸入映射到輸出,但它可能不擅長理解它們正在處理的數據的上下文。換言之,它缺乏常識,在跨領域的邊界地區得出結論。據DeepMind的人工智能研究員格雷格·韋恩(GregWayne)說,目前的算法可能無法辨別沙發和椅子是用來坐的。它還缺乏通用智能和多領域集成。
深度學習算法還可以解決不透明或黑盒問題,使它們難以調試或理解如何做出決策。這也讓用戶在理解某些部件為什么會出現故障時無所適從。一般來說,深度學習算法會對數百萬個數據點進行篩選,以找到人類專家通常不會注意到的模式和相關性。雖然在執行一些瑣碎的任務時可能會遇到問題,但在腫瘤檢測等情況下,醫生需要知道為什么模型在掃描報告中標記了一些區域,為什么沒有標記其他區域。
此外,深度學習算法在訓練階段的缺陷使其容易受到對手樣本的攻擊:對手精心設計的輸入,意圖導致深度神經網絡錯誤分類。同時,數據集中存在的偏見可能導致不準確的結果,從而內在地放大了現實世界中的歧視。黑匣子的存在使得開發人員很難確定這些惡意數據是在哪里、如何輸入系統的。
最后,深度學習架構具有出色的能力,如圖像分類和序列預測。它們甚至可以生成與另一個類似GANs的模式相匹配的數據。然而,它們并不能推廣到每一個監督學習問題。
編輯:lyn
-
語音識別
+關注
關注
38文章
1742瀏覽量
112702 -
計算機視覺
+關注
關注
8文章
1698瀏覽量
46027 -
深度學習
+關注
關注
73文章
5506瀏覽量
121259
發布評論請先 登錄
相關推薦
評論