離 2019 年還剩不到 1 個月的時間了。這幾年來,每個年初本文作者 Carlos E. Perez 都對預(yù)測當(dāng)年深度學(xué)習(xí)的趨勢做預(yù)測,到年底再對預(yù)測進(jìn)行回顧,今年亦不例外。本文是他對 2018 年深度學(xué)習(xí)預(yù)測的回顧,目的是量化深度學(xué)習(xí)的快速發(fā)展。通過回顧預(yù)測,對比新的一年的進(jìn)展,我們可以了解這個領(lǐng)域發(fā)展到底有多快。
本文將回顧我對 2018 年深度學(xué)習(xí)的預(yù)測,并對這一年的進(jìn)展進(jìn)行評論:
注:
作者對 2018 年深度學(xué)習(xí)的預(yù)測見:【2018深度學(xué)習(xí)10大警示】多數(shù)芯片公司將破產(chǎn);自我對弈可自動創(chuàng)造知識
1.多數(shù)深度學(xué)習(xí)硬件初創(chuàng)公司都將失敗
2018 年,深度學(xué)習(xí)硬件公司中,公開承認(rèn)失敗的公司沒幾家(有一家公司已宣稱失敗:KnuEdge),但是它們都還沒有交付產(chǎn)品。有意思的是,盡管這些初創(chuàng)公司未能交付產(chǎn)品,卻仍然能夠籌集到更多的資金!
注:
這里有一份人工智能硬件初創(chuàng)公司列表:
https://github.com/basicmi/AI-Chip-List
去年我的觀點是,深度學(xué)習(xí)初創(chuàng)公司將無法正確地估計自己可以為自己的潛在的客戶群提供多少可用軟件的成本。隨著深度學(xué)習(xí)堆棧變得越來越豐富、越來越復(fù)雜,初創(chuàng)公司還能迎頭趕上嗎?這是個疑問。
最大的失敗來自 Intel。在 NIPS 2017 大會上,它們不是大張旗鼓地宣揚最終將提供硅片嗎?今年,它們的 Nervana 衍生產(chǎn)品是 MIA。它們是否能夠在明年春天之前推出 “Spring Crest”?讓我們拭目以待。
有多家初創(chuàng)公司都號稱自己有可用的硅片。深度學(xué)習(xí)人工智能如此熱門,每個人都想 “發(fā)明” 自己的芯片。簡單列舉一下,這些初創(chuàng)公司包括:GraphCore、Wave Computing、Groq、 Habana、Bitmain、Cabricon、Esperanto、Novumind、Gryfalcon、Hailo 和 Horizon。這還沒算上三星、ARM、Xilinx、高通和華為等傳統(tǒng)半導(dǎo)體制造商。另外有一個新情況是,現(xiàn)在傳統(tǒng)的云服務(wù)供應(yīng)商并不是購買 AI 芯片,而是研發(fā)自己的 AI 芯片:比如 Amazon 的 Inferentia、Microsoft 的 Brainwave、Facebook、阿里巴巴的 AliNPU 和百度的昆侖。芯片領(lǐng)域?qū)⒑芸炀蜁兊脫頂D起來!
現(xiàn)在的情況是,深度學(xué)習(xí)硬件由極其龐大且有能力的公司來主導(dǎo):Nvidia 和 Google。雖然你無法得到 Google TPU2 的物理硬件,但你可以通過云服務(wù)對 Google TPU2 進(jìn)行虛擬訪問。相比之下,Nivida 提供了云計算(通過第三方云服務(wù)供應(yīng)商)和硬件的兩種可用選項。
能夠與這兩大巨頭進(jìn)行競爭的供應(yīng)商是 AMD。AMD 支持最新版本的 TensorFlow,并且擁有逐漸成熟的深度學(xué)習(xí)堆棧。與 Nvidia 和 Google 不同,它們?nèi)鄙?Tensor 核心組件(即 Systolic Array(脈動陣列))。但對更為傳統(tǒng)的訓(xùn)練和推理工作來說,AMD 的硬件性能可與 Nvidia 媲美。這聽上去可能會覺得沒什么大不了的,但是你要知道,AMD 已經(jīng)遙遙領(lǐng)先于任何其他初創(chuàng)公司的競爭對手。AMD 和 Nvidia 有著相似的規(guī)模經(jīng)濟,因為它們的大部分硅片都是用于日常性用途(即游戲、渲染、高性能計算等)。
老實說,這個領(lǐng)域有太多的追隨者。成熟的深度學(xué)習(xí)市場可能只支持不超過 3 個競爭對手。Nvidia 和 Google 早已鞏固它們在市場的地位,如此一來,就只剩下一個空位了!為了生存下去,公司必須使解決方案的部署盡可能簡單容易、暢行無阻。此外,每家公司必須讓自己的產(chǎn)品具有自己的特色——不要每家公司都去做圖像處理!為了能夠有效地提供無縫體驗、同時建立起自己的市場定位,這些公司必須在軟件方面進(jìn)行投資(順便說一句,我也正尋找硬件公司里的相關(guān)職位)。
2. 元學(xué)習(xí)將成為新的 SGD
元學(xué)習(xí)(Meta-learning)還沒有取代 SGD(Stochastic Gradient Descent,隨機梯度下降),但以神經(jīng)架構(gòu)搜索形式的元學(xué)習(xí)在這一領(lǐng)域中已經(jīng)取得巨大的進(jìn)步。本年的一個關(guān)鍵的進(jìn)展與超網(wǎng)絡(luò)(Hypernetwork)搜索有關(guān)。請參閱 Medium 上的博文:
《Deep Learning Architecture Search and the Adjacent Possible》(《深度學(xué)習(xí)架構(gòu)搜索及相鄰可能》)
https://medium.com/intuitionmachine/deep-learning-to-forget-or-not-forget-c8b7843479dd
我們在元學(xué)習(xí)中取得的另一個進(jìn)步是在算法方面,它的靈感來自于少量學(xué)習(xí)(few-shot learning)MAML。這催生了各種算法:Reptile、PROMP 和 CAML。元學(xué)習(xí)方法需要大量的訓(xùn)練數(shù)據(jù),這是因為它是在各種各樣的任務(wù)中學(xué)習(xí),而不僅僅是在不同的樣本中學(xué)習(xí)。它有兩個用于學(xué)習(xí)的迭代循環(huán),一個是迭代任務(wù)的外部學(xué)習(xí)循環(huán),一個是迭代訓(xùn)練數(shù)據(jù)的內(nèi)部循環(huán)。基于 MAML 的方法只考慮任務(wù)的初始化,因此不需要可比較相同類型的數(shù)據(jù)。
Reptile:https://blog.openai.com/reptile/
PROMP:https://arxiv.org/pdf/1810.06784.pdf
CAML:https://arxiv.org/pdf/1810.03642.pdf
我現(xiàn)在開始認(rèn)為,無監(jiān)督學(xué)習(xí)和元學(xué)習(xí)實際上是同一個問題。進(jìn)化解決這個問題的方法是通過踏腳石(stepping stone )技能的發(fā)展。這意味著它完全取決于正在解決的問題的類型:是用于預(yù)測,自助控制,還是生成設(shè)計的無監(jiān)督學(xué)習(xí)或元學(xué)習(xí)任務(wù)?每一種問題都需要不同的基本技能,因此可以訓(xùn)練一個聚合的基本模型,而不是每一個任務(wù)都從頭訓(xùn)練。引導(dǎo)是一種虛構(gòu)的方法,它吸引了那些相信可以通過數(shù)學(xué)來拯救世界的研究人員。
注:
關(guān)于作者提及的無監(jiān)督學(xué)習(xí)和元學(xué)習(xí)實際是同一個問題,可參閱論文《Unsupervised Learning via Meta-learning》(《通過元學(xué)習(xí)進(jìn)行無監(jiān)督學(xué)習(xí)》)
https://arxiv.org/pdf/1810.02334.pdf
總而言之,在 2018 年看來最有前途的兩種元學(xué)習(xí)方法是進(jìn)化啟發(fā)的架構(gòu)搜索和少量學(xué)習(xí) MAML 方法。
3. 生成模型驅(qū)動一種新的建模方式
目前,生成模型仍然主要局限于娛樂應(yīng)用。當(dāng)然,BigGAN 搜索創(chuàng)建了很多噩夢般的圖像,但不幸的是,使用高保真生成模型來取代標(biāo)準(zhǔn)計算方法的研究仍然在進(jìn)行。
BigGAN 創(chuàng)建的圖像可見:https://www.fastcompany.com/90244767/see-the-shockingly-realistic-images-made-by-googles-new-ai
DeepMind 研究蛋白質(zhì)折疊已有兩年,他們剛剛在 12 月份公布了研究成果:
《AlphaFold: Using AI for scientific discovery》(《AlphaFold:使用人工智能進(jìn)行科學(xué)發(fā)現(xiàn)》)
https://deepmind.com/blog/alphafold/
DeepMind 訓(xùn)練了一個生成神經(jīng)網(wǎng)絡(luò)來編造新的蛋白質(zhì)片段,這些蛋白質(zhì)片段隨后被用來不斷提高所提議的蛋白質(zhì)結(jié)構(gòu)的得分。這是生成網(wǎng)絡(luò)最令人印象深刻的用途之一,超越了圖像、3D 結(jié)構(gòu)或聲音的美學(xué)生成。
關(guān)于該領(lǐng)域的詳細(xì)信息,請參閱 Medium 上的博文:
《The Delusion of Infinite Precision Numbers》(《無窮精度數(shù)的迷惑》)
https://medium.com/intuitionmachine/the-delusion-of-infinite-precision-numbers-add501a1518d
4. 自我對決是一種自動化的知識創(chuàng)造
AlphaGo 引入的自我對決(Self-play)方法在應(yīng)用程序使用方面上,并沒有深入人心。然而在研究中,OpenAI 的 Dota Five 已經(jīng)證明,自我對決可以解決一個非常困難的 AI 問題(即,即時戰(zhàn)略游戲)。阻止這種使用的主要障礙似乎是在這種場景中框架問題的困難,以及現(xiàn)實問題中存在的多種不確定性。
深度強化學(xué)習(xí)(Deep Reinforcement Learning)在 2018 年遭到了很多嚴(yán)厲的批評,但是 OpenAI 的 Ilya Stuskever 卻對 Dota Five 看似無限的深度強化學(xué)習(xí)可擴展性非常著迷,他比大多數(shù)人更早如此預(yù)測通用人工智能,見 Medium 這篇博文:
《Why AGI is Achievable in Five Years》(《為什么通用人工智能在五年內(nèi)能夠?qū)崿F(xiàn)》)
https://medium.com/intuitionmachine/near-term-agi-should-be-considered-as-a-possibility-9bcf276f9b16
盡管強化學(xué)習(xí)可擴展性得到了明顯的驗證,仍然有一些新論文對深度強化學(xué)習(xí)的穩(wěn)健性提出了質(zhì)疑,如論文《Are Deep Policy Gradient Algorithms Truly Policy Gradient Algorithms?》(《深度策略梯度算法是否真的是策略梯度算法?》https://arxiv.org/abs/1811.02553v2)
我個人傾向于支持內(nèi)在激勵方法而不是深度強化學(xué)習(xí)方法。原因在于,大多數(shù)難題的回報函數(shù)(reward)都是稀疏的,有些還具有欺騙性。
5. 直覺機器將縮小語義鴻溝
當(dāng) Yoshua Bengio 開始使用雙重過程理論(Dual Process theory)來解釋深度學(xué)習(xí)的局限性時,你就知道他在正確的軌道上。
因此,深度學(xué)習(xí)機器就是人工直覺(Artificial intuition)的想法,在 2018 年已經(jīng)成為主流。雖然,雙重過程理論是人類思維的一個很好的模型,但我們需要更充分地理解直覺思維的豐富性(System 1),直覺思維不僅僅是快速思考,也不僅僅是攤銷推理(Amortized inference)。人類大腦中有很多東西我們還沒有在深度學(xué)習(xí)中復(fù)制出來,請參閱 Medium 上的這篇博文:
《Where is the Artificial Ingenuity in Deep Learning?》(《深度學(xué)習(xí)里的人工智能在何處?》)
https://medium.com/intuitionmachine/the-key-to-general-intelligence-is-the-mechanism-of-artificial-ingenuity-dad26bc99043
6. 可解釋性是無法實現(xiàn)的
現(xiàn)在的問題是,總體來說,我們在理解深度學(xué)習(xí)網(wǎng)絡(luò)的本質(zhì)方面并沒有取得任何進(jìn)展。越來越多的和我們認(rèn)知相悖的研究被發(fā)布出來,打破了我們關(guān)于深度學(xué)習(xí)網(wǎng)絡(luò)應(yīng)該如何工作的理論。DeepMind 就拋出了一個打破認(rèn)知的 “破壞性” 研究成果:
《Deep Learning’s Uncertainty Principle》(《深度學(xué)習(xí)的不確定性原理》)
https://medium.com/intuitionmachine/deep-learnings-uncertainty-principle-13f3ffdd15ce
接著就是神經(jīng)網(wǎng)絡(luò)的對抗性重編程(Adversarial Reprogramming),論文《Adversarial Reprogramming of Neural Networks》(《神經(jīng)網(wǎng)絡(luò)的對抗性重編程》https://arxiv.org/abs/1806.11146)證明了可以使用對抗特征來對神經(jīng)網(wǎng)絡(luò)進(jìn)行重編程。在論文中他們演示了如何破壞在 Imagenet 中訓(xùn)練的 MNIST 分類網(wǎng)絡(luò):
神經(jīng)網(wǎng)絡(luò)內(nèi)部發(fā)生了什么,我們對其的理解仍然是遠(yuǎn)遠(yuǎn)不夠的。
至于如何做出直觀的解釋,我認(rèn)為這仍然是一個 “富饒” 的領(lǐng)域,還需要進(jìn)行更多的研究。2018 年是暴露出許多深度學(xué)習(xí)局限性的一年,在這一年里,我們在開發(fā)更好的人機界面方面的進(jìn)展并不大。請參閱 Medium 的這篇博文:
《Fake Intuitive Explanations in AI》(《人工智能中虛假直覺的解釋》)
https://medium.com/intuitionmachine/achieving-fake-explanations-in-ai-5e63b289a3ef
7. 深度學(xué)習(xí)研究信息泛濫成災(zāi)
今年,關(guān)于深度學(xué)習(xí)的論文數(shù)量翻了一番。更槽糕的是,審稿人的素質(zhì)卻在急劇下降。因此,雜訊比已跌至谷底。現(xiàn)在,每個人都需要在堆積如山的新研究論文中為自己篩選出真正有價值的研究。有些工具,如 SemanticScholar、Arxiv Sanity 和 Brundage Bot 等論文網(wǎng)站都可以用來幫助你了解其中的大量信息。只是那些真正新穎的發(fā)現(xiàn),卻太容易成為 “漏網(wǎng)之魚”,讓人錯過。
8. 通過教學(xué)環(huán)境實現(xiàn)工業(yè)化
深度學(xué)習(xí)在工業(yè)化方面,并沒有進(jìn)展。
2018 年是人工智能結(jié)盟問題變得更加清晰的一年。
人工智能結(jié)盟對人工智能教學(xué)環(huán)境至關(guān)重要。目前有幾個團隊已經(jīng)發(fā)布了他們的框架,這些框架可以在強化學(xué)習(xí)實驗中提供更好的再現(xiàn)性(參見:Facebook Horizon、OpenAI Baselines、DeepMind TRFL)。
Facebook Horizon:https://code.fb.com/ml-applications/horizon/
OpenAI Baselines:https://github.com/openai/baselines
DeepMind TRFL:https://deepmind.com/blog/trfl/
我們已經(jīng)目睹了遷移學(xué)習(xí)從虛擬環(huán)境到真實環(huán)境的進(jìn)展(參見:OpenAI Learning Dexterity,(https://blog.openai.com/learning-dexterity/))。我們還見證了通過稀疏回報來教授復(fù)雜技能的進(jìn)展,請參閱 Medium 上的這篇博文:
《How to Bootstrap Complex Skills with Unknown Rewards》(《如何使用未知回報引導(dǎo)復(fù)雜技能》)
https://medium.com/intuitionmachine/how-to-learn-complex-skills-with-unknown-rewards-27a105429e6b
9. 會話認(rèn)知
我最終描繪了一幅如何獲得會話認(rèn)知更為清晰的路線圖。不幸的是,表中提到的 “達(dá)到第三階段” 意味著必須完成這份列表中的第 5 項,而這在未來幾年內(nèi)不太可能發(fā)生。因此,在未來幾年內(nèi)人們不大可能會獲得會話認(rèn)知。唯一的好處就是,這種認(rèn)知概念已經(jīng)被認(rèn)可。也就是說,它已成為一個已知的未知。
作者提到的路線圖,參閱:https://medium.com/intuitionmachine/conversational-cognition-a-new-approach-to-agi-95486ffe581f
要了解其中的重要發(fā)展節(jié)點,參閱:
《A New Capability Maturity Model for Deep Learning》(《一種新的深度學(xué)習(xí)能力成熟度模型》)
https://medium.com/intuitionmachine/an-advanced-capability-maturity-level-for-artificial-general-intelligence-b300dafaca3f
10. 人工智能的道德應(yīng)用
人們終于意識到這個問題了!最值得注意的是,美國加利福尼亞州議會要求,聊天機器人必須主動聲明它們不是人類。
法國人感到驚慌失措,于是制定了 “人類的人工智能”(AI for Humanity)計劃,有關(guān)詳情,請參見 Medium 這篇博文:
《Six Months Later, France has Formulated their Deep Learning Strategy》(《六個月后,法國制定了深度學(xué)習(xí)戰(zhàn)略》)
https://medium.com/intuitionmachine/six-months-later-france-has-released-their-deep-learning-strategy-d2cbf18927d
在人工智能武器化方面上,許多公司也已經(jīng)劃清了界限:
《Drawing the Ethical Line on Weaponized Deep Learning Research》(《為深度學(xué)習(xí)研究武器化劃定道德底線》)
https://medium.com/intuitionmachine/drawing-the-ethical-line-on-weaponized-a-i-research-316e865e9d18
當(dāng)然,問題在于,我們的經(jīng)濟體系更傾向于給人工智能賦予 “人格”,而不是“制造” 真正的人類。詳情請參閱 Medium 這篇博文:
《Artificial Personhood is the Root Cause Why A.I. is Dangerous to Society》(《人工人格是人工智能危害社會的根本原因》)
最終,對于人工智能研究人員來說,他們必須決定自己是想一輩子向孩子們出售糖水呢,還是做一些真正有意義的事情,請參閱 Medium 上的這篇博文:
《Is the Purpose of Artificial Intelligence to Sell Sugar Water?》(《人工智能的目的是出售糖水么?》)
https://medium.com/intuitionmachine/is-the-purpose-of-ai-to-sell-sugar-water-e6466d574ec0
結(jié)語
總之,回顧 2018 年,對于我年初做出的預(yù)測,現(xiàn)在看來,很多都做過了頭。
鑒于此,我必須降低對 2019 年的期望。
我們開始意識到,在指定回報函數(shù)并基于這些回報進(jìn)行優(yōu)化的整個機器學(xué)習(xí)范式中,存在著重大的復(fù)雜性問題。這種學(xué)習(xí)范式只會讓你的系統(tǒng)學(xué)會利用回報函數(shù)。很多時候,盡管看似取得了明顯的進(jìn)展,但底層系統(tǒng)學(xué)會的往往只是在測試中作弊。這是一個元級別的問題,不可能一蹴而就。在提高課程學(xué)習(xí)質(zhì)量方面,我們充其量只能取得漸進(jìn)式的進(jìn)步。
《Fooled by the Ungameable Objective》(《不可玩目標(biāo)的愚弄》)
https://medium.com/intuitionmachine/the-illusion-of-the-ungameable-objective-538a96a53efe
注:其中 “Ungameable” 是作者生造的詞,用來形容一套沒有任何漏洞的規(guī)則。譯者進(jìn)行了意譯。
請繼續(xù)關(guān)注我對 2019 年的深度學(xué)習(xí)預(yù)測。
-
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5507瀏覽量
121272 -
AI芯片
+關(guān)注
關(guān)注
17文章
1892瀏覽量
35099
原文標(biāo)題:年度打臉!2018 年深度學(xué)習(xí)發(fā)展速度被嚴(yán)重高估
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論