70年來, 人們在AI領域“一直連續犯著同樣的錯誤”。
這是“強化學習之父”理查德·薩頓(Richard S. Sutton)為同行后輩們敲響的警鐘。
他在博客上發表最新文章《苦澀的教訓》(The Bitter Lesson),總結了AI發展史上的怪圈:
人類不斷試圖把自己的知識和思維方式植入到AI之中,比如用人類的思路教AI下棋、將讓AI按照人類總結的思路來識別圖像等等。這些做法,能帶來暫時的性能提升,長期來看卻會阻礙研究的持續進步。
真正的突破,總是來自完全相反的方向。摒棄人類在特定領域的知識、利用大規模算力的方法,總會獲得最終勝利。
靠自我對弈磨煉圍棋技藝的AlphaGo,基于統計方法、深度學習來識別語音、圖像的算法,一次次擊敗先前那些濃縮了人類知識的AI,甚至人類自己。
搜索、學習,充分利用大規模算力才是王道。用人類在特定領域的知識來提升AI智能體的能力,都是在走彎路。
薩頓說:“將AI建立在我們對自身思維方式的認知上,是行不通的。”
OpenAI首席科學家Ilya Sutskever精辟地總結了薩頓的核心觀點:算力常勝。
文章一發出,就引發了熱烈的討論,OpenAI CTO Greg Brockman、特斯拉AI總監Andrej Karpathy等人都在轉發附議。
DeepMind機器學習團隊主管&牛津大學教授Nando de Freitas甚至稱之為“周末必讀”。
然而,也有反對的聲音。
牛津大學計算機系教授希蒙·懷特森(Shimon Whiteson)連發13條Twitter反駁薩頓的觀點,表示“堅決不同意”,同樣獲得了大量支持。
懷特森認為,構建AI當然需要融入人類知識,問題只在于該何時、如何、融入哪些知識。
AI的歷史進程是一場融入人類知識的勝利。科學家們廣泛嘗試,拋棄失敗的99%,留下有用的1%。而這1%,對現代人工智能算法成功的重要性不亞于薩頓推崇的大量計算資源。
一場隔空論戰,就這樣展開了。
我們先讀完“本周末必讀”的薩頓博文,看看正方的觀點。
苦澀的教訓
回溯70年的AI研究,從中得出的最大經驗是,利用計算力的通用方法最終總是最有效的,而且遙遙領先。
出現這種情況的終極原因是摩爾定律,或者寬泛一點來說,是單位算力成本的持續指數級下降。
大多數AI研究都以智能體可用算力恒定為前提進行,在這種情況下,利用人類知識可能是提升性能的唯一方法。但是,將目光投向比一個典型研究項目更長遠的時間段,就會發現必然有更多可用的算力出現。
為了尋求短期可見的提升,研究人員會利用該領域的人類知識,但從長遠來看,利用算力才是唯一重要的事。
雖然但這兩者看似沒有必要相互對立,但實際上它們往往是對立的。
在一個方向上花費的時間,就必然不能花在另一個方向。對于某一種方法的投入也會帶來心理上的承諾。
同時,用人類知識來提升AI會傾向于使方法復雜化,讓運用算力的通用計算方法變得不太適用。
很多AI研究人員后知后覺地領悟了這種“苦澀的教訓”。回顧其中最重要的一些頗有啟發。
在國際象棋領域,1997年擊敗國際象棋冠軍卡斯帕羅夫的深藍,就是基于大規模深度搜索。
當時,大多數計算機國際象棋研究者都以沮喪的眼光看待它,他們追求用人類對國際象棋特殊結構的理解制勝。
當一種更簡單的、有特殊硬件和軟件加持的基于搜索的方法被證明更有效,這些基于人類知識下國際象棋的研究者輸得一點都“不體面”。他們說,這種“用蠻力”的搜索可能這次能贏,但這終究不是通用策略,無論如何這也不是人類下棋的方式。
他們希望基于人類輸入的方法獲勝,卻事與愿違,只剩失望。
計算機圍棋領域,研究進展也遵循著同樣的模式,只是比國際象棋遲了20年。這一領域最初的眾多努力,都是利用人類知識或游戲的特殊特性避免搜索,然而,搜索一被大規模高效應用,這些努力都變得無關緊要,甚至更糟。
利用自我對弈來學習一種價值函數同樣重要(在許多其他游戲、甚至在國際象棋中也一樣,雖然在1997年的深藍項目中沒有發揮很大作用)。通過自我對弈來學習,以及學習本身,其實都和搜索一樣,讓大規模計算有了用武之地。
搜索和學習是AI研究中應用大規模計算力的兩類最重要技術。
在計算機圍棋和國際象棋項目中,研究人員最初努力的方向是如何去利用人類的理解(這樣就不需要太多的搜索),很久以后,才通過擁抱搜索和學習取得了更大的成功。
在語音識別領域,很早之前曾有一場競賽,1970年由DARPA主辦。
在這場比賽中,一部分參賽者運用那些需要人類知識(單詞知識、音素知識、人類聲道知識等等)的特殊方法。也有一部分人基于隱馬爾可夫模型(HMMs)完成比賽。這種新方法本質上更具統計性質,也需要更大的計算量。
不出所料,最終統計方法戰勝了基于人類知識的方法。
這場比賽為所有自然語言處理任務都帶來了巨大的改變,在過去的幾十年里,統計和算力逐漸占據主導地位。
語音識別中興起沒多久的深度學習,也是朝著這一方向邁出的最新一步。深度學習方法對人類知識的依賴甚至更少,用到了更多的算力。通過在大型訓練集上的學習,能得到更好的語音識別系統。
就像在棋類游戲中一樣,研究人員總是試圖讓系統按照他們心目中的人類的思維方式工作,試圖把這些知識放進計算機的系統里。但最終,當摩爾定律帶來大規模算力,其他人也找到了一種充分利用它的方法時,會發現原來的做法適得其反,是對研究人員時間的巨大浪費。
在計算機視覺領域,也有類似的模式。早期的方法,將視覺設想為搜索邊緣、廣義圓柱體,或者SIFT算法捕捉的特征。但現在,所有這些方法都被拋棄了。現代的深度學習神經網絡,只使用卷積和某些不變性的概念,而效果要好得多。
這些教訓告訴我們,(AI)這個領域,我們仍然沒有完全了解,我們連續犯著同樣的錯誤。
為了認清狀況,有效防止犯錯,我們必須理解這些錯誤有什么吸引力。
我們必須從這”苦澀的教訓”中學習:長遠來看,將AI建立在我們對自身思維方式的認知上是行不通的。
而突破性進展最終會來自完全相反的方法:基于搜索和學習進行規模計算。
最終的成功總是帶來些許怨恨,通常也不被完全理解,因為它超越了當前受歡迎的、以人為中心的方法。
從歷史的教訓中,我們能學到兩點。
第一,通用型方法有強大的力量。即使可用的算力變得非常大,這些方法仍然可以繼續擴展,運用增加的算力。似乎可以按照這種方式任意擴展的方法有兩種:搜索和學習。
第二,思維的實際內容復雜到非常可怕無可救藥。我們不該再試圖尋找簡單的方法來思考其內容,比如,用簡單的方式去思考空間、物體、多智能體或者對稱性。
所有這些,都是隨意、本質上非常復雜的外部世界的一部分。它們不應該內置在任何一個AI智能體中,因為它們復雜得沒有盡頭。相反,我們應該只構建能發現和捕獲這種任意復雜性的元方法,
這種方法的本質是能夠很好地找到近似值。不過,尋找的工作應該交給我們的方法,而不是我們自己。
我們需要的是能像我們一樣進行發現的AI智能體,而不是包含我們已經發現的東西在內的AI。
在我們發現的基礎上建立AI,只會讓它更難看到發現的過程是如何進行的。
原文鏈接:
http://www.incompleteideas.net/IncIdeas/BitterLesson.html
“甜蜜的一課”
堅決不同意薩頓觀點的懷特森老師認為,構建AI當然需要融入人類知識,問題只在于該何時、如何、融入哪些知識。AI歷史上有“甜蜜的一課”(The Sweet Lesson),我們在嘗試尋找正確先驗知識的過程中,推動了AI的進步。
他將薩頓的觀點總結為:“AI的歷史告訴我們,利用算力最終總是戰勝利用人類知識。”
以下是懷特森Twitter內容的翻譯整理:
我認為這是對歷史的一種特殊解釋。的確,很多把人類知識融入AI的努力都已經被拋棄,隨著其他資源(不僅僅是計算力,還包括存儲、能源、數據)的豐富,還會拋棄更多。
但是,由此產生的方法的成功,不能僅僅歸功于這些豐富的資源,其中那些沒有被拋棄的人類知識也功不可沒。
要是想脫離卷積、LSTM、ReLU、批歸一化(batchnorm)等等做深度學習,祝你好運。要是拋開“圍棋是靜態、零和、完全可觀察的”這一先驗知識,就像搞定這個游戲,也祝你好運。
所以,AI的歷史故事并非融入人類知識一直失敗。恰恰相反,這是融入人類知識的勝利,實現的路徑也正是一種完全符合慣例的研究策略:嘗試很多方法,拋棄失敗的99%。
剩下的1%對現代人工智能的成功至關重要,就和AI所以來的大量計算資源一樣關鍵。
薩頓說,世界固有的復雜性表明,我們不該把先驗知識融入到系統中。但是我的觀點恰恰相反:正是這種復雜性,導致他推崇的搜索和學習方法極度復雜難解。
只有借助正確的先驗知識,正確的歸納偏見(inductive biases),我們才能掌握這種復雜性。
他說,“現代的深度學習神經網絡,只使用卷積和某些不變性的概念,而效果要好得多。”一個“只”字就凸顯了這種斷言的武斷性。
如果沒有這些卷積和不變性,深度學習就不會成功,但它們卻被視作微小、通用到可以接受。
就是這樣,“苦澀的教訓”避開了主要問題,這根本不是要不要引入人類知識的問題(因為答案顯然是肯定的),而是該問這些知識是什么,該在何時、如何使用它。
薩頓說,“我們需要的是能像我們一樣進行發現的AI智能體,而不是包含我們已經發現的東西在內的AI。”當然。但是我們善于發現正是因為我們天生帶有正確的歸納偏見。
AI歷史上的“甜蜜一課”是這樣的:雖然找到正確的歸納偏見很難,但尋找的過程為原本難解的問題帶來了巨大的進展。
-
摩爾定律
+關注
關注
4文章
635瀏覽量
79095 -
深度學習
+關注
關注
73文章
5507瀏覽量
121272 -
強化學習
+關注
關注
4文章
268瀏覽量
11267
原文標題:只有大規模算力才能救AI?強化學習之父 vs 牛津教授掀起隔空論戰
文章出處:【微信號:worldofai,微信公眾號:worldofai】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論