在线视频久,亚洲片在线,一区二区高清视频

強化學習之父Richard S. Sutton認為，過去70年來AI研究的最大教訓，就是我們過于依賴人類的既有知識，輕視了智能體本身的學習能力，將本該由智能體發揮自身作用“學習和搜索”變成了人類主導“記錄和灌輸”。未來這種現象應該改變，也必須改變。

近日，強化學習之父、加拿大計算機科學家Richard S. Sutton在其個人網站上發文，指出了過去70年來AI研究方面的苦澀教訓：我們過于依靠人類知識了。

Sutton認為，過去70年來，AI研究走過的最大彎路，就是過于重視人類既有經驗和知識，研究人員在訓練AI模型時，往往想將人類知識灌輸給智能體，而不是讓智能體自己去探索。這實際上只是個記錄的過程，并未實現真正的學習。

事實證明，這種基于人類知識的所謂”以人為本“的方法，并未收到很好的效果，尤其是在可用計算力迅猛增長的大背景下，在國際象棋、圍棋、計算機視覺等熱門領域，智能體本身已經可以自己完成”規模化搜索和學習“，取得的效果要遠好于傳統方法。

Sutton由此認為，過去的教訓必須總結，未來的研究中，應該讓AI智能體能夠像我們一樣自己去發現，而不是將我們發現的東西記下來，因為后者只會讓我們更難以了解發現的過程究竟是怎樣的。

以下為文章原文：

在過去70年中，人工智能研究中得出的一個最大教訓是，通用化的方法最終往往是最有效的，而且能夠大幅提升性能。造成這個結果的最終原因是摩爾定律，或者說，是摩爾定律總結出的計算力隨時間的變化趨勢。

大多數人工智能研究都有個假設前提，即智能體的可用計算力是一個不變的常量，也就是說，提升性能的方法可能就只有利用人類自己的知識了。但是，如果項目周期比一般情況較長時，一定會有豐富的計算力可以投入使用。從短期來看，研究人員可以利用自己掌握的相關領域的人類知識來換取性能提升，但從長遠來看，唯一重要的還是計算力。

我們完全沒有必要讓這兩者相互對立起來，但實際上，它們往往就是相互對立的。項目時間有限，把時間花在計算力上，就不能花在人類知識的利用上。研究人員在心理上往往會偏向某一種方式。人類知識方法往往使解決問題的方法變得復雜化，與利用利用計算力得出的通用化方法相比，適應性上不如前者。

不少AI研究人員用了很長時間才明白這個教訓，所以我覺得這個問題值得單獨拿出來講一講。

過去70年AI研究的深刻教訓：靠人類知識，遠不如靠智能體自己

1997年，IBM的計算機“深藍”擊敗了世界冠軍卡斯帕羅夫，“深藍”的開發就是基于大規模的深度搜索。而當時，大多數計算機象棋研究人員采用的方法，都是利用人類對國際象棋特殊結構的理解。

當一個簡單的、基于搜索的方法在專門的軟硬件上顯示出強大性能時，彼時基于人類知識的國際象棋研究人員沮喪地表示，這次“野蠻搜索“可能壓倒了人類的經驗和知識，取得了勝利，但這無論如何不是人們下棋的方式。這些研究人員一直希望基于“人類知識”的方法能夠獲勝，因為沒有實現這一點，他們的失望溢于言表。

計算機圍棋中也出現了類似的研究模式，不過比國際象棋遲來了20年。研究人員希望通過人類知識或棋局的獨有特征，來避開大規模搜索，但所有這些努力都證明是用錯了地方，而且，在搜索大規模應用之后，這種錯誤顯得更加明顯了。

同樣重要的是，通過智能體的自我學習來學習價值功能。像大規模搜索一樣，AI需要通過自對弈和通用學習來提升性能，實現大規模的計算應用。

搜索和學習是在AI研究中利用計算力的兩種最重要的技術。在計算機圍棋中，研究人員最初的方向也是利用人類知識，搜索用的比較少，很長時間以后，才通過搜索和學習獲得了更大的成功。

在語音識別方面，早期的研究利用了一系列基于人類知識的專門方法：詞匯、音素、人類聲道知識等。而比較新的方法更偏向統計性，并且計算量更大，基于隱馬爾可夫模型（HMM）。與國際象棋和圍棋一樣，在語音識別領域，同樣是統計方法戰勝了基于人類知識的方法。這導致所有NLP研究在近幾十年內發生了重大變化，統計和計算在這一領域占據了主導地位。最近的語音識別領域中，深度學習的興起是這個趨勢的最新體現。

深度學習方法對人類知識的依賴更少，應用了更多的計算，以及對大量訓練集的學習，生成性能更高語音識別系統。和棋類對弈一樣，研究人員一開始總是想讓系統按照人類的思維的方式運作，試圖將人類知識放輸入系統，但事實證明，最終是適得其反，而且極大地浪費了研究人員的時間。隨著計算力的迅速增長，研究人員也找到了能夠高效利用計算力的方式。

在計算機視覺領域也是如此，早期研究將“視覺”設想為搜索的邊緣或廣義圓柱體。但今天這一切都被拋棄了。現代深度學習神經網絡僅使用卷積和某些不變性的概念，并且表現得更好。

這是一個很大的教訓。我們仍然沒有完全理解這個領域，因為我們會繼續犯下同樣的錯誤。要看到這一點，并從中總結教訓，即建立我們認為理解自身思考方式的體系，從長遠來看解決不了問題，AI研究從重“人類知識”到重“計算和搜索”的演進過程，已經證明了這一點。

回顧過去，我們可以總結出下面幾點認識：

1）AI研究人員經常想要將知識傳給智能體

2）這個方式在短期內總是會有效，研究人員本人可以獲得滿意結果。

3）從長遠來看，這種方式對未來的性能提升沒有幫助，甚至有阻礙作用，

4）AI的突破性進展最終要通過基于搜索和學習進行規模化計算的方法來實現。

對于AI研究而言，最終的成功可能反而會充滿了苦澀，很多人往往理解不了，因為它戰勝的是“以人為本”的老方法。

要讓智能體自己去搜索和發現，而不是靠人類

通用方法具備強大功能，即使可用計算力已經非常強大，我們仍然可以通過增加計算力來擴展的方法。而基于計算力的搜索和學習可以按照這一方向任意擴展下去。

第二個教訓是，人類思維的實際內容的復雜程度是無可比擬的，我們不應該在嘗試尋找關于思維內容的簡單方法，如對空間、對象，多智能體或對稱性的思維內容的簡單方法。

所有這些在本質上都是復雜的外部世界的一部分，它們的復雜性是無窮無盡的，我們應該集中精力構建可以找到并捕獲這種任意復雜性的”元方法“。構建這種“元方法”的關鍵在于，智能體能夠找到很好的近似結果，但是具體執行搜索、進行發現的應該是智能體自己，而不是我們。我們希望AI智能體能夠像我們一樣自己去發現，而不是將我們發現的東西記下來，因為后者只會讓我們更難以了解發現的過程究竟是怎樣的。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

AI

AI

+關注

關注
87

文章
31155

瀏覽量
269488
智能體

智能體

+關注

關注
1

文章
158

瀏覽量
10596
強化學習

強化學習

+關注

關注
4

文章
268

瀏覽量
11270

原文標題：強化學習之父：AI研究70年教訓深刻，未來探索要靠智能體自己

文章出處：【微信號：AI_era，微信公眾號：新智元】歡迎添加關注！文章轉載請注明出處。

馬斯克預言：AI將全面超越人類智力

，到2025年底之前，AI的智力水平將有望超越單個人類的智力。而到了2027年至2028年間，AI

發表于 12-28 14:23 ?222次閱讀

AI在環境可持續發展方面的作用

近日，《聯合國氣候變化框架公約》締約方會議第二十九次會議（COP29）在阿塞拜疆巴庫落下帷幕，與會者們齊聚于此，共同應對氣候變化。AI 在環境可持續發展方面的作用成為了本屆大會關注的焦點。

發表于 11-27 11:24 ?298次閱讀

名單公布！【書籍評測活動NO.51】具身智能機器人系統 | 了解AI的下一個浪潮！

，這是機器人技術在理解和響應人類情感方面的一個重要步驟；谷歌的 Atlas 機器人和特斯拉的 Tesla Bot 展示了在物理能力和智能控制方面的先進成果；豐田的 T-HR3 機器人

發表于 11-11 10:20

雷迪埃已有70多年的歷史，讓我們來看看70年來的發展歷程吧！

行業芯事行業資訊

上海雷迪埃
發布于 :2024年10月16日 11:30:18

AI for Science：人工智能驅動科學創新》第4章-AI與生命科學讀后感

農業、環保等，為人類社會的可持續發展做出貢獻。總結《AI for Science：人工智能驅動科學創新》第4章關于AI與生命科學的部分，為我們展示

發表于 10-14 09:21

《AI for Science：人工智能驅動科學創新》第二章AI for Science的技術支撐學習心得

的重要作用和價值，同時也看到了其面臨的挑戰和未來發展方向。這次學習不僅豐富了我的知識儲備，還激發了我對AI for Science未來發展的期待和熱情。我相信，在不久的將來，AI fo

發表于 10-14 09:16

名單公布！【書籍評測活動NO.44】AI for Science：人工智能驅動科學創新

芯片設計的自動化水平、優化半導體制造和封測的工藝和水平、尋找新一代半導體材料等方面提供幫助。第6章介紹了人工智能在化石能源科學研究、可再生能源科學研究、能源轉型三個

發表于 09-09 13:54

平衡創新與倫理：AI時代的隱私保護和算法公平

方面的立法和標準存在差異，這不僅給全球化的企業運營帶來挑戰，也影響了全球用戶權益的平等保護。國際組織應當發揮引領作用，推動制定統一的AI倫理框架，同時鼓勵各國根據自身國情調整和實施。 AI技術

發表于 07-16 15:07

羅杰·瑞迪:AI能力已遠超我們人類

，AI作為一個新興且強大的“物種”，其能力已遠遠超越了我們人類，這種超越不僅體現在計算能力上，更在于其持續學習、自我優化的能力，預示著一個全新時代的到來。

發表于 07-05 14:10 ?357次閱讀

藍牙模塊在車載導航方面的應用知識分析

藍牙模塊在車載導航方面的應用知識分析藍牙作為一種近距離通信技術，目前已標配車載行業，如下從以下幾個藍牙協議方面講述下藍牙車載導航藍牙基礎知識學習介紹 1：HFP 全稱為Hands F

發表于 06-21 17:11 ?1023次閱讀

智謀紀 AI+Multi LED 打開人類健康新寶藏

技術。智謀紀創始人&CEO朱東亮先生受邀出席論壇，帶來題為《AI+ Multi LED，打開人類健康新寶藏》的專題演講。演講精彩瞬間回顧：AI+ Multi LED，智謀紀AI照明

發表于 06-17 12:23 ?344次閱讀

學習串口屏需要了解哪些方面的知識

學習串口屏需要掌握的知識主要包括以下幾個方面

發表于 06-05 09:41 ?446次閱讀

名單公布！【書籍評測活動NO.33】做了50年軟件開發，總結出60條經驗教訓，每一條都太扎心！

柯達公司工作了 18 年，曾擔任過攝影研究科學家、軟件開發人員、軟件經理及軟件過程和質量改進領導。Karl 擁有伊利諾伊大學的有機化學博士學位。 Karl 共著有

發表于 05-17 14:36

risc-v多核芯片在AI方面的應用

多核芯片在AI方面的應用具有廣闊的前景和巨大的潛力。隨著技術的不斷進步和應用的深入，我們期待看到更多基于RISC-V多核芯片的AI解決方案在實際應用中得到驗證和推廣。

發表于 04-28 09:20

NVIDIA在加速識因智能AI大模型落地應用方面的重要作用介紹

本案例介紹了 NVIDIA 在加速識因智能 AI 大模型落地應用方面的重要作用。生成式大模型已廣泛應用于各領域，通過學習人類思維方式，能快速挖掘海量內容，滿足不同需求。

發表于 03-29 15:28 ?649次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

70年來AI研究方面的苦澀教訓：我們過于依靠人類知識了

評論

馬斯克預言：AI將全面超越人類智力

AI在環境可持續發展方面的作用

名單公布！【書籍評測活動NO.51】具身智能機器人系統 | 了解AI的下一個浪潮！

雷迪埃已有70多年的歷史，讓我們來看看70年來的發展歷程吧！

AI for Science：人工智能驅動科學創新》第4章-AI與生命科學讀后感

《AI for Science：人工智能驅動科學創新》第二章AI for Science的技術支撐學習心得

名單公布！【書籍評測活動NO.44】AI for Science：人工智能驅動科學創新

平衡創新與倫理：AI時代的隱私保護和算法公平

羅杰·瑞迪:AI能力已遠超我們人類

藍牙模塊在車載導航方面的應用知識分析

智謀紀 AI+Multi LED 打開人類健康新寶藏

學習串口屏需要了解哪些方面的知識

名單公布！【書籍評測活動NO.33】做了50年軟件開發，總結出60條經驗教訓，每一條都太扎心！

risc-v多核芯片在AI方面的應用

NVIDIA在加速識因智能AI大模型落地應用方面的重要作用介紹