在线观看伦理,亚洲国产精品一在线观看,亚洲免费网站

70年來，人們在AI領(lǐng)域“一直連續(xù)犯著同樣的錯誤”。這是“強化學(xué)習(xí)之父”理查德·薩頓（Richard S. Sutton）為同行后輩們敲響的警鐘。

他在博客上發(fā)表最新文章《苦澀的教訓(xùn)》(The Bitter Lesson)，總結(jié)了AI發(fā)展史上的怪圈：

人類不斷試圖把自己的知識和思維方式植入到AI之中，比如用人類的思路教AI下棋、將讓AI按照人類總結(jié)的思路來識別圖像等等。這些做法能帶來暫時的性能提升，長期來看卻會阻礙研究的持續(xù)進步。真正的突破，總是來自完全相反的方向。摒棄人類在特定領(lǐng)域的知識、利用大規(guī)模算力的方法，總會獲得最終勝利。靠自我對弈磨煉圍棋技藝的AlphaGo，基于統(tǒng)計方法、深度學(xué)習(xí)來識別語音、圖像的算法，一次次擊敗先前那些濃縮了人類知識的AI，甚至人類自己。搜索、學(xué)習(xí)，充分利用大規(guī)模算力才是王道。用人類在特定領(lǐng)域的知識來提升AI智能體的能力，都是在走彎路。

薩頓說：“將AI建立在我們對自身思維方式的認知上，是行不通的。”O(jiān)penAI首席科學(xué)家Ilya Sutskever精辟地總結(jié)了薩頓的核心觀點：算力常勝。

文章一發(fā)出，就引發(fā)了熱烈的討論，OpenAI CTO Greg Brockman、特斯拉AI總監(jiān)Andrej Karpathy等人都在轉(zhuǎn)發(fā)附議。

DeepMind機器學(xué)習(xí)團隊主管&牛津大學(xué)教授Nando de Freitas甚至稱之為“周末必讀”。

然而，也有反對的聲音。牛津大學(xué)計算機系教授希蒙·懷特森（Shimon Whiteson）連發(fā)13條Twitter反駁薩頓的觀點，表示“堅決不同意”，同樣獲得了大量支持。

懷特森認為，構(gòu)建AI當(dāng)然需要融入人類知識，問題只在于該何時、如何、融入哪些知識。AI的歷史進程是一場融入人類知識的勝利。科學(xué)家們廣泛嘗試，拋棄失敗的99%，留下有用的1%。而這1%，對現(xiàn)代人工智能算法成功的重要性不亞于薩頓推崇的大量計算資源。一場隔空論戰(zhàn)，就這樣展開了。

我們先讀完“本周末必讀”的薩頓博文，看看正方的觀點。

苦澀的教訓(xùn)

回溯70年的AI研究，從中得出的最大經(jīng)驗是，利用計算力的通用方法最終總是最有效的，而且遙遙領(lǐng)先。出現(xiàn)這種情況的終極原因是摩爾定律，或者寬泛一點來說，是單位算力成本的持續(xù)指數(shù)級下降。大多數(shù)AI研究都以智能體可用算力恒定為前提進行，在這種情況下，利用人類知識可能是提升性能的唯一方法。但是，將目光投向比一個典型研究項目更長遠的時間段，就會發(fā)現(xiàn)必然有更多可用的算力出現(xiàn)。為了尋求短期可見的提升，研究人員會利用該領(lǐng)域的人類知識，但從長遠來看，利用算力才是唯一重要的事。

雖然但這兩者看似沒有必要相互對立，但實際上它們往往是對立的。

在一個方向上花費的時間，就必然不能花在另一個方向。對于某一種方法的投入也會帶來心理上的承諾。同時，用人類知識來提升AI會傾向于使方法復(fù)雜化，讓運用算力的通用計算方法變得不太適用。很多AI研究人員后知后覺地領(lǐng)悟了這種“苦澀的教訓(xùn)”。回顧其中最重要的一些頗有啟發(fā)。

在國際象棋領(lǐng)域，1997年擊敗國際象棋冠軍卡斯帕羅夫的深藍，就是基于大規(guī)模深度搜索。當(dāng)時，大多數(shù)計算機國際象棋研究者都以沮喪的眼光看待它，他們追求用人類對國際象棋特殊結(jié)構(gòu)的理解制勝。當(dāng)一種更簡單的、有特殊硬件和軟件加持的基于搜索的方法被證明更有效，這些基于人類知識下國際象棋的研究者輸?shù)靡稽c都“不體面”。他們說，這種“用蠻力”的搜索可能這次能贏，但這終究不是通用策略，無論如何這也不是人類下棋的方式。

他們希望基于人類輸入的方法獲勝，卻事與愿違，只剩失望。計算機圍棋領(lǐng)域，研究進展也遵循著同樣的模式，只是比國際象棋遲了20年。這一領(lǐng)域最初的眾多努力，都是利用人類知識或游戲的特殊特性避免搜索，然而，搜索一被大規(guī)模高效應(yīng)用，這些努力都變得無關(guān)緊要，甚至更糟。利用自我對弈來學(xué)習(xí)一種價值函數(shù)同樣重要（在許多其他游戲、甚至在國際象棋中也一樣，雖然在1997年的深藍項目中沒有發(fā)揮很大作用）。通過自我對弈來學(xué)習(xí)，以及學(xué)習(xí)本身，其實都和搜索一樣，讓大規(guī)模計算有了用武之地。

搜索和學(xué)習(xí)是AI研究中應(yīng)用大規(guī)模計算力的兩類最重要技術(shù)。

在計算機圍棋和國際象棋項目中，研究人員最初努力的方向是如何去利用人類的理解（這樣就不需要太多的搜索），很久以后，才通過擁抱搜索和學(xué)習(xí)取得了更大的成功。

在語音識別領(lǐng)域，很早之前曾有一場競賽，1970年由DARPA主辦。在這場比賽中，一部分參賽者運用那些需要人類知識（單詞知識、音素知識、人類聲道知識等等）的特殊方法。也有一部分人基于隱馬爾可夫模型(HMMs)完成比賽。這種新方法本質(zhì)上更具統(tǒng)計性質(zhì)，也需要更大的計算量。

不出所料，最終統(tǒng)計方法戰(zhàn)勝了基于人類知識的方法。這場比賽為所有自然語言處理任務(wù)都帶來了巨大的改變，在過去的幾十年里，統(tǒng)計和算力逐漸占據(jù)主導(dǎo)地位。語音識別中興起沒多久的深度學(xué)習(xí)，也是朝著這一方向邁出的最新一步。深度學(xué)習(xí)方法對人類知識的依賴甚至更少，用到了更多的算力。通過在大型訓(xùn)練集上的學(xué)習(xí)，能得到更好的語音識別系統(tǒng)。

就像在棋類游戲中一樣，研究人員總是試圖讓系統(tǒng)按照他們心目中的人類的思維方式工作，試圖把這些知識放進計算機的系統(tǒng)里。但最終，當(dāng)摩爾定律帶來大規(guī)模算力，其他人也找到了一種充分利用它的方法時，會發(fā)現(xiàn)原來的做法適得其反，是對研究人員時間的巨大浪費。

在計算機視覺領(lǐng)域，也有類似的模式。早期的方法，將視覺設(shè)想為搜索邊緣、廣義圓柱體，或者SIFT算法捕捉的特征。但現(xiàn)在，所有這些方法都被拋棄了。現(xiàn)代的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)，只使用卷積和某些不變性的概念，而效果要好得多。

這些教訓(xùn)告訴我們，（AI）這個領(lǐng)域，我們?nèi)匀粵]有完全了解，我們連續(xù)犯著同樣的錯誤。為了認清狀況，有效防止犯錯，我們必須理解這些錯誤有什么吸引力。我們必須從這”苦澀的教訓(xùn)”中學(xué)習(xí)：長遠來看，將AI建立在我們對自身思維方式的認知上是行不通的。而突破性進展最終會來自完全相反的方法：基于搜索和學(xué)習(xí)進行規(guī)模計算。最終的成功總是帶來些許怨恨，通常也不被完全理解，因為它超越了當(dāng)前受歡迎的、以人為中心的方法。

從歷史的教訓(xùn)中，我們能學(xué)到兩點。

第一，通用型方法有強大的力量。即使可用的算力變得非常大，這些方法仍然可以繼續(xù)擴展，運用增加的算力。似乎可以按照這種方式任意擴展的方法有兩種：搜索和學(xué)習(xí)。

第二，思維的實際內(nèi)容復(fù)雜到非常可怕無可救藥。我們不該再試圖尋找簡單的方法來思考其內(nèi)容，比如，用簡單的方式去思考空間、物體、多智能體或者對稱性。

所有這些，都是隨意、本質(zhì)上非常復(fù)雜的外部世界的一部分。它們不應(yīng)該內(nèi)置在任何一個AI智能體中，因為它們復(fù)雜得沒有盡頭。相反，我們應(yīng)該只構(gòu)建能發(fā)現(xiàn)和捕獲這種任意復(fù)雜性的元方法，這種方法的本質(zhì)是能夠很好地找到近似值。不過，尋找的工作應(yīng)該交給我們的方法，而不是我們自己。我們需要的是能像我們一樣進行發(fā)現(xiàn)的AI智能體，而不是包含我們已經(jīng)發(fā)現(xiàn)的東西在內(nèi)的AI。

在我們發(fā)現(xiàn)的基礎(chǔ)上建立AI，只會讓它更難看到發(fā)現(xiàn)的過程是如何進行的。

原文鏈接：

http://www.incompleteideas.net/IncIdeas/BitterLesson.html

“甜蜜的一課”

堅決不同意薩頓觀點的懷特森老師認為，構(gòu)建AI當(dāng)然需要融入人類知識，問題只在于該何時、如何、融入哪些知識。AI歷史上有“甜蜜的一課”（The Sweet Lesson），我們在嘗試尋找正確先驗知識的過程中，推動了AI的進步。他將薩頓的觀點總結(jié)為：“AI的歷史告訴我們，利用算力最終總是戰(zhàn)勝利用人類知識。”

以下是懷特森Twitter內(nèi)容的翻譯整理：

我認為這是對歷史的一種特殊解釋。的確，很多把人類知識融入AI的努力都已經(jīng)被拋棄，隨著其他資源（不僅僅是計算力，還包括存儲、能源、數(shù)據(jù)）的豐富，還會拋棄更多。但是，由此產(chǎn)生的方法的成功，不能僅僅歸功于這些豐富的資源，其中那些沒有被拋棄的人類知識也功不可沒。

要是想脫離卷積、LSTM、ReLU、批歸一化（batchnorm）等等做深度學(xué)習(xí)，祝你好運。要是拋開“圍棋是靜態(tài)、零和、完全可觀察的”這一先驗知識，就像搞定這個游戲，也祝你好運。所以，AI的歷史故事并非融入人類知識一直失敗。恰恰相反，這是融入人類知識的勝利，實現(xiàn)的路徑也正是一種完全符合慣例的研究策略：嘗試很多方法，拋棄失敗的99%。剩下的1%對現(xiàn)代人工智能的成功至關(guān)重要，就和AI所以來的大量計算資源一樣關(guān)鍵。

薩頓說，世界固有的復(fù)雜性表明，我們不該把先驗知識融入到系統(tǒng)中。但是我的觀點恰恰相反：正是這種復(fù)雜性，導(dǎo)致他推崇的搜索和學(xué)習(xí)方法極度復(fù)雜難解。只有借助正確的先驗知識，正確的歸納偏見（inductive biases），我們才能掌握這種復(fù)雜性。他說，“現(xiàn)代的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)，只使用卷積和某些不變性的概念，而效果要好得多。”一個“只”字就凸顯了這種斷言的武斷性。如果沒有這些卷積和不變性，深度學(xué)習(xí)就不會成功，但它們卻被視作微小、通用到可以接受。

就是這樣，“苦澀的教訓(xùn)”避開了主要問題，這根本不是要不要引入人類知識的問題（因為答案顯然是肯定的），而是該問這些知識是什么，該在何時、如何使用它。

薩頓說，“我們需要的是能像我們一樣進行發(fā)現(xiàn)的AI智能體，而不是包含我們已經(jīng)發(fā)現(xiàn)的東西在內(nèi)的AI。”當(dāng)然。但是我們善于發(fā)現(xiàn)正是因為我們天生帶有正確的歸納偏見。

AI歷史上的“甜蜜一課”是這樣的：雖然找到正確的歸納偏見很難，但尋找的過程為原本難解的問題帶來了巨大的進展。

原文鏈接：

https://twitter.com/shimon8282/status/1106534185693532160

論戰(zhàn)雙方

這場隔空論戰(zhàn)的雙方，分別是“強化學(xué)習(xí)之父”薩頓，和牛津大學(xué)計算機系教授希蒙·懷特森。都是強化學(xué)習(xí)領(lǐng)域的科學(xué)家，觀點卻截然相反。

強化學(xué)習(xí)之父：薩頓

薩頓，被認為是現(xiàn)代計算強化學(xué)習(xí)的創(chuàng)始人之一，為強化學(xué)習(xí)做出了許多貢獻，比如“時序差分學(xué)習(xí)”（temporal difference learning）和“策略梯度方法”（policy gradient methods）等等。

1978年，薩頓在斯坦福大學(xué)獲得了心理學(xué)學(xué)士學(xué)位，之后才轉(zhuǎn)向計算機科學(xué)，在馬薩諸塞大學(xué)安姆斯特分校獲得博士學(xué)位。他與導(dǎo)師Andrew Barto合著的《強化學(xué)習(xí)導(dǎo)論》一書，已經(jīng)成為強化學(xué)習(xí)研究領(lǐng)域的基礎(chǔ)讀物。目前，薩頓任教于阿爾伯塔大學(xué)，是計算機科學(xué)系的教授和 iCORE Chair，領(lǐng)導(dǎo)強化學(xué)習(xí)和人工智能實驗室。2017年6月，薩頓加入Deepmind，共同領(lǐng)導(dǎo)其位于加拿大埃德蒙頓的辦公室，同時保持他在阿爾伯塔大學(xué)的教授職位。2001年以來，薩頓一直都是AAAI Fellow，在2003年獲得國際神經(jīng)網(wǎng)絡(luò)學(xué)會頒發(fā)的President’s Award，并于2013年獲得了馬薩諸塞大學(xué)阿默斯特分校頒發(fā)的杰出成就獎。

來自牛津大學(xué)的反對者：懷特森

希蒙·懷特森，是牛津大學(xué)計算機系的教授，專注于人工智能和機器學(xué)習(xí)領(lǐng)域。強化學(xué)習(xí)、讓智能體跟著演示學(xué)習(xí)都是他所研究的課題。他2007年獲得美國德克薩斯大學(xué)奧斯汀分校的計算機博士學(xué)位，隨后留校做了一段時間的博士后，然后任教于丹麥阿姆斯特丹大學(xué)。2015年，懷特森成為牛津大學(xué)副教授，2018年成為教授。

隔空論戰(zhàn)，你支持誰？

除了懷特森之外，也有不少人對薩頓的觀點表示不能完全同意。比如Nando de Freitas認為薩頓博文的最后一段非常正確、發(fā)人深省：

我們需要的是能像我們一樣進行發(fā)現(xiàn)的AI智能體，而不是包含我們已經(jīng)發(fā)現(xiàn)的東西在內(nèi)的AI。在我們發(fā)現(xiàn)的基礎(chǔ)上建立AI，只會讓它更難看到發(fā)現(xiàn)的過程是如何進行的。

但他也就著懷特森的觀點，談了一些自己的想法：帝國理工學(xué)院教授、DeepMind高級研究員Murray Shanahan雖然支持不能人工手寫特定領(lǐng)域的先驗知識，但還是認為“應(yīng)該尋找有利于讓AI學(xué)習(xí)這些常識類別的架構(gòu)上的先驗”。

德克薩斯大學(xué)奧斯汀分校的助理教授Scott Niekum說，他大致同意薩頓的觀點，但也有值得商榷的地方，比如科學(xué)從來都不是一條直線，很多最重要的發(fā)現(xiàn)，可能就來自借助內(nèi)建特定領(lǐng)域知識來研究那些不夠通用的模型的過程。

這個問題，你怎么看？

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

AI

AI

+關(guān)注

關(guān)注
87

文章
31490

瀏覽量
269916
強化學(xué)習(xí)

強化學(xué)習(xí)

+關(guān)注

關(guān)注
4

文章
268

瀏覽量
11283

原文標題：只有大規(guī)模算力才能救AI？強化學(xué)習(xí)之父 vs 牛津教授掀起隔空論戰(zhàn)

文章出處：【微信號：mcuworld，微信公眾號：嵌入式資訊精選】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

從堆算力到用算力，寧暢用精裝算力，助力產(chǎn)業(yè)打造智能化摩天大樓

算力

腦極體

發(fā)布于 :2025年01月22日 00:00:50

算智算中心的算力如何衡量？

作為當(dāng)下科技發(fā)展的重要基礎(chǔ)設(shè)施，其算力的衡量關(guān)乎其能否高效支撐人工智能、大數(shù)據(jù)分析等智能應(yīng)用的運行。以下是對智算中心算力衡量的詳細闡述：一、

發(fā)表于 01-16 14:03 ?340次閱讀

<b class='flag-5'>算</b>智<b class='flag-5'>算</b>中心的<b class='flag-5'>算</b><b class='flag-5'>力</b>如何衡量？

企業(yè)AI算力租賃模式的好處

構(gòu)建和維護一個高效、可擴展的AI算力基礎(chǔ)設(shè)施，不僅需要巨額的初期投資，還涉及復(fù)雜的運維管理和持續(xù)的技術(shù)升級。而AI算

發(fā)表于 12-24 10:49 ?181次閱讀

螞蟻集團收購邊塞科技，吳翼出任強化學(xué)習(xí)實驗室首席科學(xué)家

領(lǐng)域的研究與發(fā)展。令人矚目的是，邊塞科技的創(chuàng)始人吳翼已正式加入該實驗室，并擔(dān)任首席科學(xué)家一職。吳翼在其個人社交平臺上對這一變動進行了回應(yīng)。他表示，自己最近接受了螞蟻集團的邀請，負責(zé)大模型強化學(xué)習(xí)領(lǐng)域的研究工

發(fā)表于 11-22 11:14 ?686次閱讀

企業(yè)AI算力租賃是什么

企業(yè)AI算力租賃是指企業(yè)通過互聯(lián)網(wǎng)向?qū)I(yè)的算力提供商租用所需的計算資源，以滿足其AI應(yīng)用的需求。

發(fā)表于 11-14 09:30 ?1026次閱讀

如何使用 PyTorch 進行強化學(xué)習(xí)

強化學(xué)習(xí)（Reinforcement Learning, RL）是一種機器學(xué)習(xí)方法，它通過與環(huán)境的交互來學(xué)習(xí)如何做出決策，以最大化累積獎勵。PyTorch 是一個流行的開源機器學(xué)習(xí)庫，

發(fā)表于 11-05 17:34 ?359次閱讀

AI時代算力的重要性及現(xiàn)狀:平衡發(fā)展與優(yōu)化配置的挑戰(zhàn)

在AI時代，算力扮演著至關(guān)重要的角色。如果說數(shù)據(jù)是AI大模型的“燃料”，那么算力則是其強大的“動

發(fā)表于 11-04 11:45 ?549次閱讀

GPU算力開發(fā)平臺是什么

隨著AI技術(shù)的廣泛應(yīng)用，算力需求呈現(xiàn)出爆發(fā)式增長。AI算力租賃作為一種新興的服務(wù)模式，正逐漸成為

發(fā)表于 10-31 10:31 ?234次閱讀

《算力芯片高性能 CPU/GPU/NPU 微架構(gòu)分析》第1-4章閱讀心得——算力之巔：從基準測試到CPU微架構(gòu)的深度探索

，還優(yōu)化了能效比，使天河二號在Green500榜單上也表現(xiàn)出色。另一方面，MLPerf的出現(xiàn)標志著AI時代對算力需求的變化。它涵蓋了圖像分類、目標檢測、自然語言理解、智能推薦算法、強化學(xué)習(xí)

發(fā)表于 10-19 01:21

青云科技強化AI算力架構(gòu),升級產(chǎn)品與服務(wù)體系

10月9日，青云科技正式揭曉了其升級版的產(chǎn)品與服務(wù)陣容、行業(yè)及場景定制化解決方案，以及全新的生態(tài)戰(zhàn)略。該公司旨在通過AI智算平臺、AI算力云

發(fā)表于 10-10 16:42 ?531次閱讀

名單公布！【書籍評測活動NO.43】算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

力，在全球范圍內(nèi)，對于推動科技進步、經(jīng)濟發(fā)展及社會整體的運作具有至關(guān)重要的作用。隨著信息技術(shù)的高速發(fā)展，高性能計算（HPC）和人工智能（AI）等技術(shù)在多個領(lǐng)域的應(yīng)用變得日益廣泛，芯片

發(fā)表于 09-02 10:09

算力：人工智能發(fā)展的新引擎

的算力支持。但，算力的提升往往伴隨著高昂的成本，維護以及電力消耗都是不小的開支、高性能計算硬件的購置。此外，AI模型的規(guī)模和復(fù)雜性不斷增加

發(fā)表于 08-20 09:48 ?393次閱讀

大模型時代的算力需求

現(xiàn)在AI已進入大模型時代，各企業(yè)都爭相部署大模型，但如何保證大模型的算力，以及相關(guān)的穩(wěn)定性和性能，是一個極為重要的問題，帶著這個極為重要的問題，我需要在此書中找到答案。

發(fā)表于 08-20 09:04

算力系列基礎(chǔ)篇——算力與計算機性能：解鎖超能力的神秘力量！

在《算力系列基礎(chǔ)篇——算力101：從零開始了解算力》中，相信各位粉絲初步了解到人工智能的“發(fā)動機”和核心驅(qū)動力：

發(fā)表于 07-11 08:04 ?104次閱讀

通過強化學(xué)習(xí)策略進行特征選擇

更快更好地學(xué)習(xí)。我們的想法是找到最優(yōu)數(shù)量的特征和最有意義的特征。在本文中，我們將介紹并實現(xiàn)一種新的通過強化學(xué)習(xí)策略的特征選擇。我們先討論強化學(xué)習(xí)，尤其是馬爾可夫決策

發(fā)表于 06-05 08:27 ?395次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

只有提高算力才能發(fā)展AI? 強化學(xué)習(xí)之父薩頓與牛津教授掀起隔空論戰(zhàn)

評論

從堆算力到用算力，寧暢用精裝算力，助力產(chǎn)業(yè)打造智能化摩天大樓

算智算中心的算力如何衡量？

企業(yè)AI算力租賃模式的好處

螞蟻集團收購邊塞科技，吳翼出任強化學(xué)習(xí)實驗室首席科學(xué)家

企業(yè)AI算力租賃是什么

如何使用 PyTorch 進行強化學(xué)習(xí)

AI時代算力的重要性及現(xiàn)狀:平衡發(fā)展與優(yōu)化配置的挑戰(zhàn)

GPU算力開發(fā)平臺是什么

《算力芯片高性能 CPU/GPU/NPU 微架構(gòu)分析》第1-4章閱讀心得——算力之巔：從基準測試到CPU微架構(gòu)的深度探索

青云科技強化AI算力架構(gòu),升級產(chǎn)品與服務(wù)體系

名單公布！【書籍評測活動NO.43】算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

算力：人工智能發(fā)展的新引擎

大模型時代的算力需求

算力系列基礎(chǔ)篇——算力與計算機性能：解鎖超能力的神秘力量！

通過強化學(xué)習(xí)策略進行特征選擇