據外媒CNET報道,創建一個可以解開魔方的算法相對簡單。但是,如果在沒有人類幫助的情況下解開魔方可能是一個完全不同的任務。加利福尼亞大學的Stephen McAleer和他的同事們認為他們已經解決了這個問題,并采用了一個稱為“自學的漸進迭代”的過程。
McAleer和他的團隊稱這個過程為“一種新型的強化學習算法,能夠教導算法如何在沒有人類協助的情況下解開魔方?!?他們聲稱,這種學習算法可以在30步內解開100%的隨機打亂魔方 - 這和人類的表現不相上下或優于人類的表現。
這種類型的算法與在棋類游戲中超越人類表現的算法有區別。這些系統是“強化學習”系統。這個系統在完成解魔方后會查看是否每個提議的步驟都是一種改進。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
算法
+關注
關注
23文章
4607瀏覽量
92838 -
強化學習
+關注
關注
4文章
266瀏覽量
11246
原文標題:GGAI 前沿 | 機器學習算法現在可以在沒有人類幫助的情況下解開魔方
文章出處:【微信號:ggservicerobot,微信公眾號:高工智能未來】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
什么是深度強化學習?深度強化學習算法應用分析
什么是深度強化學習? 眾所周知,人類擅長解決各種挑戰性的問題,從低級的運動控制(如:步行、跑步、打網球)到高級的認知任務。
發表于 07-01 10:29
?1439次閱讀
深度強化學習實戰
內容2:課程一: TensoRFlow入門到熟練:課程二:圖像分類:課程三:物體檢測:課程四:人臉識別:課程五:算法實現:1、卷積神經網絡CNN2、循環神經網絡RNN3、強化學習DRL4、對抗性生成
發表于 01-10 13:42
懶惰強化學習算法在發電調控REG框架的應用
惰性是人類的天性,然而惰性能讓人類無需過于復雜的練習就能學習某項技能,對于人工智能而言,是否可有基于惰性的快速學習的方法?本文提出一種懶惰
發表于 01-16 17:40
?921次閱讀
基于PPO強化學習算法的AI應用案例
Viet Nguyen就是其中一個。這位來自德國的程序員表示自己只玩到了第9個關卡。因此,他決定利用強化學習AI算法來幫他完成未通關的遺憾。
發表于 07-29 09:30
?2795次閱讀
機器學習中的無模型強化學習算法及研究綜述
強化學習( Reinforcement learning,RL)作為機器學習領域中與監督學習、無監督學習并列的第三種
發表于 04-08 11:41
?11次下載
基于強化學習的偽裝攻擊檢測算法
在移動霧計算中,霧節點與移動終端用戶之間的通信容易受到偽裝攻擊,從而帶來通信和數據傳輸的安全問題?;谝苿屿F環境下的物理層密鑰生成策略,提出一種基于強化學習的偽裝攻擊檢測算法。構建移動
發表于 05-11 11:48
?5次下載
強化學習的基礎知識和6種基本算法解釋
定標記訓練數據的情況下獲得正確的輸出 無監督學習(UL):關注在沒有預先存在的標簽的情況下發現數據中的模式 強化學習(RL) : 關注智能體
7個流行的強化學習算法及代碼實現
作者:Siddhartha Pramanik 來源:DeepHub IMBA 目前流行的強化學習算法包括 Q-learning、SARSA、DDPG、A2C、PPO、DQN 和 TRPO。這些算法
基于強化學習的目標檢測算法案例
摘要:基于強化學習的目標檢測算法在檢測過程中通常采用預定義搜索行為,其產生的候選區域形狀和尺寸變化單一,導致目標檢測精確度較低。為此,在基于深度強化學習的視覺目標檢測
發表于 07-19 14:35
?0次下載
評論