Dactyl AI的研究人員成功研究出一種自學算法,它能讓機器人的手具有很高的靈活性。他們研究出的算法使機器手能靈活地操縱一個立方體,這個過程在計算機模擬中相當于進行了百年的練習(盡管實際只有幾天的時間)。
機器人的手還遠不及人類的敏捷,而且如果想應用在工廠或倉庫里也顯得太笨拙了。即便如此,這項研究依然顯示了機器學習的潛力。它還表明,有一天,機器人可能會在虛擬世界中自學新技能,這將大大加快編程或訓練它們的進程。
這個機器人系統被稱為“Dactyl”,是由位于硅谷的非營利組織OpenAI的研究人員開發的。它使用了一個來自英國公司稱為“影子”的現成的機器手,一個普通的相機,以及一個已經掌握了一個龐大的多人在線視頻游戲的DotA算法,它使用了同樣的自學方法。
該算法使用一種稱為強化學習的機器學習技術。Dactyl的任務是操縱一個立方體,把不同的面翻到上面來。通過不斷的試錯,會產生預期的結果。
視頻顯示,Dactyl能夠非常敏捷地旋轉立方體。它自動地找出了人類常用的幾個抓點。但這項研究也顯示了人工智能還有很長的路要走:在經過了數百年的虛擬訓練之后,機器人成功地操縱了魔方的概率只有13/50,這遠遠超過了兒童所需要的時間。
麻省理工學院名譽教授、Rethink Robotics公司的創始人Rodney Brooks表示:“短期內,它不適合被應用于工業流程,但研究依然是一件好事。” Rethink Robotics公司是一家生產更智能工業機器人的初創公司。
強化學習的靈感來自于動物通過積極反饋學習的方式。它最初在幾十年前就被提出了,但隨著人工神經網絡的進步,在最近幾年才被證明是可行的。Alphabet旗下的DeepMind利用強化學習技術創建了AlphaGo。這是一個計算機程序,它學會了高超的技能來玩極其復雜和微妙的棋盤游戲。
其他機器人研究人員對這種方法進行了一段時間的測試,但由于模仿現實世界的復雜性和不可預測性,他們一直難有突破。OpenAI的研究人員通過在虛擬世界中引入隨機變量來解決這個問題,這樣機器人就可以學習如何解釋諸如摩擦、機器人硬件噪音以及立方體部分處于視線之外的問題。
該機器人背后的工程師之一Alex Ray表示,通過賦予它更強的處理能力和引入更多的隨機性,可以提高Dactyl的性能。“我認為我們還沒有達到極限,”他說。Ray補充說,目前還沒有計劃將這項技術商業化。他的團隊專注于開發最強的通用學習方法。
“這很難做好,”密歇根大學專門研究機器操縱的專家Dmitry Berenson說,“目前還不清楚最新的機器學習方法將會帶來多大影響。我們付出了很多努力來為特定的任務提供合適的方法。”但他認為,模擬學習可能是非常有用的:“如果我們能夠真正地跨越‘現實差距’,學習就會變得更加容易。
-
機器人
+關注
關注
211文章
28468瀏覽量
207370 -
機器學習
+關注
關注
66文章
8422瀏覽量
132743
原文標題:在算法中練習百年后,機器人的手能比你更靈活嗎?
文章出處:【微信號:robot-1hjqr,微信公眾號:1號機器人網】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論