動物們在田野上馳騁、在樹上靈巧地攀爬、在跌倒之前迅速站穩腳跟。
和我們的靈長類表親一樣,人類也可以運用拇指和精細的運動技能來完成一些任務,比如毫不費力地剝開柑橘皮,或者在黑暗的走廊里尋找正確的鑰匙。
雖然行走和抓取對許多生物來說是小菜一碟,但機器人在步態移動和靈巧性方面一直不盡人意。
如今,Hwangbo等人在Science Robotics雜志上撰文,報告證明了這樣了一件有趣的事:某種機器人軟件設計方法需要數據驅動,而這種方法正好能夠克服機器人和人工智能研究領域中長期存在的一個挑戰,即模擬與現實之間的差距。
幾十年來,機器人專家在預測性數學模型(稱為經典控制理論)基礎上建立軟件,以此來引導機器人肢體的行動。然而,這種方法在引導機器人肢體完成行走、攀爬和抓取這些看似簡單的問題上卻無效。
機器人通常在模擬中開始它的生命。當它的引導軟件在虛擬世界中表現良好時,該軟件就會被放置在機器人體內,然后隨機器人一起進入現實世界。
在現實世界里,機器人難免會不斷地遇到難以預測的狀況,包括表面摩擦、結構靈活性、振動、傳感器延遲以及具有時差的執行器,一般執行器將能量轉化為運動指令。
不幸的是,這些狀況是不可能事先由數學運算詳盡描述的。因此,即使是在模擬中表現出色的機器人,遇到一些看似微小的物理障礙后也會磕磕絆絆,甚至摔倒。
Hwangbo等人將經典控制理論與機器學習技術相結合,研究出一種縮小類似差距的方法。
首先,該團隊設計了一個中型四足機器人的傳統數學模型,名為ANYmal(如上圖)。
接下來,他們從引導機器人肢體運動的執行器中收集數據。
然后,他們將收集的數據輸入被稱為神經網絡的機器學習系統中,建立第二個模型,而這個模型可以自動預測AMYmal機器人肢體的特殊運動。
最后,該團隊將訓練好的神經網絡插入第一個模型中,并在標準臺式計算機上運行混合模型。
混合模擬器比基于分析模型的模擬器速度更快,精準度更高。更重要的是,機器人的運動在混合模擬器中優化之后,轉移進機器人體內,并連入現實世界,這時,機器人在現實世界的行動就像在模擬器里一樣成功。
這個姍姍來遲的突破終結了看似不可逾越的模擬與現實鴻溝。
Hwangbo等人使用的方法還暗示了機器人領域的另一個重大轉變。
混合模型的出現是這一重大轉變的第一步。下一步將是徹底淘汰分析模型,取而代之的是機器學習模型,這種模型將由機器人在現實環境中所收集的數據進行訓練。
目前,這種稱為端到端培訓的純數據方法發展勢頭迅猛。媒體已報道了一些創新的應用,包括鉸接式機器人手臂、多指機械手、無人機,甚至自動駕駛汽車。
機器人專家仍在鉆研如何強化計算速度、豐富傳感器數據以及提高機器學習算法質量。目前尚不清楚大學是否應該停止教授經典控制理論。
然而,筆者認為這是一個不祥之兆:未來的機器人的行走不再依賴專家,相反,他們可以利用自己身體里的數據進行學習。
當然,不少挑戰仍然存在,其中最主要的是可擴展性的挑戰。
到目前為止,端到端培訓機制僅應用于只有少量執行器的物理機器人之上。執行器越少,描述機器人運動所需的參數就越少,模型就越簡單。實現可擴展性的途徑可能包括使用更多層次和模塊化的機器學習架構。
想要知道端到端控制是否可以擴大到引導擁有數十個執行器的復雜機器,包括人形機器人,以及諸如制造工廠或智能城市(使用數字技術改善市民生活的城市地區)等大型系統,還需要做進一步研究。
另一個挑戰是低技術性,高個性化。
對一些研究人員來說,從使用相對簡單的數學模型到應用“潘多拉盒子”機器學習系統(其中的內部工作原理未知)的轉變,標志著洞察力悄然退場,失控感油然而生。對我來說,看到機器人像孩子一樣學會自己走路讓我感到心滿意足。
Hwangbo等人提出的見解也可以從心靈之謎的角度來考慮。意識一直是人類本性中最古老的謎題之一。
人類對自我意識的定義十分模糊。然而,人們對機器人軟件的研究可以讓我們深入了解關于人類思維的古老問題。
我們可以推測,自我意識以及由此延伸出來的意識,其核心是我們抽象思考自己的能力的一種表現,即自我模仿。一個人能看得越遠,他對未來展望的心理圖景就越詳細,自我意識能力就越強。
現在,機器人能夠學習自我模擬。這一突破不僅實用,可以減輕一些工程的負擔,而且,它標志著機器人自主時代的開始。
-
機器人
+關注
關注
211文章
28497瀏覽量
207450 -
AI
+關注
關注
87文章
31090瀏覽量
269415
原文標題:機器人開始自主學習,是人類福祉,還是定時炸彈?
文章出處:【微信號:worldofai,微信公眾號:worldofai】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論