近日,據TechCrunch報道,麻省理工學院的研究團隊展示了一種創新的機器人訓練模型,該模型突破了傳統模仿學習方法的局限,不再依賴標準數據集,而是借鑒了大型語言模型(LLM)如GPT-4等所使用的大規模信息處理方式,為機器人學習新技能開辟了全新的道路。
傳統的模仿學習方法中,機器人通過觀察和模仿執行任務的人類或其他代理進行學習。然而,這種方法在面對諸如照明變化、不同環境或新障礙等小挑戰時,往往因為缺乏足夠的數據而難以適應。為了克服這一難題,麻省理工學院的研究團隊探索了一種新的解決方案,他們借鑒了大型語言模型的強大數據處理能力,并引入了異構預訓練變壓器(HPT)這一創新架構。
新論文的主要作者王立睿指出,與語言領域的數據以句子形式存在不同,機器人領域的數據具有高度的異質性。因此,如果想以類似語言模型的方式進行預訓練,就需要構建一種全新的架構。HPT正是這樣一種架構,它能夠整合來自不同傳感器和環境的多樣信息,并利用變壓器技術將這些數據匯總到訓練模型中。值得注意的是,變壓器的規模越大,其輸出效果也越好。
在使用該新型訓練模型時,用戶只需輸入機器人的設計、配置以及期望完成的任務,系統便能根據這些信息為機器人提供所需的技能。這一創新不僅提高了機器人學習的效率和靈活性,還為實現更廣泛、更復雜的機器人應用奠定了堅實的基礎。
卡內基梅隆大學副教授戴維·赫爾德對這項研究給予了高度評價。他表示,我們的夢想是擁有一個通用的機器人大腦,用戶可以直接下載并使用它,而無需進行任何額外訓練。雖然目前我們還處于這一愿景的早期階段,但借助規?;膬瀯?,我們有望在機器人策略方面取得像大型語言模型那樣的突破性進展。
-
機器人
+關注
關注
211文章
28380瀏覽量
206918 -
LLM
+關注
關注
0文章
286瀏覽量
327
發布評論請先 登錄
相關推薦
評論