亚洲最大4438x,午夜宅男网,亚洲成a人片8888kkkk

世界模型在實體機器人上能發揮多大的作用？

教機器人解決現實世界中的復雜任務，一直是機器人研究的基礎問題。深度強化學習提供了一種流行的機器人學習方法，讓機器人能夠通過反復試驗改善其行為。然而，當前的算法需要與環境進行過多的交互才能學習成功，這使得它們不適用于某些現實世界的任務。為現實世界學習準確的世界模型是一個巨大的開放性挑戰。在最近的一項研究中，UC 伯克利的研究者利用 Dreamer 世界模型的最新進展，在最直接和最基本的問題設置中訓練了各種機器人：無需模擬器或示范學習，就能實現現實世界中的在線強化學習。

論文鏈接：https://arxiv.org/pdf/2206.14176.pdf Dreamer 世界模型是谷歌、多倫多大學等機構在 2021 年提出的一種。如下圖 2 所示，Dreamer 從過去經驗的回放緩存中學習世界模型，從世界模型的潛在空間中想象的 rollout 中學習行為，并不斷與環境交互以探索和改進其行為。研究者的目標是在現實世界中推動機器人學習的極限，并提供一個強大的平臺來支持未來的工作。

總體來說，這項研究的貢獻在于： 1、Dreamer on Robots。研究者將 Dreamer 應用于 4 個機器人，無需引入新算法直接在現實世界中展示了成功的學習成果。這些任務涵蓋了一系列挑戰，包括不同的行動空間、感官模式和獎勵結構。

2、1 小時內學會步行。研究者在現實世界中從零開始教四足機器人翻身、站起來并在 1 小時內學會步行。

此外，他們發現機器人會在 10 分鐘內能學會承受推力或快速翻身并重新站起來。

3、視覺拾取和放置。研究者訓練機械臂從稀疏獎勵中學會拾取和放置對象，這需要從像素定位對象并將圖像與本體感受輸入融合。此處學習到的行為優于無模型智能體，并接近人類表現。

4、開源。研究者公開發布了所有實驗的軟件基礎架構，它支持不同的動作空間和感官模式，為未來研究現實世界中機器人學習的世界模型提供了一個靈活的平臺。方法該研究利用 Dreamer 算法（Hafner et al., 2019; 2020）在物理機器人上進行在線學習（online learning），無需模擬器，總體架構如上圖 2 所示。Dreamer 從過去經驗的回放緩沖區中學習世界模型，使用參與者 - 評價者算法從學習模型預測的軌跡中學習行為，并將其行為部署在環境中來不斷提升回放緩沖區。該研究將學習更新與數據收集解耦，以滿足延遲要求并實現快速訓練而無需等待環境變化。在該研究的實現中，一個學習線程持續訓練世界模型和參與者 - 評價者行為，同時一個參與者線程并行計算環境交互動作。世界模型是一個學習預測環境動態的深度神經網絡，如下圖 3（a）所示。

世界模型可以被認為是機器人自主學習環境的快速模擬器，在探索現實世界時不斷改進其模型。世界模型基于循環狀態空間模型 (RSSM; Hafner et al., 2018)，它由四個組件組成：

世界模型表征了與任務無關的動態知識，而參與者 - 評價者算法負責學習特定于當前任務的行為。如上圖 3(b) 所示。該研究從在世界模型的潛在空間中預測的 rollout 中學習行為，而無需解碼觀察結果。這可以在單個 GPU 上以 16K 的批大小進行大規模并行行為學習，類似于專門的現代模擬器 (Makoviychuk et al., 2021)。參與者 - 評價者算法由兩個神經網絡組成：

參與者網絡的作用是為每個潛在模型狀態 s_t 學習成功動作的分布，以最大化未來預測任務獎勵（reward）的總和。評價者網絡通過時間差異學習來學習預測未來任務獎勵的總和（Sutton 和 Barto，2018 ），這允許算法學習長期策略。與 Hafner et al. (2020) 相比，Dreamer 方法沒有訓練頻率超參數，因為學習器優化神經網絡與數據收集并行進行，沒有速率限制。實驗研究者在 4 個機器人上評估了 Dreamer，為每個機器人分配了不同的任務，并將其性能與算法和人類基線進行比較，目的是評估近期學習世界模型的成功是否能夠直接在現實世界中實現樣本高效的機器人學習。這些實驗代表了常見的機器人任務，例如運動、操縱和導航，帶來了各種各樣的挑戰，包括連續和離散的動作、密集和稀疏的獎勵、本體感受和圖像觀察，以及傳感器融合。 A1 機器狗四足步行如圖 4 所示，經過一小時的訓練，Dreamer 學會了不斷地讓機器人從其背部翻過來、站起來，然后向前走。在訓練的前 5 分鐘，機器人設法從背部翻滾過來并用腳著地。20 分鐘后，它學會了如何站起來。大約 1 小時后，機器人學會了一種叉式步態，以所需的速度向前行走。

在成功完成這項任務后，研究者用一根棍子反復敲打機器人的四足來測試算法的魯棒性，如圖 8 所示。在額外在線學習的 10 分鐘內，機器人會適應并承受推力或快速翻身站穩。相比之下，SAC 也很快學會了翻身，但由于數據預算（data budget）太小，無法站立或行走。

UR5 多物體視覺拾取和放置拾取和放置任務在倉庫和物流環境中很常見，需要機械臂將物品從一個箱子運輸到另一個箱子。圖 5 展示了成功拾取和放置的循環。由于獎勵稀疏、需要從像素推斷對象位置以及多個移動對象的挑戰性動態，該任務具有一定挑戰性。

XArm 視覺拾取和放置上面提到的 UR5 機器人是高性能工業機器人，但 XArm 是一種可訪問的低成本 7 DOF 操作，此處任務類似，需要定位和抓取一個柔軟的物體，將其從一個容器移到另一個容器并返回，如圖 6 所示。

Sphero 導航此外，研究者還在視覺導航任務上評估了 Dreamer，該任務需要將輪式機器人操縱到固定目標位置，僅給定 RGB 圖像作為輸入。這里使用了 Sphero Ollie 機器人，一個帶有兩個可控電機的圓柱形機器人，研究者通過 2 Hz 的連續扭矩命令對其進行控制。鑒于機器人是對稱的，并且機器人只能獲得圖像觀察，它必須從觀察歷史中推斷出航向。

2 小時內，Dreamer 學會了快速且始終如一地導航到目標，并保持在目標附近。如圖 7 所示，Dreamer 與目標的平均距離為 0.15（以區域大小為單位測量并跨時間步求平均值）。

審核編輯：李倩

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

機器人

機器人

+關注

關注
211

文章
28390

瀏覽量
206957
算法

算法

+關注

關注
23

文章
4608

瀏覽量
92845

原文標題：1小時學會走路，10分鐘學會翻身，世界模型讓機器人迅速掌握多項技能

文章出處：【微信號：vision263com，微信公眾號：新機器視覺】歡迎添加關注！文章轉載請注明出處。

《具身智能機器人系統》第1-6章閱讀心得之具身智能機器人系統背景知識與基礎模塊

將大模型的\"大腦\"裝入物理實體的\"身軀\"，讓AI真正走進現實世界。這種革新不僅體現在稚暉君開源的人形機器人方案，更在“AI教母”李飛飛的VoxPoser

發表于 12-19 22:26

復合機器人正逐漸在倉儲物流領域發揮重要作用

隨著智能倉儲物流技術的快速發展，復合機器人作為一種先進的自動化設備，正逐漸在倉儲物流領域發揮重要作用。以下是一個復合機器人在智能倉儲物流的應

發表于 12-16 16:56 ?93次閱讀

復合<b class='flag-5'>機器人</b>正逐漸<b class='flag-5'>在</b>倉儲物流領域<b class='flag-5'>發揮</b>重要<b class='flag-5'>作用</b>

FOC電機在機器人技術中的作用

隨著工業自動化和智能制造的快速發展，機器人技術已成為現代工業的重要組成部分。電機作為機器人的動力源，其性能直接影響到機器人的工作效率和穩定性。FOC電機以其高效、精確和靈活的特點，在

發表于 11-21 15:20 ?298次閱讀

解鎖機器人視覺與人工智能的潛力，從“盲人機器”改造成有視覺能力的機器人（上）

正如人類依賴眼睛和大腦來解讀世界，機器人也需要自己的視覺系統來有效運作。沒有視覺，機器人就如同蒙上雙眼的人類，僅能執行預編程的命令，容易碰撞障礙物，并犯下代價高昂的錯誤。這正是機器人視

發表于 10-12 09:56 ?390次閱讀

解鎖<b class='flag-5'>機器人</b>視覺與人工智能的潛力，從“盲人<b class='flag-5'>機器</b>”改造成有視覺能力的<b class='flag-5'>機器人</b>（<b class='flag-5'>上</b>）

構建語音控制機器人 - 線性模型和機器學習

2024-07-31 |Annabel Ng 在該項目的[上一篇博客文章]中，我介紹了運行機器人電機、處理音頻信號和調節電壓所需的電路的基礎知識。然而，機器人還沒有完全完成！盡管

發表于 10-02 16:31 ?208次閱讀

構建語音控制<b class='flag-5'>機器人</b> - 線性<b class='flag-5'>模型</b>和<b class='flag-5'>機器</b>學習

在NVIDIA Isaac Lab中訓練四足機器人運動

由于涉及復雜的動力學，為四足機器人制定有效的運動策略是機器人領域面臨的重大挑戰。在現實世界中訓練四足機器人上下樓梯可能會損壞設備和環境，因此

發表于 09-06 14:48 ?540次閱讀

<b class='flag-5'>在</b>NVIDIA Isaac Lab中訓練四足<b class='flag-5'>機器人</b>運動

在生產制造業中，碼垛機器人發揮的重要作用

?在生產制造業中，碼垛機器人發揮著至關重要的作用，主要體現在以下幾個方面： ?一、題高生產效率 ?碼垛機器人能夠以很高的速度和精度進行碼垛作業，遠遠超過人工碼垛的效率。它可以持續不間斷

發表于 09-02 15:51 ?169次閱讀

Al大模型機器人

金航標kinghelm薩科微slkor總經理宋仕強介紹說，薩科微Al大模型機器人有哪些的優勢?薩科微AI大模型機器人由清華大學畢業的天才少年N博士和王博士團隊開發，與同行相比具有許多優

發表于 07-05 08:52

編碼器在機器人系統中的應用

隨著科技的飛速發展，機器人技術已廣泛應用于工業、醫療、服務等多個領域。在機器人系統中，編碼器作為核心的位置和速度檢測裝置，發揮著至關重要的作用

發表于 06-13 14:51 ?815次閱讀

英偉達發布人形機器人基礎模型

英偉達在一年一度的GTC開發者大會上，由創始人黃仁勛親自揭曉了令人矚目的Project GR00T人形機器人項目，其中引人注目的是一款全新的人形機器人基礎

發表于 03-21 11:43 ?758次閱讀

基礎模型能為機器人帶來怎樣的可能性？

機器人是一種擁有無盡可能性的技術，尤其是當搭配了智能技術時。近段時間創造了許多變革性應用的大模型有望成為機器人的智慧大腦，幫助機器人感知和理解這個世

發表于 01-26 14:47 ?227次閱讀

自動化生產線，工業機器人發揮重要的價值作用

自動化生產線，工業機器人發揮重要的價值作用

發表于 01-09 13:55 ?1517次閱讀

大語言模型在機器人上的應用及面臨的挑戰

。 ? 一些機器人現在能夠理解人類的語言，并與之進行交流。此外，一些新型的智能機器人還具備學習能力。他們可以通過大量的數據和經驗，不斷地優化自己的行為和決策，提高自身的性能。這種能力使得機器人可以

發表于 01-09 00:05 ?1778次閱讀

詳解機器人技術基礎模型

基礎模型在解決機器人技術中的數據稀缺問題上至關重要。它們為使用最少的特定數據學習和適應新任務提供了堅實的基礎。

發表于 01-08 10:44 ?444次閱讀

【開源項目】Emo：基于樹莓派 4B DIY 能笑會動的桌面機器人

置于底座上，并為電源線的自由移動預留了充足的空間。為了提高機器人運動的穩定性，我們還特意使車身與底座輕微接觸。另外，我們特意選擇藍白配色方案，因為藍白組合能提升機器人的視覺吸引力。

發表于 12-26 15:18

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

世界模型在實體機器人上能發揮多大的作用？

評論

《具身智能機器人系統》第1-6章閱讀心得之具身智能機器人系統背景知識與基礎模塊

復合機器人正逐漸在倉儲物流領域發揮重要作用

FOC電機在機器人技術中的作用

解鎖機器人視覺與人工智能的潛力，從“盲人機器”改造成有視覺能力的機器人（上）

構建語音控制機器人 - 線性模型和機器學習

在NVIDIA Isaac Lab中訓練四足機器人運動

在生產制造業中，碼垛機器人發揮的重要作用

Al大模型機器人

編碼器在機器人系統中的應用

英偉達發布人形機器人基礎模型

基礎模型能為機器人帶來怎樣的可能性？

自動化生產線，工業機器人發揮重要的價值作用

大語言模型在機器人上的應用及面臨的挑戰

詳解機器人技術基礎模型

【開源項目】Emo：基于樹莓派 4B DIY 能笑會動的桌面機器人