色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器人如何獲得能夠有效泛化到各種現實世界物體和環境的技能?

Tensorflowers ? 來源:未知 ? 作者:胡薇 ? 2018-07-12 17:08 ? 次閱讀

盡管設計一套能夠在受控環境中有效執行重復任務的機器人系統(例如,在裝配線上組裝產品)十分平常,但設計一種能夠觀察周圍環境和確定最佳行動方案,同時對意外結果做出反應的機器人卻非常困難。

不過,有兩種工具可以幫助機器人從經驗中獲得這些技能:深度學習和強化學習。前者非常適合處理非結構化的現實世界場景,而后者可以實現更長期的推理,同時展現出更復雜、更強大的順序決策能力。如果將這兩種技術結合,將有可能讓機器人不斷地從經驗中學習,使它們能夠通過數據而非人為設計來掌握基本的感覺運動技能。

設計用于機器人學習的強化學習算法本身提出了一系列挑戰:現實世界的物體具有各種各樣的視覺和物理屬性,接觸力的細微差別都可能會使物體運動難以預測,并且相關物體可能會受到遮擋。此外,機器人傳感器本身具有噪聲,這也增加了復雜性。所有這些因素綜合到一起,使得學習一個通用解異常困難,除非訓練數據足夠多樣化,然而,收集這樣的數據又十分耗時。

這就促使人們去探索一種能夠有效重用過往經驗的學習算法,類似于我們之前一項關于抓取的研究,這項研究就受益于大數據集。不過,這項研究無法推斷動作的長期后果,而這一點對學習如何抓取十分重要。例如,如果多個物體聚集在一起,那么將其中一個分開(稱為“分割”)將使得抓取更容易,即使這樣做與成功抓取并無直接關聯。

分割示例

為了提高效率,我們需要采用脫策強化學習,這種算法可以從數小時、數天或數周前收集的數據中學習。為了設計這樣一種可以利用從歷史互動中獲得的大量不同經驗的脫策強化學習算法,我們將大規模分布式優化與一個新的擬合深度 Q 學習算法(我們稱之為 QT-Opt)相結合。arXiv 上提供了預印本。

QT-Opt 是一種分布式 Q 學習算法,支持連續動作空間,非常適合解決機器人問題。為了使用 QT-Opt,我們首先使用已收集的數據以完全離線的方式訓練模型。此過程不需要運行真正的機器人,因而更易于擴展。然后,我們在真正的機器人上部署并微調該模型,使用新收集的數據進一步訓練模型。通過運行 QT-Opt,我們得以積累更多的離線數據,這使得我們能夠訓練出更好的模型,而這反過來又有利于收集更好的數據,從而形成一個良性循環。

為了將這種方法應用于機器人抓取,我們使用了 7 個現實世界的機器人,在 4 個月的時間里,機器人總共運行了 800 個小時。為了引導收集過程,我們首先使用手動設計的策略,成功率為 15-30%。在表現提升后,數據收集轉向學到的模型。策略利用相機圖像并返回手臂和抓手的移動方式。離線數據包含對 1000 多種不同物體的抓取。

使用的一些訓練物體

通過過去的研究,我們已經發現在機器人之間共享經驗可以加快學習速度。我們將此訓練和數據收集過程擴展到 10 個 GPU、7 個機器人和多個 CPU,因此得以收集和處理包含超過 580,000 次抓取嘗試的大型數據集。在這個過程的最后,我們成功訓練了一種抓取策略,此策略在現實世界機器人上運行并且可以泛化到訓練時未見過的各種具有挑戰性的物體。

七個機器人正在收集抓取數據

從量化角度來看,在關于以前未見過物體的 700 次抓取試驗中,QT-Opt 方法的抓取成功率達到 96%。先前基于監督式學習的抓取方法的成功率為 78%,相比之下,新方法將錯誤率降低了五倍以上。

評估時使用的物體

為了使任務具有挑戰性,我們增加了物體尺寸、

紋理和形狀的多樣性

值得注意的是,策略展現出了標準機器人抓取系統中少見的各種閉環、反應性行為:

? 當面對一組無法一起拾起的聯鎖塊時,策略先將一個塊與其他塊分開,然后再將它拾起。

? 當面對難以抓取的物體時,策略會推算出它應該調整抓手位置并重新抓取,直到抓牢為止。

? 當在一堆物體中抓取時,策略會探測不同的物體,直到抓手緊緊握住一個物體時才會將它拾起。

? 當我們故意將物體從抓手上弄掉以擾亂機器人時(訓練期間未經歷過這種情況),它會自動重新調整抓手位置,進行另一次嘗試。

最重要的是,這些行為都并非人為設計。這些行為基于 QT-Opt 的自監督式訓練自動出現,因為它們提高了模型的長期抓取成功率。

學到的行為示例

在左側的 GIF 中,策略針對移動的球進行更正

在右側的 GIF 中,策略在多次抓取嘗試后

成功拾起難以抓握的物體

此外,我們發現 QT-Opt 使用較少的訓練數據達到了較高的成功率,盡管收斂時間較長。這對機器人技術來說尤其令人興奮,因為,此領域的瓶頸通常是收集現實機器人數據,而不是訓練時間。將此策略與其他數據效率技術(例如我們之前關于抓取領域自適應的研究)相結合,可以在機器人技術領域開辟一些有趣

總體而言,QT-Opt 算法是一種通用的強化學習方法,在現實世界機器人上表現非常出色。除獎勵定義外,QT-Opt 沒有任何特定于機器人抓取的限制。我們認為這是向更通用的機器人學習算法邁出的重要一步,并期待看到其他適用的機器人任務。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    211

    文章

    28597

    瀏覽量

    207836
  • 深度學習
    +關注

    關注

    73

    文章

    5511

    瀏覽量

    121376
收藏 人收藏

    評論

    相關推薦

    【「具身智能機器人系統」閱讀體驗】2.具身智能機器人的基礎模塊

    非常重要的地位。 先說這個自主機器人的計算系統。計算系統是自主機器人的關鍵部件。自主機器人通過智能計算系統與物理世界交互,自主地完成任務。通常會包括幾個關鍵的模塊,分別是傳感模塊,感知
    發表于 01-04 19:22

    《具身智能機器人系統》第10-13章閱讀心得之具身智能機器人計算挑戰

    取特征點,涉及大量像素級比較運算;優化機器人位姿,需要迭代求解大規模矩陣方程。書中提出了模塊的硬件加速方案,闡述了如何以因子圖為通用模版,以求解非線性優化問題為橋梁,面向多種機器人應用進行加速。 第11
    發表于 01-04 01:15

    NVIDIA技術推動機器人仿真

    借助機器人仿真,開發人員能夠在基于物理學的現實世界數字呈現中對機器人進行虛擬訓練、測試和驗證。
    的頭像 發表于 01-03 14:10 ?150次閱讀

    開源項目!能夠精確地行走、跳舞和執行復雜動作的機器人—Tillu

    學習者和愛好者的理想伙伴。 創新設計 Tillu的設計靈感來自廣受歡迎的Otto DIY機器人,其設計過程包括在Fusion 360中進行CAD建模和精確的3D打印,以實現從堅固的伺服驅動腿部模塊
    發表于 01-02 17:24

    【「具身智能機器人系統」閱讀體驗】2.具身智能機器人大模型

    能夠利用\"思維鏈\"的技術將復雜任務分解為多個子任務,以漸進的方式解決問題。這不僅提高了任務的成功率,也顯著增強了系統的魯棒性,使得機器人可以更高效地應對復雜環境和多樣需求
    發表于 12-29 23:04

    【「具身智能機器人系統」閱讀體驗】1.初步理解具身智能

    影響與發展,提供了全球及國內行業趨勢的見解。書中詳細討論了這一新興領域面臨的諸多挑戰,從應用的不確定性、昂貴的成本倫理問題,為讀者呈現了當前形勢的現實視角。 接下來,書中深入探討了具身智能機器人的歷史
    發表于 12-28 21:12

    《具身智能機器人系統》第7-9章閱讀心得之具身智能機器人與大模型

    和經驗積累,使機器人能夠自主發現工藝規律,優化作業參數。家庭服務機器人則采用混合任務規劃策略:將預訓練的基礎技能與實時規劃相結合,靈活應對開放環境
    發表于 12-24 15:03

    【「具身智能機器人系統」閱讀體驗】+數據在具身人工智能中的價值

    100 倍 。此外,Sim2Real 技術的進步也促進了技能與知識從模擬環境實際應用的轉移。這項技術在虛擬空間中訓練機器人和 AI 系統,使它們
    發表于 12-24 00:33

    【「具身智能機器人系統」閱讀體驗】+初品的體驗

    提高機器人的自適應性和自主性,賦能機器人在多種場景中的應用。例如在家庭自動領域,具身智能機器人能夠感知家庭成員的日常習慣和需求,自動執行清
    發表于 12-20 19:17

    《具身智能機器人系統》第1-6章閱讀心得之具身智能機器人系統背景知識與基礎模塊

    將大模型的\"大腦\"裝入物理實體的\"身軀\",讓AI真正走進現實世界。這種革新不僅體現在稚暉君開源的人形機器人方案,更在“AI教母”李飛飛的VoxPoser
    發表于 12-19 22:26

    機器人仿真的類型和優勢

    機器人仿真使機器人工程師和研究人員能夠創建機器人及其環境的虛擬模型。這項技術支持在仿真的無風險環境
    的頭像 發表于 10-14 10:43 ?586次閱讀
    <b class='flag-5'>機器人</b>仿真的類型和優勢

    通過多樣的幾何形狀來訓練機器人從仿真現實轉換的裝配技能

    的部件。在多品種的小批量制造中(即小批量生產各種產品的流程),機器人還必須適應不同的零件、姿態和環境。在保持高精度和高準確度的前提下實現這種適應性是機器人技術所面臨的一大挑戰。 得益于
    的頭像 發表于 08-20 10:39 ?1066次閱讀
    通過多樣的幾何形狀來訓練<b class='flag-5'>機器人</b>從仿真<b class='flag-5'>到</b><b class='flag-5'>現實</b>轉換的裝配<b class='flag-5'>技能</b>

    Al大模型機器人

    豐富的知識儲備。它們可以涵蓋各種領域的知識,并能夠回答相關問題。靈活性與通用性: AI大模型機器人具有很強的靈活性和通用性,能夠處理各種類型
    發表于 07-05 08:52

    NVIDIA發布幾項新功能來幫助機器人專家和工程師打造智能機器人

    ? 機器人技術在智能制造設施、商用廚房、醫院、倉儲物流和農業領域等各種環境中的應用正在迅速擴大。該行業正在向智能自動轉型,因此要求機器人
    的頭像 發表于 06-29 15:14 ?1167次閱讀
    NVIDIA發布幾項新功能來幫助<b class='flag-5'>機器人</b>專家和工程師打造智能<b class='flag-5'>機器人</b>

    碼垛機器人適用環境有哪些

    ? ? ? ? ? 碼垛機器人作為一種自動、職能的生產設備,在多個領域都得到了廣泛應用。其強大的適用性和靈活度使得它可以在各種環境中效高
    的頭像 發表于 05-14 16:21 ?370次閱讀
    主站蜘蛛池模板: 把内衣脱了把奶露出来| 国产精品18久久久久久白浆.| 成人在线小视频| 男女AA片免费| 99国产精品成人免费视频| 美女18黄| 99国产精品白浆在线观看免费| 久久中文字幕人妻熟AV女蜜柚M| 中文无码字慕在线观看| 亚洲精品无码一区二区三区四虎| 国产精品视频一区二区猎奇 | 欧美激情视频在线观看一区二区三区| 91精品免费久久久久久久久| 龙腾亚洲人成电影网站| 99re久久热在线播放快| 琪琪伦伦影院理论片| 高h gl肉文| 亚洲国产精品一区二区三区在线观看 | 色愁愁久久久| 孕妇bbwbbwbbwbbw超清| 久久99免费视频| 67194成网页发布在线观看| 年轻老师毛茸茸自由性| 成品片a免人看免费| 校草让我脱了内裤给全班看| 国内精品免费久久影院| 在线观看日韩一区| 欧美性动漫3d在线观看完整版| 大睾丸内射老师| 亚洲AV无码专区国产乱码网站| 久久精品国产色蜜蜜麻豆国语版| 最近中文字幕2018MV高清在线| 琪琪see色原网色原网站| 国产精品久久久久久人妻香蕉| 伊人久久大香线蕉观看| 欧美精品九九99久久在观看| 国产精品久久久久久久人人看| 早乙女由依在线观看| 秋霞伦理高清视频在线| 国产在线不卡| 99无码熟妇丰满人妻啪啪|