10月27日消息,據(jù)外媒報(bào)道,約翰斯霍普金斯大學(xué)博士生安德魯洪特(Andrew Hundt) 近日發(fā)布一篇新論文,指出應(yīng)通過正強(qiáng)化法訓(xùn)練機(jī)器人學(xué)習(xí)新技能。
這篇論文的核心思想是,在訓(xùn)練機(jī)器人的過程中,應(yīng)采用正強(qiáng)化法,即相比于在它做錯(cuò)時(shí)進(jìn)行懲罰,更應(yīng)在它做對(duì)時(shí)進(jìn)行激勵(lì)。而對(duì)于機(jī)器人來說,這種激勵(lì)機(jī)制是以評(píng)分系統(tǒng)的形式呈現(xiàn)的,類似玩游戲一樣,根據(jù)執(zhí)行任務(wù)的情況獲得積分。
安德魯表示,這種方法能夠大大縮短訓(xùn)練機(jī)器人執(zhí)行任務(wù)的時(shí)間。“機(jī)器人希望能得到更高的分?jǐn)?shù),所以它們很快就可以完成相關(guān)任務(wù)。過去機(jī)器人需要一個(gè)月的練習(xí)才能達(dá)到100%的準(zhǔn)確性,現(xiàn)在只用兩天就能做到。”
不過他也指出,目前機(jī)器人執(zhí)行的這些任務(wù)仍然是比較初級(jí)的,比如堆積木。但在未來,機(jī)器人有望通過正強(qiáng)化法完成更復(fù)雜和有意義的任務(wù)。
責(zé)任編輯:YYX
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
相關(guān)推薦
動(dòng)態(tài)互動(dòng)的。
該理論強(qiáng)調(diào)智能行為源于智能體的物理存在和行為能力,智能體必須具備感知環(huán)境并在其中執(zhí)行任務(wù)的能力。具身智能的實(shí)現(xiàn)涵蓋了機(jī)器學(xué)習(xí)、人工智能、機(jī)器人學(xué)、計(jì)算機(jī)視覺、自然語言處理及強(qiáng)化學(xué)
發(fā)表于 12-20 19:17
的。
這種理論強(qiáng)調(diào),智能行為源于智能體的物理存在和行為能力,智能體必須具備感知環(huán)境并在其中執(zhí)行任務(wù)的能力。
具身智能的實(shí)現(xiàn)涵蓋了機(jī)器學(xué)習(xí)、人工智能、機(jī)器人學(xué)、計(jì)算機(jī)視覺、自然語言處理和強(qiáng)化學(xué)習(xí)
發(fā)表于 11-11 10:20
NVIDIA 在本周于德國慕尼黑舉行的機(jī)器人學(xué)習(xí)大會(huì)(CoRL)上發(fā)布了全新 AI 和仿真工具以及工作流。機(jī)器人開發(fā)者可以使用這些工具和工作流,大大加快 AI 機(jī)器人(包括人形機(jī)器人)
發(fā)表于 11-09 11:52
?262次閱讀
近日,據(jù)TechCrunch報(bào)道,麻省理工學(xué)院的研究團(tuán)隊(duì)展示了一種創(chuàng)新的機(jī)器人訓(xùn)練模型,該模型突破了傳統(tǒng)模仿學(xué)習(xí)方法的局限,不再依賴標(biāo)準(zhǔn)數(shù)據(jù)集,而是借鑒了大型語言模型(LLM)如GPT-4等所使用的大規(guī)模信息處理方式,為
發(fā)表于 11-04 14:56
?485次閱讀
能力。 機(jī)器人能夠通過學(xué)習(xí)和訓(xùn)練,不斷優(yōu)化自身的行為和性能,實(shí)現(xiàn)更高效、更智能的工作。 自然語言處理與理解 : 隨著自然語言處理技術(shù)的進(jìn)步,機(jī)器人開始具備理解和表達(dá)情感的能力,能夠更好
發(fā)表于 10-25 09:27
?838次閱讀
由于涉及復(fù)雜的動(dòng)力學(xué),為四足機(jī)器人制定有效的運(yùn)動(dòng)策略是機(jī)器人領(lǐng)域面臨的重大挑戰(zhàn)。在現(xiàn)實(shí)世界中訓(xùn)練四足機(jī)器人上下樓梯可能會(huì)損壞設(shè)備和環(huán)境,因此,在學(xué)習(xí)
發(fā)表于 09-06 14:48
?533次閱讀
在機(jī)器人學(xué)中,三大矩陣主要指的是與機(jī)器人位移、速度和力相關(guān)的矩陣,它們分別揭示了機(jī)器人在不同空間(如關(guān)節(jié)空間和作業(yè)空間)之間的映射關(guān)系。這三大矩陣及其關(guān)系式可以概括如下: 1. T矩陣(變換矩陣
發(fā)表于 09-04 09:37
?1290次閱讀
預(yù)訓(xùn)練和遷移學(xué)習(xí)是深度學(xué)習(xí)和機(jī)器學(xué)習(xí)領(lǐng)域中的兩個(gè)重要概念,它們?cè)谔岣吣P托阅堋p少訓(xùn)練時(shí)間和降低
發(fā)表于 07-11 10:12
?1015次閱讀
理解機(jī)器學(xué)習(xí)中的訓(xùn)練集、驗(yàn)證集和測(cè)試集,是掌握機(jī)器學(xué)習(xí)核心概念和流程的重要一步。這三者不僅構(gòu)成了模型學(xué)習(xí)
發(fā)表于 07-10 15:45
?3806次閱讀
豐富的知識(shí)儲(chǔ)備。它們可以涵蓋各種領(lǐng)域的知識(shí),并能夠回答相關(guān)問題。靈活性與通用性: AI大模型機(jī)器人具有很強(qiáng)的靈活性和通用性,能夠處理各種類型的任務(wù)和問題。持續(xù)學(xué)習(xí)和改進(jìn): 這些模型可以通過持續(xù)的訓(xùn)練
發(fā)表于 07-05 08:52
觀眾展示了用于人形機(jī)器人學(xué)習(xí)的通用基礎(chǔ)模型 Project GR00T(代表通用機(jī)器人 00 技術(shù))。Project GR00T 利用 NVIDIA Isaac 機(jī)器人平臺(tái)的各種工具來創(chuàng)建用于人形
發(fā)表于 06-04 18:00
?7694次閱讀
NVIDIA 宣布與 Intrinsic.ai 就工業(yè)機(jī)器人任務(wù)的基礎(chǔ)技能模型學(xué)習(xí)展開合作。
發(fā)表于 05-17 10:33
?1249次閱讀
NVIDIA Isaac機(jī)器人平臺(tái)近期實(shí)現(xiàn)重大升級(jí),通過引入最新的生成式AI技術(shù)和先進(jìn)的仿真技術(shù),顯著加速了AI機(jī)器人技術(shù)的發(fā)展步伐。該平臺(tái)正不斷擴(kuò)展其基礎(chǔ)模型、機(jī)器人學(xué)習(xí)框架、AI工作流編排以及
發(fā)表于 03-27 10:36
?671次閱讀
RGB顏色空間由紅綠藍(lán)三種基本色組成,疊加成任意色彩,同樣地,任意一種顏色也可以拆解為三種基本色的組合,機(jī)器人通過顏色坐標(biāo)值來理解“顏色”。
發(fā)表于 03-13 10:07
?298次閱讀
星動(dòng)紀(jì)元,這家專注于人形機(jī)器人技術(shù)的創(chuàng)新公司,近日宣布計(jì)劃將其訓(xùn)練框架Humanoid-Gym進(jìn)行開源。Humanoid-Gym是一個(gè)為人形機(jī)器人設(shè)計(jì)的訓(xùn)練框架,其開源將極大地推動(dòng)人形
發(fā)表于 03-06 18:13
?2042次閱讀
評(píng)論