在NVIDIA,我們正在開發(fā)AI解決方案,以使通用的人形機器人能夠理解人類世界,遵循語言指示并執(zhí)行各種任務。強大的視覺語言動作(VLA)模型對于此類高級功能至關(guān)重要。為此,我們開發(fā)了GR00T N1,這是一種通用的機器人模型,該模型在包括以上為中心的人類視頻,真實和模擬的機器人軌跡以及合成數(shù)據(jù)的各種數(shù)據(jù)集中訓練。
GR00T N1在多個機器人實施方案的模擬基準中優(yōu)于模擬基準中的最先進的模仿學習模型。此外,它在家用任務中表現(xiàn)出對傅立葉GR-1和1X類人生物的有效語言雙層操作。
為了幫助AI解決我們社會中最關(guān)鍵的問題,我們通過NVIDIA ISAAC GR00T獲得允許的許可,使模型開放權(quán)重。
GROOT N1是英偉達公司推出的全球首個開源基礎模型,專為通用人形機器人設計。它基于多模態(tài)輸入(如語言和圖像)能夠在多樣化環(huán)境中執(zhí)行操作任務。該模型基于大規(guī)模人形機器人數(shù)據(jù)集進行訓練,結(jié)合了真實數(shù)據(jù)、合成數(shù)據(jù)和互聯(lián)網(wǎng)視頻數(shù)據(jù),以便適應特定機器人形態(tài)、任務和環(huán)境。GROOT N1采用雙系統(tǒng)架構(gòu),其中視覺-語言模型負責推理和規(guī)劃,而擴散變換器則負責生成精確動作。在模擬和真實世界測試中,GROOT N1表現(xiàn)出色,尤其在復雜多步任務和精準操作中展現(xiàn)出明顯優(yōu)勢,為材料處理、包裝和檢查等應用提供了高效解決方案。
NVIDIA ISAAC GR00T N1:人形機器人的開放基礎模型
GROOT N1? 的核心優(yōu)勢與特點總結(jié):
NVIDIA GROOT N1采用的是雙系統(tǒng)架構(gòu),包括視覺-語言模型和擴散變換器。
- 視覺-語言模型(System 2):基于NVIDIA-Eagle和SnolLM-1.7B構(gòu)建,負責用視覺和語言指令理解環(huán)境,進行推理和規(guī)劃,輸出動作計劃。
- 擴散變換器(System 1):作為動作模型,將視覺-語言模型的計劃轉(zhuǎn)化為精確的連續(xù)動作,控制機器人運動。
此外,NVIDIA GROOT N1在數(shù)據(jù)策略方面,預訓練數(shù)據(jù)包括互聯(lián)網(wǎng)視頻數(shù)據(jù)、合成數(shù)據(jù)和真實機器人數(shù)據(jù)。 無監(jiān)督學習從大規(guī)模未標注的人類視頻數(shù)據(jù)中提取運動模式,從而提高了機器人的學習效率。
核心優(yōu)勢?
- ?首創(chuàng)開源基礎模型?
- 全球首個專為通用人形機器人設計的開源基礎模型,推動技術(shù)共享與生態(tài)協(xié)作。
- ?多模態(tài)融合能力?
- 支持語言、圖像等多模態(tài)輸入,適應復雜環(huán)境中的動態(tài)任務需求。
- ?數(shù)據(jù)多樣性訓練?
- 結(jié)合真實數(shù)據(jù)、合成數(shù)據(jù)及互聯(lián)網(wǎng)視頻數(shù)據(jù),提升模型在形態(tài)、任務和環(huán)境上的泛化能力。
- ?高精度動作生成?
- 通過擴散變換器(Diffusion Transformer)生成精確動作,解決復雜操作難題。
- ?應用場景廣泛?
- 在材料處理、包裝、檢查等任務中表現(xiàn)優(yōu)異,尤其擅長多步驟操作與精準控制。
?技術(shù)特點?
- ?雙系統(tǒng)架構(gòu)設計?
- ?視覺-語言模型?:負責任務推理與規(guī)劃,理解環(huán)境語義;
- ?擴散變換器?:專注于動作序列生成,實現(xiàn)毫米級操作精度。
- ?跨環(huán)境適應性?
- 模擬與真實世界測試均驗證其穩(wěn)定性和可靠性,可快速部署至多樣化場景。
- ?人形機器人專用優(yōu)化?
- 針對人形機器人的物理結(jié)構(gòu)與運動邏輯進行深度適配,強化動作連貫性。
- ?開源生態(tài)支持?
- 開放模型架構(gòu)與訓練框架,助力開發(fā)者定制化開發(fā)與行業(yè)應用拓展。
?主要功能?:
- 通用操作任務執(zhí)行:GROOT N1能在多樣化環(huán)境中執(zhí)行各種操作任務,如抓取、搬運以及雙臂協(xié)調(diào)操作等。
- 多模態(tài)輸入處理:該機器人能夠同時處理語言指令和視覺圖像,根據(jù)自然語言指令執(zhí)行復雜的操作任務。
- 跨機器人形態(tài)適應性:GROOT N1能適應不同類型的機器人平臺,如Fourier GR-1和1X Neo,實現(xiàn)通用性。
- 復雜任務推理與規(guī)劃:它能執(zhí)行需要持續(xù)上下文理解和多種技能整合的復雜多步任務。
- 高效數(shù)據(jù)利用與訓練:結(jié)合互聯(lián)網(wǎng)規(guī)模數(shù)據(jù)、合成數(shù)據(jù)和真實機器人數(shù)據(jù)進行預訓練,顯著提升性能和泛化能力,減少對大規(guī)模標注數(shù)據(jù)的依賴。
?總結(jié)?
GROOT N1 通過多模態(tài)融合、雙系統(tǒng)協(xié)同與高精度動作生成,為人形機器人提供了高效、通用的智能解決方案,是工業(yè)自動化與復雜環(huán)境作業(yè)領域的突破性技術(shù)。
-
開源
+關(guān)注
關(guān)注
3文章
3486瀏覽量
43014 -
英偉達
+關(guān)注
關(guān)注
22文章
3888瀏覽量
92543 -
人形機器人
+關(guān)注
關(guān)注
4文章
578瀏覽量
17033 -
大模型
+關(guān)注
關(guān)注
2文章
2824瀏覽量
3467
發(fā)布評論請先 登錄
相關(guān)推薦
NVIDIA發(fā)布GR00T N1基礎模型等方案,人形機器人開發(fā)效率顯著提升
NVIDIA Isaac GR00T N1開源人形機器人基礎模型+開源物理引擎Newton加速機器人開發(fā)
NVIDIA發(fā)布全球首個開源人形機器人基礎模型Isaac GR00T N1
機器人Blue亮相 搭載英偉達最新GR00T N1人形機器人通用基礎模型

深度解讀GR00T N1:英偉達開源人形機器人功能模型的技術(shù)革新與行業(yè)影響
NVIDIA 發(fā)布全球首個開源人形機器人基礎模型 Isaac GR00T N1——并推出加速機器人開發(fā)的仿真框架

評論