GR00T N1 由 NVIDIA 推出,是全球首個(gè)開源且完全可定制的通用人形機(jī)器人基礎(chǔ)模型。其技術(shù)架構(gòu)受人類認(rèn)知原理啟發(fā),采用雙系統(tǒng)協(xié)同設(shè)計(jì)
在 NVIDIA ,我們正在開發(fā) AI 解決方案,使通用人形機(jī)器人能夠理解人類世界、遵循語言指令并執(zhí)行各種任務(wù)。強(qiáng)大的視覺-語言-作 (VLA) 模型對(duì)于此類高級(jí)功能至關(guān)重要。為此,我們開發(fā)了 GR00T N1,這是一種在多樣化數(shù)據(jù)集上訓(xùn)練的通用機(jī)器人模型,其中包括以自我為中心的人類視頻、真實(shí)和模擬的機(jī)器人軌跡以及合成數(shù)據(jù)。
GR00T N1 在多個(gè)機(jī)器人實(shí)施例的仿真基準(zhǔn)測(cè)試中優(yōu)于最先進(jìn)的仿真學(xué)習(xí)模型。此外,它還展示了在家務(wù)中對(duì) Fourier GR-1 和 1X 人形機(jī)器人進(jìn)行有效的語言條件雙手作。
為了幫助物理 AI 構(gòu)建者解決我們社會(huì)最關(guān)鍵的問題,我們通過 NVIDIA ISAAC GR00T 提供寬容的許可證,使我們的模型成為輕量級(jí)的。
作者
朱玉可
Linxi “Jim” 范
NVIDIA GEAR 團(tuán)隊(duì)
出版日期
2025 年 3 月 17 日星期一
論文下載:
*附件:GR00T_1_Whitepaper:GR00T N1 An Open Foundation Model for Generalist.pdf
研究領(lǐng)域
人工智能和機(jī)器學(xué)習(xí)
自動(dòng)駕駛汽車
生成式 AI
物理 AI
機(jī)器人
1. 技術(shù)架構(gòu)與核心原理
GR00T N1是全球首款開源人形機(jī)器人通用基礎(chǔ)模型,其核心架構(gòu)靈感來源于人類認(rèn)知的雙系統(tǒng)理論:
- System 1(反射動(dòng)作控制) :作為快速響應(yīng)的“直覺”系統(tǒng),基于擴(kuò)散變換器(Diffusion Transformer),以高達(dá)120Hz的頻率將規(guī)劃轉(zhuǎn)化為精確的電機(jī)動(dòng)作,實(shí)現(xiàn)實(shí)時(shí)運(yùn)動(dòng)控制。
- System 2(認(rèn)知決策) :基于視覺-語言模型(VLA),整合NVIDIA-Eagle與SmolLM-1.7B,負(fù)責(zé)環(huán)境感知、語言指令解析和多步驟任務(wù)規(guī)劃,類似于人類的深度思考能力。
這種架構(gòu)通過端到端的單神經(jīng)網(wǎng)絡(luò)設(shè)計(jì),直接從視覺輸入到動(dòng)作輸出,簡(jiǎn)化了傳統(tǒng)機(jī)器人控制中的復(fù)雜層級(jí)結(jié)構(gòu),提升了執(zhí)行效率。
2. 數(shù)據(jù)策略與訓(xùn)練方法
GR00T N1的訓(xùn)練數(shù)據(jù)融合了 真實(shí)人類操作視頻 、合成數(shù)據(jù)和 真實(shí)機(jī)器人遙操作軌跡 ,形成“數(shù)據(jù)金字塔”:
- 底層 :互聯(lián)網(wǎng)視頻數(shù)據(jù),捕捉人類與物體交互的自然模式。
- 中層 :通過NVIDIA Omniverse生成的75萬條合成軌跡,模擬復(fù)雜場(chǎng)景,相當(dāng)于6500小時(shí)的人類演示數(shù)據(jù)。
- 頂層 :真實(shí)機(jī)器人數(shù)據(jù),確保模型適應(yīng)物理世界。
訓(xùn)練中結(jié)合 模仿學(xué)習(xí) (從人類視頻中提取動(dòng)作令牌)與 強(qiáng)化學(xué)習(xí) (在模擬環(huán)境中優(yōu)化策略),大幅提升模型的泛化能力。測(cè)試顯示,合成數(shù)據(jù)與真實(shí)數(shù)據(jù)結(jié)合使性能提升40%。
3. 功能亮點(diǎn)與性能突破
- 通用任務(wù)執(zhí)行 :支持抓取、搬運(yùn)、多步驟組裝等任務(wù),無需針對(duì)特定任務(wù)重新訓(xùn)練。例如,在真實(shí)環(huán)境中執(zhí)行桌面操作任務(wù)的成功率高達(dá)76.8%,遠(yuǎn)超傳統(tǒng)策略模型。
- 跨平臺(tái)適配性 :兼容Fourier GR-1、1X Neo等多款人形機(jī)器人及機(jī)械臂,實(shí)現(xiàn)“開放大腦驅(qū)動(dòng)開放硬件”的愿景。
- 多模態(tài)交互 :理解自然語言指令(如“拿起杯子”),并融合視覺輸入完成復(fù)雜操作,例如雙臂協(xié)調(diào)擰瓶蓋。
GR00T N1項(xiàng)目地址
- 項(xiàng)目官網(wǎng):https://developer.nvidia.com/isaac/gr00t
- GitHub 倉庫:https://github.com/NVIDIA/Isaac-GR00T/
- HuggingFace 模型庫:https://huggingface.co/nvidia/GR00T-N1-2B
- 技術(shù)論文:https://research.nvidia.com/publication/2025-03_nvidia-isaac-gr00t-n1-open-foundation-model-humanoid-robots
4. 開源生態(tài)與行業(yè)變革
- 開源資源 :模型權(quán)重、代碼及數(shù)據(jù)集已發(fā)布于GitHub與Hugging Face,開發(fā)者可基于2B參數(shù)架構(gòu)進(jìn)行微調(diào)。例如,Hugging Face提供預(yù)訓(xùn)練模型和PyTorch腳本。
- 降低開發(fā)門檻 :通過Simulation Frameworks(如Isaac Sim)加速虛擬測(cè)試,減少實(shí)體原型開發(fā)成本,初創(chuàng)企業(yè)可快速驗(yàn)證算法。
- 行業(yè)影響 :
5. 戰(zhàn)略意義與未來展望
- 技術(shù)轉(zhuǎn)折點(diǎn) :GR00T N1標(biāo)志著機(jī)器人開發(fā)從“專用模型”轉(zhuǎn)向“通用基礎(chǔ)模型+微調(diào)”模式,類似智能手機(jī)領(lǐng)域的Android生態(tài)。
- 商業(yè)化潛力 :TrendForce預(yù)測(cè),到2028年全球人形機(jī)器人市場(chǎng)規(guī)模將達(dá)40億美元,而GR00T N1的開源特性將加速這一進(jìn)程。
- 長(zhǎng)期挑戰(zhàn) :需解決數(shù)據(jù)安全、標(biāo)準(zhǔn)化及知識(shí)產(chǎn)權(quán)問題,避免生態(tài)碎片化[。
結(jié)語
GR00T N1不僅是技術(shù)突破,更是行業(yè)生態(tài)重構(gòu)的起點(diǎn)。其開源模式將催生更多創(chuàng)新應(yīng)用,推動(dòng)人形機(jī)器人從實(shí)驗(yàn)室走向家庭、工廠和公共服務(wù)領(lǐng)域。隨著英偉達(dá)與DeepMind、迪士尼等巨頭的合作深化(如Newton物理引擎項(xiàng)目),通用機(jī)器人時(shí)代已拉開序幕。開發(fā)者、企業(yè)及投資者需抓住這一變革機(jī)遇,探索AI與物理世界的深度融合。
-
人形機(jī)器人
+關(guān)注
關(guān)注
4文章
578瀏覽量
17022
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
機(jī)器人掀起2024開年融資熱潮,聯(lián)想入場(chǎng)投資多家公司,人形機(jī)器人要“爆”

NVIDIA發(fā)布人形機(jī)器人重磅更新!Isaac GR00T Blueprint厲害在哪?

NVIDIA發(fā)布GR00T N1基礎(chǔ)模型等方案,人形機(jī)器人開發(fā)效率顯著提升
NVIDIA發(fā)布一款人形機(jī)器人通用基礎(chǔ)模型—Project GR00T
英偉達(dá)發(fā)布人形機(jī)器人基礎(chǔ)模型
NVIDIA推出Isaac GR00T Blueprint
NVIDIA發(fā)布Isaac GR00T Blueprint,加速人形機(jī)器人開發(fā)
智元機(jī)器人基于NVIDIA Isaac GR00T打造高效仿真數(shù)據(jù)采集方案

揭曉英偉達(dá)最強(qiáng)芯片!Blackwell Ultra、Rubin芯片亮相,新機(jī)器人壓軸

NVIDIA 發(fā)布全球首個(gè)開源人形機(jī)器人基礎(chǔ)模型 Isaac GR00T N1——并推出加速機(jī)器人開發(fā)的仿真框架

英偉達(dá)GROOT N1 全球首個(gè)開源人形機(jī)器人基礎(chǔ)模型
機(jī)器人Blue亮相 搭載英偉達(dá)最新GR00T N1人形機(jī)器人通用基礎(chǔ)模型

NVIDIA發(fā)布全球首個(gè)開源人形機(jī)器人基礎(chǔ)模型Isaac GR00T N1
深度解讀英偉達(dá)Newton機(jī)器人平臺(tái):技術(shù)革新與跨界生態(tài)構(gòu)建

評(píng)論