生成式 AI 領域正在迅速發展,每天都有新的大語言模型(LLM)、視覺語言模型(VLM)和視覺語言動作模型(VLA)出現。為了在這一充滿變革的時代保持領先,開發者需要一個足夠強大的平臺將云端的最新模型無縫部署到邊緣,從而獲得基于 CUDA 的優化推理性能和開放式機器學習(ML)框架。
為了支持機器人和多模態智能體領域的新興生成式 AI 工作負載應用,NVIDIA 以軟件升級的方式對NVIDIA Jetson Orin Nano開發者套件進行了升級,其性能史無前例地提升至 1.7 倍。目前建議零售價僅為 2070 人民幣。鑒于 AI 性能和易訪問性的大幅提升,Jetson Orin Nano 開發者套件已更名為NVIDIA Jetson Orin Nano Super開發者套件。
Jetson Orin Nano 開發者套件只需通過軟件升級,即可升級為 Jetson Orin Nano Super 開發者套件。
本文將詳細介紹該開發者套件的新功能,以及開發者能夠如何充分利用這一更強大的性能。
全新 Jetson Orin Nano Super
開發者套件
全新 Jetson Orin Nano Super 開發者套件做出了以下改進:
生成式 AI 性能提升至 1.7 倍
稀疏計算性能從之前的 40 TOPS 大幅提升至 67 TOPS
內存帶寬從之前的 65 GB/s 大幅提升至 102 GB/s
目前建議零售價為 2070 人民幣
視頻 1. NVIDIA Jetson Orin Nano Super 介紹:
高性價比的生成式 AI 計算機
在保持硬件架構不變的前提下,通過提高 GPU、內存和 CPU 的時鐘頻率,即可實現性能提升。之前所有的 Jetson Orin Nano 開發者套件都可以通過升級到最新版本的JetPack,實現性能提升。
憑借這一性能升級,Jetson Orin Nano Super 開發者套件的生成式 AI 性能提升了 70%,能夠支持運行最新的基于 Transformer 的模型。這一套件尺寸小巧但是性能強大,可以輕松處理各種 LLM、VLM 和視覺 Transformer(ViT),無論是較小的模型還是參數多達 8B 的模型(例如 Llama-3.1-8B 模型)都不例外。
Jetson 所支持的 ML 框架和優化推理基礎架構與其他平臺相同,例如 HuggingFace Transformer、Ollama、llama.cpp、vLLM、MLC、NVIDIA TensorRT-LLM 等。因此,Jetson 非常適合用于在云、邊緣和 PC 之間快速調整和部署可擴展的理想解決方案。
Jetson Orin Nano Super
開發者套件配置
表 1. Jetson Orin Nano Super 開發者套件配置比較
運行各種 LLM、VLM 和 ViT
NVIDIA Jetson Orin Nano Super 開發者套件實現了性能的顛覆性突破,對于將生成式 AI 帶入嵌入式應用,或者在高性價比的計算機中使用最前沿的生成式 AI 模型,它都將是理想的選擇。
LLM、VLM 和 視覺 Transformer(ViT)是推動各個領域創新的變革性 AI 架構。基礎 LLM 擅長通用語言處理和類人文本生成,結合NVIDIA Riva等流式語音識別和合成管線,可實現自然的人機交互界面。
小語言模型(SLM)通過剪枝和蒸餾等技術迅速實現性能提升,發展到可與大模型媲美的程度。這些模型專門針對邊緣計算場景優化,其參數規模一般不超過 7B。
如今,開放式 LLMs 和 SLMs 普遍被訓練用于智能體工具的使用和結構化 I/O 函數的調用,這使得 LLM 的解析和推理能力能夠接入現實系統。
包括NVIDIA NeMo在內的許多 ML 框架對 LLM 的微調和內存高效的 LoRAs 的支持也有所提升,這為特定應用領域 SLMs 的對齊和專業化提供了明確的指導。
ViT 通過將像素片段標記化為嵌入式內容,充分發揮出 Transformer 在視覺方面的強大功能。它們在各種基本任務中都具有領先的性能,包括:
特征提取
分類
分割
位姿估計
它們還可通過NVIDIA Cosmos標記器擴展到 3D 點云和視頻等更高維度的模式。ViT 推動了創造性的新型混合模型的發展,這些模型將定制的視覺功能與開放詞匯語言支持以及對各種主題和對象類別的動態運行時查詢相結合,而無需額外的微調。
VILA 等 VLM 通過融合各種視覺和文本模式的 ViT 和 LLM,使模型能夠理解和生成詳細的場景描述、檢測感興趣的對象并使用 OCR 提取文本。它們可以使用多模態推理響應用戶對圖像或視頻序列的查詢。
在經過了與 SLM 類似的微縮化處理后,VLM 在邊緣應用中的作用越來越大,并且憑借靈活的事件觸發警報和摘要功能,而被用于遠程監控攝像頭的數據流,比如在 Jetson 平臺服務的 VLM 參考工作流中。
這些技術共同推動著生成式 AI 和多模態系統以及現實應用的進步。全新 NVIDIA Jetson Orin Nano Super 大幅提升了各種 LLM、SLM、ViT 和 VLM 的性能,并且大大降低了作為物理 AI 入口的最新 Transformer 模型的入門門檻。我們對一些常用的 LLM、VLM 和 ViT 進行了基準測試,并展示了 Jetson Orin Nano Super 開發者套件較前代產品所帶來的速度提升。
圖 1. LLM 在 Jetson Orin Nano Super
開發者套件上的性能提升情況
表 2. 常用 LLM 的基準測試性能(tokens/s)
*使用 MLC API 并經過 INT4 量化的 LLM 生成性能(tokens/s)。
圖 2. VLM 在 NVIDIA Jetson Orin Nano Super
開發者套件上的性能提升情況
表 3. 常用 VLM 的基準測試性能(tokens/s)
*所有 VILA 和 LLAVA 模型均使用 MLC 以 INT4 精度運行,
其余模型使用 Hugging Face Transformer 以 FP4 精度運行。
圖 3. ViT 在 NVIDIA Jetson Orin Nano Super
開發者套件上的性能提升情況
表 4. 常用視覺 Transformer 的 基準測試性能(幀/秒)
*所有 ViT 模型均使用 NVIDIA TensorRT 以 FP16 精度運行(單位:幀/秒)。
開始使用
Jetson Orin Nano Super 開發者套件
如要升級性能,請在JetPack SDK頁面下載 SD 卡鏡像,并按照入門指南進行操作。
NVIDIA 發布了基于JetPack 6.1的 SD 卡鏡像以升級性能。您也可以使用 SDK 管理器為 Jetson Orin Nano 開發者套件安裝升級性能后的 JetPack 6.1。請確認已更新 SDK 管理器,并在安裝時選擇 JetPack 6.1 (rev. 1)。
啟動并運行 JetPack 后,使用以下命令更改性能模式以獲得超強性能。模式 2 是具有超強性能的 MAXN 模式。
sudo nvpmodel -m 2
您也可以使用 Ubuntu 桌面頂欄右側的性能模式選擇器更改性能模式。
圖 4. 性能模式選擇工具
在 Jetson Orin Nano Super
開發者套件上體驗生成式 AI
NVIDIA 在 Jetson AI Lab 中提供了一系列教程和預構建容器,便于您在 Jetson Orin Nano 開發者套件上探索生成式 AI。如果您對機器人感興趣,可以瀏覽 LeRobot 教程。如果您想要創建生成式 AI 聊天機器人,我們也提供了專門的創建教程。
Hugging Face LeRobot
NVIDIA 與 Hugging Face 合作,共同加速 LeRobot 開放式 AI 平臺上的機器人研究。您可以在 Jetson Orin Nano Super 開發者套件上運行 HuggingFace LeRobot,該平臺所運行的生成式 AI 模型能夠根據視覺輸入和先前軌跡預測特定任務的行動。
圖 5. 在 Jetson Orin Nano 開發者套件上
運行的 HuggingFace LeRobot
使用 Ollama 構建生成式 AI
驅動的聊天機器人
使用帶有 Open WebUI 的 Ollama 構建一個生成式 AI 聊天機器人,并在 Jetson Orin Nano Super 開發者套件上運行。Open WebUI 是一個被廣泛使用的開源聊天機器人服務器接口,可對接本地運行的 LLM。這樣,該聊天機器人就可以使用檢索增強生成(RAG)進一步增強用戶體驗和功能。
圖 6. 在 Jetson Orin Nano Super 開發者套件上
運行的生成式 AI 聊天機器人
通過 Jetson AI Lab 推動
生成式 AI 的發展
Jetson AI Lab讓您能夠集中探索和嘗試專為邊緣設備優化的最新生成式 AI 技術。
通過建立一個開放協作和社區引導的環境,NVIDIA 與開發者和合作伙伴攜手推進開源邊緣 AI 和機器人學習的發展。我們的 Jetson 設備全面支持常用的機器學習框架和經過優化的推理微服務,您可以在 Jetson 計算機上快速構建和部署最新的創新研究成果和模型,跟上日新月異的創新步伐。
圖 7 所示的是 NanoOWL 開放詞匯實時對象檢測 ViT 的示例。
圖 8 所示的是具有交互式 txt2img 和 img2img 相似性搜索功能的 NanoDB 多模態矢量數據庫。
Jetson AI Lab 提供了近 50 個簡單易學的教程和預構建容器,讓任何經驗水平的開發者都能快速開始使用設備端的 LLM、SLM 和多模態 VLM 以及各種 VLA、擴散策略和語音模型變體。雖然它們都部署在本地,但卻具有與云端相同的優化推理基礎設施。
Jetson AI Lab 的協作式社區引導型教程和資源大大降低了在邊緣部署先進生成式 AI 的門檻。
所有 Jetson Orin Nano
和 Jetson Orin NX 系列模組
均可實現超強性能升級
NVIDIA 還升級了整個Jetson Orin Nano系列和Jetson Orin NX系列的性能。無論是小型 AI 攝像頭,還是大型自主機器,所有邊緣設備都需要算力來運行生成式 AI 模型。
在相同的模塊硬件上,您可以使用不同模塊實現最高 1.7 倍的性能提升。
Orin Nano系列:提高 GPU、CPU 和內存上的頻率和性能。
Orin NX 系列:提高 GPU 和 DLA 的性能。
表 5. Jetson Orin Nano Super
和 Orin NX Super 模組規格
適用于 Jetson Orin Nano 和 Orin NX 模組的性能升級支持和文檔將于 1 月上半月隨JetPack 6.1.1一起發布。
由于客戶對 Orin 的需求日益增長,NVIDIA 最近還宣布將 Jetson Orin 的產品生命周期延長至 2032 年底。憑借此次超強性能升級,Orin Nano 系列和 Orin NX 系列已成為當前和未來模型的理想平臺。
即刻開始您的生成式 AI 開發工作
Jetson Orin Nano Super 開發者套件是引領邊緣計算生成式 AI 開發的最佳平臺。即刻開始您的開發工作,加入這個由高級開發者和研究者所組成的充滿活力的多元化社區,和 NVIDIA 一起使用物理 AI 解決現實世界的挑戰。
現有 Jetson Orin Nano 開發者套件用戶,即刻就可以升級您的 JetPack SDK 以提升性能。
-
機器人
+關注
關注
211文章
28524瀏覽量
207552 -
NVIDIA
+關注
關注
14文章
5025瀏覽量
103266 -
開發者
+關注
關注
1文章
583瀏覽量
17037
原文標題:“Super”賦能 NVIDIA Jetson Orin Nano 開發者套件實現性能飛躍
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論