作為 NVIDIA NIM 微服務,開放式 Llama Nemotron 大語言模型和 Cosmos Nemotron 視覺語言模型可在任何加速系統上為 AI 智能體提供強效助力。
人工智能正在進入一個全新的時代——代理式 AI。在這個時代,專業智能體團隊可以幫助人們解決復雜的問題并自動執行重復任務。
借助定制 AI 智能體,各行各業的企業可以構建智能解決方案,從而獲得前所未有的生產力。這些先進的 AI 智能體需要一個多樣化生成式 AI 模型系統,并且這些模型要針對代理式 AI 功能和能力進行優化。這樣的復雜程度意味著企業對強大、高效的企業級模型產生了極大的需求。
為了給企業代理式 AI 奠定基礎,NVIDIA 宣布推出開放式大語言模型 (LLM) 的 Llama Nemotron 系列。該模型基于 Llama 構建,可以幫助開發者在一系列應用中創建和部署 AI 智能體,包括客戶支持、欺詐檢測、產品供應鏈和庫存管理優化。
許多 AI 智能體不僅需要語言技能,還需要感知世界并采取適當行動的能力,以更有效地發揮其作用。
借助全新的NVIDIA Cosmos Nemotron視覺語言模型 (VLM) 以及面向視頻搜索和摘要的NVIDIA NIM微服務,開發者可以構建智能體,分析來自自主機器、醫院、商店和倉庫的圖像和視頻以及體育賽事、電影和新聞,并對其做出響應。針對希望為機器人和自動駕駛汽車領域生成物理感知視頻的開發者,NVIDIA 還宣布推出 NVIDIA Cosmos世界基礎模型。
開放式 Llama Nemotron 模型
優化了 AI 智能體的計算效率和精度
NVIDIA Llama Nemotron模型基于 Llama 基礎模型而構建,為 AI 智能體開發提供經過優化的基礎模組。Llama 基礎模型是最熱門的商用開源模型集合之一,下載次數超過 6.5 億次。這一成果建立在 NVIDIA 致力于開發前沿模型的基礎之上,例如 Llama 3.1 Nemotron 70B,現在可通過 NVIDIA API 目錄獲取。
Llama Nemotron 模型使用 NVIDIA 最新技術和高質量數據集進行剪枝和訓練,可增強代理式 AI 功能。它們在指令遵循、聊天、函數調用、編碼和數學方面表現出色,同時經過尺寸優化,可在廣泛的 NVIDIA 加速計算資源上運行。
Meta 副總裁兼 GenAI 負責人 Ahmad Al-Dahle 表示:“代理式 AI 是 AI 開發的下一個前沿,為了抓住這次機會,需要在 LLM 系統中進行全棧優化,以提供高效、準確的 AI 智能體。通過與 NVIDIA 的合作,以及我們對開放模型的共同承諾,基于 Llama 構建的 NVIDIA Llama Nemotron 系列可以助力企業快速構建自己的定制 AI 智能體?!?/p>
包括 SAP 和 ServiceNow 在內的領先 AI 智能體平臺提供商,有望成為首批使用全新 Llama Nemotron 模型的企業。
SAP 首席人工智能官 Philipp Herzig 表示:“能夠跨多個業務線協作解決復雜任務的 AI 智能體將會超越當今的生成式 AI 場景,將企業生產力提升到一個全新的水平。借助 SAP 的 Joule,數億企業用戶能夠與這些智能體進行交互,以前所未有的速度實現他們的目標。NVIDIA 的全新開放式 Llama Nemotron 模型系列將推動多個專用 AI 智能體的開發,助力業務流程轉型?!?/p>
ServiceNow 平臺 AI 副總裁 Jeremy Barnes 表示:“AI 智能體使企業組織能夠事半功倍,為業務轉型樹立了新的標準。NVIDIA 開放式 Llama Nemotron 模型性能和精度的提升有助于構建先進的 AI 智能體服務,以解決各行業中各種職能的復雜問題?!?/p>
NVIDIA Llama Nemotron 模型使用NVIDIA NeMo進行蒸餾、剪枝和對齊。使用這些技術可以將這些模型保持較小的規模,以便在各種計算平臺上運行,并在提供高精度的同時提高模型吞吐量。
Llama Nemotron 模型系列將以可下載模型和 NVIDIA NIM 微服務的形式提供,可輕松部署在云端、數據中心、PC 和工作站。它們可以為企業提供業界領先的性能,并且能夠可靠、安全且無縫地集成到其代理式 AI 應用工作流中。
使用 NVIDIA NeMo 定制
并接入業務知識
Llama Nemotron 和 Cosmos Nemotron 模型系列將提供 Nano、Super 和 Ultra 三種規模,為部署各種規模的 AI 智能體提供廣泛選擇。
Nano:成本效益最高的模型,針對實時應用進行了優化,延遲低,非常適合部署在 PC 和邊緣設備上。
Super:高精度模型,可在單個 GPU 上提供卓越的吞吐量。
Ultra:精度最高的模型,專為需要超高性能的數據中心級應用而設計。
企業還可以使用 NVIDIA NeMo 微服務為其特定用例和領域定制模型,以簡化數據管護、加速模型定制和評估,還可以應用護欄,以確保響應正常。
借助NVIDIA NeMo Retriever,開發者還可以集成檢索增強生成功能,將模型與企業數據連接起來。
使用面向代理式 AI 的NVIDIA Blueprint,企業可以利用 NVIDIA 先進的 AI 工具和端到端開發專長,快速構建自己的應用。事實上,NVIDIA Cosmos Nemotron、NVIDIA Llama Nemotron 和 NeMo Retriever 將為今天發布的面向視頻搜索和摘要的全新 NVIDIA Blueprint 提供強效助力。
NeMo、NeMo Retriever 和 NVIDIA Blueprint 均可通過 NVIDIA AI Enterprise 軟件平臺使用。
可用性
Llama Nemotron 和 Cosmos Nemotron 模型將以托管應用編程接口的形式提供,可通過NVIDIA 官網和 Hugging Face 下載。
NVIDIA 開發者計劃的成員均可免費訪問開發、測試和研究資源。
在生產中,企業可以使用 NVIDIA AI Enterprise 軟件平臺在加速數據中心和云計算基礎設施上運行 Llama Nemotron 和 Cosmos Nemotron NIM 微服務。
-
NVIDIA
+關注
關注
14文章
5021瀏覽量
103256 -
人工智能
+關注
關注
1792文章
47425瀏覽量
238958 -
模型
+關注
關注
1文章
3267瀏覽量
48924
原文標題:CES 2025 | NVIDIA 宣布推出 Nemotron 模型系列,推動代理式 AI 發展
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論