NVIDIA 近日公布了 NVIDIA Avatar Cloud Engine(ACE)的一系列技術,增強了 AI 虛擬形象和數字人的真實感和可訪問性,這些新的動畫和語音功能實現了更自然的對話和情感表達。
開發者現在可以使用新的云 API 在應用中輕松實現和擴展智能虛擬形象,包括自動語音識別(ASR)、文本轉語音(TTS)、神經機器翻譯(NMT)和 Audio2Face(A2F)。
借助這些高級功能,搶先體驗計劃的創作者可以利用 NVIDIA 技術快速構建新一代虛擬形象體驗。現在,使用 Unreal Engine 5 等一些熱門渲染工具,可以更輕松地在任何地方大規模構建和部署數字人。
AI 驅動的情感動畫
用戶可使用最新的 ACE AI 動畫功能和微服務(包括新添加的 A2F 情感支持)構建更具表現力的數字人,現在還提供用于身體、頭部和眼球運動的 Animation Graph 微服務。
對于使用云來處理渲染生產或尋求進行實時推理的開發者,現在有了易于使用的微服務。A2F 的質量改進包括嘴型同步,可為數字人帶來更多的真實感。
圖 1. NVIDIA ACE 端到端開發套件
增強的 AI 語音功能
現在支持的語言包括意大利語、西班牙語、德語和普通話,ASR 技術的整體準確性也得到了提高,ASR、TTS 和 NMT 的云 API 簡化了對最新語音 AI 功能的訪問。
無論用戶是想使用自己的語音將自定義語音應用到智能 NPC,還是在視頻會議通話中隨機化用戶的語音,新的 Voice Font 微服務都能讓用戶自定義 TTS 輸出。這項技術可將說話者的獨特音調和音量轉換為參考音頻,同時保持相同的節奏和聲音模式。
新工具和框架
ACE Agent 是一家專業的對話管理和系統集成商,它能夠提供更加流暢的端到端體驗,并高效地協調微服務之間的連接。開發者還可以利用與 NVIDIA Omniverse 平臺的集成,通過 NVIDIA NeMo Guardrails、NVIDIA SteerLM 和 LangChain 來更好地控制精確且可調節的響應。
現在,可以更輕松地在用戶選擇的渲染器或編碼環境中啟動和運行這些工具。新功能包括:
-
在 Avatar 配置器中支持 Blendshape,以輕松集成 Unreal Engine 等熱門渲染器。
-
面向 Python 用戶的全新 A2F 應用程序。
-
一款參考應用程序,適用于有興趣為客戶服務構建虛擬助理的開發者。
總結
這些新推出的 NVIDIA ACE 功能提高了數字人體驗的質量標準。借助簡化構建和部署的增強功能,開發者現在可以獲得構建新一代數字人應用所需的簡化配置。
想要探索尖端數字人技術?點擊“閱讀原文”,申請 NVIDIA ACE 搶先體驗。
GTC 2024 將于 2024 年 3 月 18 至 21 日在美國加州圣何塞會議中心舉行,線上大會也將同期開放。掃描下方海報二維碼,立即注冊 GTC 大會。
原文標題:在 NVIDIA ACE 中使用 AI 動畫和語音功能打造逼真的虛擬形象
文章出處:【微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。
-
英偉達
+關注
關注
22文章
3791瀏覽量
91313
發布評論請先 登錄
相關推薦
評論