當涉及到高質量的合成語音開發和定制時,深度學習被證明是一個強大的工具。一家總部位于多倫多的初創公司, NVIDIA Inception 成員類似人工智能正在利用一種新的生成語音工具增加賭注,該工具能夠創建高質量的合成人工智能語音。
這項技術可以在 50 多種最流行的語言中生成跨語言和自然說話的聲音,通過相似填充,用戶可以創建編程音頻,編輯和替換音頻片段中的單詞。
構建、部署和擴展現實人工智能語音的能力將幫助眾多行業。應用范圍廣泛,從為廣告創建人工智能生成的文本,到交互式語音應答系統,再到視頻游戲開發。
自 2020 年 7 月以來,相似人工智能團隊與 NVIDIA 的對話人工智能團隊密切合作,將 NVIDIA riva多模態對話人工智能 SDK 集成到他們的語音管道中。據人工智能創始人兼首席執行官佐哈伊布·艾哈邁德( Zohaib Ahmed )稱,這種經歷讓他們在整個人工智能對話管道中融入了獨特的 i NSight 。
“ NVIDIA Inception 計劃有助于為對話人工智能領域提供關鍵 i NSight 以及為我們作為產品的每項工作推薦 GPU 計算提供技術支持,” Ahmed 說。
為了訓練他們的語音模型和推理能力,該團隊正在使用 Amazon 彈性 Kubernetes 服務( Amazon EKS )和 NVIDIA T4 GPU s 集群。然后,他們使用 NVIDIA Triton 推理服務器在生產中大規模部署他們訓練有素的人工智能模型。
最近一個與 NVIDIA Omniverse Audio2Face集成的類似人工智能合成語音演示展示了組合技術如何從單一音頻源創建富有表情的面部動畫和聲音。
Ahmed 說:“ Audio2Face 是一個很好的例子,它是一個強大的工具,可以很容易地與生成性人工智能語音相結合,在幾秒鐘內產生結果,否則需要幾天時間。”。
公司 已經發展到擁有超過 150000 個用戶,建立了超過 60000 個語音。迄今為止, 類似人工智能在電信、金融、通訊中心、教育、游戲、媒體和娛樂等行業擁有 240 多個付費客戶。
關于作者
Michelle Horton 是 NVIDIA 的高級開發人員通信經理,擁有通信經理和科學作家的背景。她在 NVIDIA 為開發者博客撰文,重點介紹了開發者使用 NVIDIA 技術的多種方式。
審核編輯:郭婷
-
NVIDIA
+關注
關注
14文章
4978瀏覽量
102987 -
人工智能
+關注
關注
1791文章
47183瀏覽量
238255
發布評論請先 登錄
相關推薦
評論