無論是用于虛擬助手、轉(zhuǎn)錄還是聯(lián)絡(luò)中心,語音 AI 服務(wù)都會將言語和對話轉(zhuǎn)化為可創(chuàng)造業(yè)務(wù)奇跡的不同數(shù)據(jù)。
在本周舉行的 GTC 大會上,NVIDIA 宣布NVIDIA Riva增加了新功能 – Riva 是 GPU 加速的軟件開發(fā)套件,用于構(gòu)建和部署語音 AI 應(yīng)用。
Riva 的預(yù)訓(xùn)練模型現(xiàn)在提供七種語言版本,其中包括法語和印地語。未來將會提供更多語言版本:阿拉伯語、意大利語、日語、韓語和葡萄牙語。Riva 還提高了英語、德語、普通話、俄語和西班牙語版本的準(zhǔn)確性。此外,它還增加了字詞級置信度評分和說話人分辨(即在音頻流中識別說話人的過程)等功能。
Riva 設(shè)計為允許在語音 AI 工作流的每個階段進(jìn)行完全可定制,以幫助高效解決獨(dú)特問題。開發(fā)者也可以將其部署到他們希望數(shù)據(jù)出現(xiàn)在的地方:本地、混合多云、邊緣或嵌入式設(shè)備。企業(yè)可以使用 Riva 改進(jìn)服務(wù),以及提升效率和競爭優(yōu)勢。
雖然對語音服務(wù) AI 的需求一直很大,但開發(fā)工具卻未能跟上需求。越來越多的人在家工作和學(xué)習(xí)、上網(wǎng)購物以及尋求遠(yuǎn)程客戶支持,這給呼叫中心帶來巨大壓力,并使語音應(yīng)用極限承壓。根據(jù) 2022 年的一份彭博社報告[1],由于人手短缺給呼叫中心造成沉重打擊,客戶服務(wù)等待時間最近增加了兩倍。
語音 AI 的進(jìn)步提供了前進(jìn)的道路。NVIDIA Riva 使企業(yè)能夠探索更大的深度學(xué)習(xí)模型,并開發(fā)更為細(xì)致入微的語音系統(tǒng)。基于 Riva 構(gòu)建的語音 AI 應(yīng)用提供了更快改進(jìn)服務(wù)的途徑,同時有望改善客戶體驗(yàn)和互動。
對語音 AI 應(yīng)用的需求日益增長
Fortune Business Insights 這家機(jī)構(gòu)指出,2021 年全球聯(lián)絡(luò)中心軟件市場的價值約為 270 億美元,預(yù)計到 2029 年,這一數(shù)字將增長接近三倍,達(dá)到 790 億美元。
出現(xiàn)此大幅增長的原因是,自定義語音應(yīng)用能夠惠及幾乎所有行業(yè)中各種規(guī)模的企業(yè) – 從全球性企業(yè),到提供基于語音 AI 的系統(tǒng)和云服務(wù)的原始設(shè)備制造商,再到系統(tǒng)集成商和獨(dú)立軟件供應(yīng)商。
Riva SDK 加速 AI 工作流
NVIDIA Riva 包含預(yù)訓(xùn)練語言模型,客戶可按照原樣使用這些模型,也可使用NVIDIA TAO 工具套件(允許在無代碼環(huán)境中使用自定義數(shù)據(jù)集)中的遷移學(xué)習(xí)工具來微調(diào)這些模型。客戶可以優(yōu)化和導(dǎo)出 Riva 自動語音識別 (ASR) 和文本轉(zhuǎn)語音 (TTS) 模型,然后將其作為語音服務(wù)進(jìn)行部署。
語音 AI 正在深入到越來越多類型的應(yīng)用中,例如客戶支持虛擬助手和聊天機(jī)器人、視頻會議系統(tǒng)、汽車餐廳快餐訂單、電話零售、媒體和娛樂等。全球許多公司都采用了 Riva 來推動語音 AI 開發(fā)工作,這些公司包括 T-Mobile、德勤、HPE、Interactions、1-800-Flowers.com、Quantiphi 和 Kore.ai。
T-Mobile在其 T-Mobile Expert Assist(一款定制的呼叫中心應(yīng)用,使用 AI 來轉(zhuǎn)錄實(shí)時客戶對話和推薦解決方案)中采用了 Riva,以協(xié)助 17000 位客戶服務(wù)坐席完成工作。T-Mobile 計劃不久后在全球部署 Riva。
慧與提供 HPE ProLiant 服務(wù)器系統(tǒng),這些系統(tǒng)皆由 NVIDIA GPU 和 NVIDIA Riva 軟件提供支持,能夠開發(fā)和運(yùn)行極具挑戰(zhàn)性的語音 AI 和自然語言處理工作負(fù)載,從而輕松將音頻轉(zhuǎn)化為洞見。HPE ProLiant 系統(tǒng)和 NVIDIA Riva組成先進(jìn)的全棧解決方案,可運(yùn)行金融服務(wù)和其他行業(yè)應(yīng)用。
HPE 的 HPE GreenLake 解決方案副總裁 Scott Ramsay 表示:“為了充分發(fā)揮 NVIDIA Riva 的功能,HPE 在 HPE Ezmeral 軟件的基礎(chǔ)上提供了基于 Kubernetes 的 NLP 參考架構(gòu)。此系統(tǒng)通過 HPE GreenLake 云平臺提供,使開發(fā)者能夠加速開發(fā)和部署新一代語音 AI 應(yīng)用。”
德勤為希望部署 ASR 和 TTS 用例(例如全球多家大型快速下單餐廳的接單系統(tǒng))的客戶提供有力支持。它還為醫(yī)療健康服務(wù)提供商開發(fā)聊天機(jī)器人服務(wù),以便準(zhǔn)確高效地轉(zhuǎn)錄患者問題和聊天要點(diǎn)。
美國德勤負(fù)責(zé)人 Christine Ahn 表示:“自然語言處理技術(shù)的進(jìn)步使得設(shè)計經(jīng)濟(jì)高效的體驗(yàn)成為可能,從而能與客戶進(jìn)行有針對性、簡單和自然的對話。我們的客戶正在尋找簡化的對話式 AI 部署路徑,而 NVIDIA Riva 有效支持該路徑。
Interactions已將 Riva 與其 Curo 軟件平臺集成在一起,為電信等眾多行業(yè)的客戶以及1-800-Flowers.com等已部署語音 AI 接單系統(tǒng)的公司打造無縫的個性化互動過程。
Kore.ai正將 Riva 與其 SmartAssist 語音 AI 聯(lián)絡(luò)中心即服務(wù)進(jìn)行集成,此服務(wù)為該公司的 BankAssist、HealthAssist、AgentAssist、HR Assist 和 IT Assist 產(chǎn)品提供支持。該公司正在利用 NVIDIA Riva 開展概念驗(yàn)證工作。
Quantiphi是一家解決方案交付合作伙伴,正使用 Riva 為媒體和娛樂業(yè)客戶(包括福克斯新聞)開發(fā)隱藏式字幕解決方案。它還使用 Riva 為電信和其他行業(yè)開發(fā)數(shù)字虛擬形象。
復(fù)雜的語音 AI 工作流,更輕松的解決方案
語音 AI 工作流可能很復(fù)雜,而且要跨多項(xiàng)服務(wù)進(jìn)行協(xié)調(diào)。需要大規(guī)模運(yùn)行微服務(wù),同時要運(yùn)行 ASR 模型、自然語言理解、TTS 和特定領(lǐng)域的應(yīng)用。NVIDIA GPU 很適合用于加速此類專業(yè)任務(wù)。
Riva 提供用于構(gòu)建語音 AI 應(yīng)用的軟件庫,并且包含適用于 ASR 和 TTS 的 GPU 優(yōu)化服務(wù)(使用了新的深度學(xué)習(xí)模型)。開發(fā)者可以將這幾項(xiàng)語音 AI 技能融合到他們的應(yīng)用中。
作為匯集各種 GPU 優(yōu)化的 AI 軟件、模型和 Jupyter Notebook 示例的中心,NVIDIA NGC可讓開發(fā)者輕松訪問 Riva 和預(yù)訓(xùn)練模型。
NVIDIA AI Enterprise是云原生的 AI 和數(shù)據(jù)分析軟件套件,經(jīng)過優(yōu)化可助力各種組織使用 AI,而且還提供對 Riva 的支持。該套件經(jīng)過認(rèn)證,可隨時隨地(包括在企業(yè)數(shù)據(jù)中心和公有云等)進(jìn)行部署,并包含全球企業(yè)支持,可保證 AI 項(xiàng)目按計劃順利進(jìn)行。
在 NVIDIA LaunchPad 中的即用型基礎(chǔ)架構(gòu)上,通過分步引導(dǎo)式實(shí)驗(yàn)室試用 NVIDIA Riva。
審核編輯:湯梓紅
-
NVIDIA
+關(guān)注
關(guān)注
14文章
4981瀏覽量
102997 -
gpu
+關(guān)注
關(guān)注
28文章
4729瀏覽量
128899 -
AI
+關(guān)注
關(guān)注
87文章
30763瀏覽量
268906
原文標(biāo)題:GTC22 | 在您說著我的語言:NVIDIA Riva 為完全可定制的語音 AI 設(shè)定新標(biāo)準(zhǔn)
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論