企業可以使用混合模型改進喚醒詞、語音轉文本、設備安全等。
你可能不了解 Todd Mozer,但卻很有可能已經體驗過該公司的技術——該公司已經為全球數十億消費電子設備實現了語音和視覺 AI。
Sensory于 1994 年創立于硅谷,致力于為行業巨頭的移動設備提供先進的緊湊模型。如今,Sensory 為各種語音電子產品提供了互動性。LG 和三星不僅在手機,還在冰箱、遙控器和可穿戴設備中使用 Sensory。
CEO 兼創始人 Mozer 表示:“當我想讓我的語音微波爐連接網絡搜索食譜,并為我讀出這個食譜時,混合計算方法就可以發揮作用。”
混合計算是一種結合云和本地計算資源的方法。
該公司的最新成果依靠于用于建立先進對話式 AI 模型的工具包NVIDIANeMo以及用于其SensoryCloud混合計算單元的NVIDIATriton 推理服務器。
設備正在變得越來越強大。雖然市場上正在出現各種專用的推理加速器,但越好的模型往往越大,而且需要的內存也越多,所以基于邊緣的處理有時并不一定是最好的解決方案。
而將設備連接到云可以為這些緊湊模型提供更好的性能。Mozer 表示,可穿戴設備、手機、汽車等設備都可以進行無線更新。
他表示:“云連接可以為更小、更準確的設備端模型提供更新。”
這實現了設備端的許多功能改進。Sensory 為客戶提供語音轉文字、文字轉語音、喚醒詞驗證、自然語言理解、面部身份識別以及揚聲器和聲音識別等功能。
Sensory 還使用NVIDIAJetson邊緣 AI 模塊將 Sensory Cloud 的力量帶給更大的設備。
利用Triton進行推理
該公司的 Sensory Cloud 利用NVIDIA Triton運行語音和視覺模型。Sensory 圍繞 Triton 構建的自定義云模型管理基礎架構,使不同的客戶能夠運行不同的模型版本、部署自定義模型、啟用自動更新并監控使用情況和錯誤。
Sensory 的客戶可以將它作為一個容器部署到本地或云端,也可以完全用于私人用途,不向 Sensory 發送任何數據。
Triton 為 Sensory 提供了一個用于所有 Triton 通信和以最少的編碼快速部署新模型的專用機器學習任務庫。它還實現了一個方便新管道組裝和擴展的異步動作管道。Triton 的動態批處理功能幫助提高 GPU 吞吐量并進行性能分析,以此實現推理優化。
Sensory 是NVIDIA初創加速計劃的成員。這項全球計劃為領先的初創企業提供支持。
將NeMo運用于混合云模型
Sensory 在NVIDIA NeMo的基礎上進行了擴展,提升其所有云技術的準確性和功能。
NeMo 所改進的功能包括專有的特征提取器、音頻流優化、可定制的詞匯表、多語言模型等。
NeMo 模型現在支持 17 種語言。該公司稱,憑借 Sensory 專有的功能改進,語音轉文字的單詞錯誤率很低,并始終處于最佳水平。
Mozer 表示:“Sensory 通過 NVIDIA Triton 硬件和 NVIDIA NeMo 軟件實現了各項特征和功能的改進。這類混合云設置為客戶提供了全新的 AI 功能。”
審核編輯:湯梓紅
-
NVIDIA
+關注
關注
14文章
5019瀏覽量
103248 -
AI
+關注
關注
87文章
31118瀏覽量
269435 -
Sensory
+關注
關注
0文章
4瀏覽量
6132
原文標題:Sensory通過NeMo將NVIDIA AI運用于語音和視覺應用
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論