SoundHound 是一家位于硅谷的初創公司。通過將AI技術應用于其服務,它革新了傳統的語音搜索。隨著產品規模的不斷擴大,該公司目前已獲得1億美元的戰略投資。NVIDIA GPU Ventures是其早期投資者之一,它致力于支持從事深度學習研究的初創公司。
除了同名的音樂識別應用程序外,SoundHound 還提供 Hound 語音搜索應用程序和 Houndify 語音平臺,以幫助企業創建基于 AI 的語音服務。即使在亞馬遜、蘋果、谷歌和微軟等巨頭云集的市場中,該公司的技術也已成為語音搜索領域最具競爭力的方案之一。
加入研發 Collective AI
該公司正在迅速推出自己的語音領域,以實現更流暢和快速的自然語言處理。其領域范圍已經從 50 個發展到了 200 個,這些領域的語音服務質量也在兩年內實現迅速提升。
與此同時,SoundHound 還在持續推動各領域相互“交流”的能力,以此為消費者提供更出色的搜索功能。該公司將此項工作稱為Collective AI,并表示這會讓使用相關架構的產品更智能、更強大。
Collective AI 旨在幫助人們提出復雜的請求或問題,并獲得回復。例如:請找到舊金山 4 星級以上最好的意大利餐廳,要適合兒童就餐,不能是連鎖餐廳,且在周三晚上 9 點以后仍然營業。
該公司的 Collective AI 聯盟企業包括 NVIDIA、Yelp、AccuWeather.com、Sportstrader、Xignite、FlightStats、Onkyo、Sharp、Uber 和 Samsung ARTIK。
此外,SoundHound 還希望借助 Houndify 語音平臺脫穎而出。這項白標簽授權 (white-label licensed) 服務允許公司在產品中使用自己的名稱來定制語音助手,并保留生成的客戶數據。這使公司能夠打造自己的語音搜索品牌,同時透過客戶數據發現其他商機。
Houndify 開發人員數量增至三倍
去年年初,SoundHound 有 2 萬多名開發人員注冊使用 Houndify,而如今這一數字已增至 6 萬多。
SoundHound 也在不斷為 Houndify 吸引客戶。目前,該公司的合作伙伴包括 11 家汽車制造商,以及從事機器人、聯網揚聲器、電器、增強現實和智能家居設備行業的公司。
現代集團正在為未來汽車中的新一代語音系統配置 Houndify。汽車制造商的智能助手旨在預測駕駛員對信息的需求(例如提供會議提醒)。它還支持免提通話、發送信息、搜索目的地和音樂,以及查詢天氣和管理日歷等功能。此外,語音的應用范圍還將擴展至對空調、門鎖及其他車輛的控制功能。
NVIDIA DRIVE和Jetson TX2平臺幫助 SoundHound 分別在汽車和機器人應用領域實現了"Speech-to-Meaning"技術。
適用于機器人的 Jetson TX2 開發者工具包
雙重語音識別方法
SoundHound 采用了一種全新方法來提供快速的語音識別服務。該公司的系統采用的是本地識別模型和遠程識別引擎雙重語音識別方法,并已獲得專利。SoundHound 的混合工程設計利用 NVIDIA Drive 的 GPU 來更快地處理語音查詢。
SoundHound 提供的雙重方法實現了對車輛中語音查詢的實時響應,改變了傳統語音系統的“蝸”速問題。
正是這種獨創性使得 AI 應用到了網絡終端產品中。過去,嵌入式技術只能識別少量詞匯,并且速度和準確性較低。然而,SoundHound 通過利用 NVIDIA GPU 運行大量詞匯來快速、準確地識別語音和理解自然語言。
SoundHound 聯合創始人兼首席執行官 Keyvan Mohajer 說:“我們利用 NVIDIA DRIVE 平臺創建了嵌入式版本系統,從而將可識別自然語言的字數增加到了一百多萬字。它的速度非常快,而且可擴展。”
在機器人領域,Mayfield Robotics 正在開發可使用 Houndify 的 Kuri 機器人以實現語音交互,從而使人們可以與機器人互動并向其發號施令。
在電器領域,開發人員利用 Houndify 在 Sure Immersion 咖啡機上展示了一個參考模型,通過“好的,咖啡師”這一語音提示可喚醒咖啡機。客戶可以使用語音指令來操作機器制作咖啡,還可以在等待咖啡沖泡時搜索天氣、體育和其他信息。
SoundHound 使用 NVIDIA GPU 訓練神經網絡和深度學習,并基于 GPU 運行著自己的數據中心。該公司在數千臺服務器上進行自然語言處理,并且可以處理數 TB 的數據。
Mohajer 說:“曾經可能需要幾個月才能完成的工作,現在只需幾天便可完成,這都要歸功于 GPU。如果沒有 GPU,這個行業將無法前行。”
-
NVIDIA
+關注
關注
14文章
5075瀏覽量
103537 -
gpu
+關注
關注
28文章
4768瀏覽量
129226 -
語音識別
+關注
關注
38文章
1742瀏覽量
112826
原文標題:NVIDIA GPU 助力 SoundHound 深耕語音 AI 市場
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論