在2019年,三星就曾預告過新的“人造人”NEON助手,并表示NEON可以像真正的人類一樣進行對話,并有一定的感知能力。NEON的網站上宣傳其外觀和行為都像真實的人類,能夠表現出情感和智慧,而據相關消息,三星最終將隨三星Galaxy S21 Ultra獨家發售這款數字助手。
數字助手首先也是一款手機助手軟件,目前,智能手機能夠提供各種類型的應用服務,其中就包括手機助手軟件,用戶可以通過語音、文字等方式與智能手機之間進行交互,智能手機通過該語音識別助手軟件識別語音后,提供對應的應用服務。
智能手機識別語音的功能可以有三種方式:交互任務型、知識問答型及閑聊型。其中,交互任務型語音識別方式使得用戶可以通過直接的語音輸入,由智能手機識別該語音,完成與智能手機的應用服務之間的交互意圖,而無需進行多次語音識別界面的操作。
但是,智能手機提供的交互任務型語音識別方式對用戶來說,使用率并不高,這是因為用戶在通過語音操控智能手機時,存在以下缺點:1)公眾場合不適合使用語音,有隱私問題;2) 智能手機處于嘈雜的遠程環境下,語音識別的效果不佳;3)因為用戶發音不準確,形同意思的表述方式多樣等因素,語音識別和語音理解的準確率還需要提高;4)有些用戶不習慣使用智能手機提供的語音識別界面。
那么,智能手機該如何在這些條件下簡便且準確地采用語音識別方式實現交互任務呢?為此,三星在2019年9月27日申請了一項名為“一種采用語音識別方式實現交互任務的方法及系統”的發明專利(申請號:201910921533.6),申請人為三星電子(中國)研發中心和三星電子株式會社。
根據該專利目前公開的資料,讓我們一起來看看這項應用于智能設備的語音識別方法及系統吧。
如上圖,為該專利中發明的采用語音識別方式實現交互任務的方法流程示意圖,首先,系統會基于當前環境進行語音識別來得到文本以及語義信息,基于得到的文本以及語義信息,來確定對應的上下文信息,且劃分不同的場景,基于不同的場景來在系統中匹配不同的語音技能推薦表。
這種利用語音技能推薦表的方式,可以更加準確的應對不同的場景,通過事先準備好豐富的語料庫,就可以非常人性化的與用戶進行對話以及完成相應的操作。而當要實現交互任務時,則會根據語音技能推薦表執行智能手機的交互任務。同時,由于是智能助手主動分析用戶所處場景,并主動提供相關的操作服務,因此無需用戶主動發起語音喚醒,而是由語音助手主動為用戶提供相關服務,只需用戶進行選擇即可。
如上圖,為這種采用語音識別方式實現交互任務的方法子流程圖,當用戶喚醒語音助手插件模塊時,語音助手插件模塊被觸發,該模塊通知語言輸入信息采集模塊啟動信息采集,信息采集模塊通過上下文感知模塊獲取到當前的環境信息,再向語音助手插件模塊發送請求,來獲取從用戶語音識別得到的文本,以及做自然語言理解后的語義信息。
之后,語言輸入信息采集模塊將采集到的文本、語義信息及當前的環境信息傳輸給語言技能生成模塊,由此來生成語言技能庫,并通知語言技能推薦模塊。
語言技能推薦模塊在特定情況下可以啟動,將大量不同的上下文劃分到若干類場景中,對每個場景生成相應的語言技能推薦表。
如上圖,為在手機上使用語言技能推薦表的展示圖,該款語音助手插件模塊為Bixby,當每次都調用Bixby時,都會顯示出語言技能推薦表,并且場景不同,該語言技能推薦表中的推薦技能偶讀不同。
例如,經過學習后,如果用戶打開手機并且喚醒了Bixby,則就可以觸發語言技能推薦表的展示,當用戶選擇某條推薦的語言技能時,將該語言技能推薦表中的文本用作用戶語言輸入識別的結果,以完成后續用戶的指令。
以上就是三星發明的可以完成精準語音識別任務的靜默式語音識別助手,其在實現交互任務時,基于當前環境下對語音識別得到文本以及語音信息,在交互時無需發出語音,僅通過用戶少量選擇操作就可以完成復雜的交互任務,因此可以簡便且準確地采用語音識別方式來實現交互任務。
責任編輯:YYX
-
智能手機
+關注
關注
66文章
18499瀏覽量
180382 -
三星電子
+關注
關注
34文章
15865瀏覽量
181054 -
語音識別
+關注
關注
38文章
1742瀏覽量
112698
發布評論請先 登錄
相關推薦
評論