華為的該項技術當中,語音系統為多個NLP引擎的每一個識別結果進行打分,最后確定一個或多個識別結果以及輸出次序,并按次序向用戶輸出該一個或多個識別結果,可以實現對引擎的篩選,做到優中選優。
華為在2013年1月提出了一種語音處理方法,并提供了系統和終端。該發明可以利用到多個廠商的技術,從而可以根據實際需求得到各種側重點不同的搜索結果。
圖1
圖1所示為語音處理方法的系統框圖。S110在獲取一個錄音片段流之后,可以將該錄音片段流發送至多個自然語言處理NLP引擎,其中,NLP引擎處理的錄音片段流可以由終端直接發送,也可以通過代理服務器獲取。
每個NLP引擎收到錄音片段流之后即可進行識別,進而獲取一個或多個識別結果,并對每一個識別結果進行打分,最后將獲取到的識別結果以及每一個識別結果的分數發送給終端。
具體地,在接收到來自于多個NLP引擎中的識別結果之后,打分系統可以對NLP引擎的本次識別結果進行打分。一方面,打分系統可以根據每一個NLP引擎的響應時間、給出識別結果的多少或識別結果的離散程度,對每一次識別結果進行打分,并根據總分對識別結果進行排序。另一方面,用戶可以根據實際需求,設定不同的得分權重來控制總得分中各項得分的比例。
S130根據來自于多個NLP引擎的識別結果,確定一個或多個識別結果以及輸出次序向用戶輸出(例如,通過顯示器或揚聲器向用戶輸出),供用戶選擇。
圖2
圖2所示為終端200的示意性框圖,發送單元210將語音發送至多個NLP引擎進行識別,以獲取識別結果。
接收單元220接收多個NLP引擎的識別結果之后,由確定單元230對NLP引擎的每一個識別結果進行打分,并確定一個或多個識別結果以及輸出次序。
輸出單元240根據輸出次序向用戶輸出一個或多個識別結果。
圖3
圖3所示為終端300的示意性框圖,存儲器310存儲一組程序代碼,處理器340調用存儲器310存儲的程序代碼,執行以下操作:
將語音通過發送器330發送至多個NLP引擎進行識別,以獲取識別結果;
接收器320接收來自于多個NLP引擎的識別結果;
處理器340對每一個識別結果進行打分,確定一個或多個識別結果以及輸出次序;
輸出裝置360根據輸出次序向用戶輸出識別結果。
圖4
圖4是語音處理系統400的示意性框圖。終端410即為上文介紹的終端200和終端300。圖中的多個引擎430接收終端發送的語音后,對語音進行識別,以獲取識別結果,并將獲取的識別結果發送至終端。代理服務器430用于接收終端發送的語音,并將所述語音轉發至多個NLP引擎。
在該發明中,通過將語音發送至多個NLP引擎,使多個NLP引擎分別對語音進行識別,以獲取識別結果;接收來自多個NLP引擎的識別結果;根據來自多個引擎的識別結果,向用戶輸出可供用戶選擇的識別結果,可以使多個NLP引擎為用戶的一段語音進行處理。該發明可以利用到多個廠商的技術,從而得到各種側重不同的結果。
在上述系統中,系統可以為多個NLP引擎的每一個識別結果進行打分,最后確定一個或多個識別結果以及輸出次序,并按次序向用戶輸出一個或多個識別結果,可以實現對引擎的篩選,做到優中選優。
-
華為
+關注
關注
216文章
34473瀏覽量
252030 -
語音系統
+關注
關注
1文章
27瀏覽量
13007
發布評論請先 登錄
相關推薦
評論