色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

關于語音識別類產品細分及其應用場景分析

訊飛開放平臺 ? 來源:djl ? 作者:焦糖瑪奇朵 ? 2019-09-27 14:07 ? 次閱讀

你的童年是否也曾這樣對著大門發出命令?

當然,大門用靜止表示對你的“忽視”。樂此不疲的孩子還是會時不時對著門喊上幾句,我們的潛意識是希望得到門有所回應,比如:門開了。

命令失效的原因是什么?因為大門本身不具備聽到聲音的能力,如果我們能讓大門可以聽到你說的話、發出的命令,進一步才可以啟動語義和執行系統控制它的開關。

這就引申到本次重點介紹的技術——語音識別。本次干貨分享由語音識別產品經理:@ 焦糖瑪奇朵進行提供。希望能為大家打開語音識別的大門。

語音識別是一項將人類的聲音信號轉化為文字的過程。本文將從產品的角度對業界的語音識別產品進行歸類和說明。不同的產品類型具有不同的算法或者接口特性,對應不同的需求場景。

根據識別內容的范圍,語音識別的大類分列如下

1、封閉域識別:

識別范圍為預先指定的字/詞集合,即算法只在開發者預先設定的封閉域識別詞的集合內進行語音識別,對范圍之外的語音會進行拒識。因此,可以將其聲學模型和語言模型進行裁剪,使得識別引擎的運算量也較小。并且可將引擎封到嵌入式芯片或者本地化的SDK中,從而使識別過程完全脫離云端,擺脫對網絡的依賴,并且不會影響識別率。業界廠商提供的引擎部署方式包括云端和本地化(如:芯片,模塊和純軟件SDK)。

產品類型:命令字/詞識別,語音喚醒,語法識別

產品形態:流式傳輸-同步獲取

典型的應用場景:不涉及到多輪交互和多種語義說法的場景,如簡單指令交互的智能家居和電視盒子,語音控制指令一般只有:“打開窗簾”,“打開中央臺”等,但是一旦涉及到程序猿大大們在后臺配置識別詞集合之外的命令,如“給小編這篇文章來個打賞”,識別系統將拒識這段語音,不會返回相應的文字結果,更不會做相應的回復或者指令動作。

2、開放域識別:

無需預先指定識別詞集合,算法將在整個語言大集合范圍中進行識別。為適應此類場景,聲學模型和語音模型一般都比較大,引擎運算量也較大。將其封裝到嵌入式芯片或者本地化的SDK中,耗能較高并且影響識別效果。業界廠商基本上都以云端形式提供,云端包括公有云形式和私有云形式。本地化形式只有帶服務器級別計算能力的嵌入式系統,如會議字幕系統。

產品類型按照說話風格的特點,分為:

(1)語音聽寫:語音時長較短(<1min),一般情況下均為一句話。訓練語料為朗讀風格,語速較為平均。一般為人機對話場景,錄音質量較好。

按照音頻錄入和結果獲取方式定義產品形態:

(a)流式上傳-同步獲取,應用/軟件會對說話人的語音進行自動錄制并將其連續上傳至云端,說話人在說完話的同時能實時地看到返回的文字。語音云服務廠商的產品接口中會提供音頻錄制接口和格式編碼算法,供客戶端進行邊錄制邊上傳,并與云端建立長連接,同步監聽并獲取識別結果。

(b)已錄制音頻文件上傳-同步獲取,用戶需自行預先錄制好規定格式的音頻,并使用語音云服務廠商提供的接口進行音頻上傳,客戶端與云端的連接和結果獲取方式與上述音頻流類似。

典型應用場景:應用發展已經比較成熟:主要在輸入場景,如輸入法;與麥克風陣列和語義結合的人機交互場景,如具備更自然交互形態的智能音響,如“叮咚叮咚,轉發小編這篇文章。”,在無配置的情況下,識別系統也能夠識別這段語音,返回相應的文字結果。

(2)語音轉寫:語音時長一般較長(五小時內),句子較多。訓練語料為交談風格,即說話人說話無組織性比較強,因此語速較不平均,吞字&連字現象較多。錄音大多為遠場或帶噪的。

除了模型不同之外,按照音頻錄入和結果獲取方式定義產品形態:

(a)音頻流轉寫:流式上傳-同步獲取,與上述語音聽寫類似,唯一不同的是,識別的時長不會有一句話的限制。

(b)非實時已錄制音頻轉寫:已錄制音頻文件上傳-異步獲取,用戶需自行調用軟件接口或者是硬件平臺預先錄制好規定格式的音頻,并使用語音云服務廠商提供的接口進行音頻上傳,上傳完成之后便可以斷掉連接。用戶通過輪詢語音云服務器或者使用回調接口進行結果獲取。

由于長語音的計算量較大,計算時間較長,因此采取異步獲取的方式可以避免由于網絡問題帶來的結果丟失。也因為語音轉寫系統通常是非實時處理的,這種工程形態也給了識別算法更多的時間進行多遍解碼。而長時的語料,也給了算法使用更長時的信息進行長短期記憶網絡建模。在同樣的輸入音頻下,此類型產品形態犧牲了一部分實時率,花費了更高的資源消耗,但是卻可以得到最高的識別率。在時間允許的使用場景下,非實時已錄制音頻轉寫無疑是最推薦的產品形態!

典型應用場景:如字幕配置,客服語音質檢,UGC語音內容審查

概念厘清

1、離線VS在線

在訊飛開放平臺的產品定義和較多的客戶認知中,離/在線的區別在于識別過程是否需要通過云端請求,即識別引擎是在云端還是本地。而云計算中的離/在線產品的引擎都處在云端,區別在于在計算過程中,客戶端是否需要與云端進行實時數據交互,即上述所述的音頻流和非實時已錄制音頻轉寫。兩者的定義有沖突,因此并不建議使用離/在線概念進行相關產品定義。

2、8K VS 16Khz采樣率語音模型

在眾多語音云服務廠商中,會根據音頻采樣率進行分類,從而訓練出更適合各類采樣率的語音模型,最典型的為8K和16K模型。原始音頻信息保留越多越有利于識別率的提升,因此,16K音頻采用16K語音模型,其識別率會普遍高于8K音頻采用8K模型。

3、語音識別VS語義識別

語音識別是語義識別的前提基礎。語音識別將聲音轉化成文字,語義識別提取文字中的相關信息和相應意圖,通過執行模塊進行相應的問題回復或者反饋動作。

結語:

最后舉一個栗子作為收尾:“叮咚叮咚,給小編這篇文章點個贊唄。”,在無后臺配置的情況下,封閉域的語音識別系統會拒識這段語音,開放域的識別系統卻能夠識別這段語音,返回相應的文字結果。而現階段的開放域語義系統在大概率情況下,還是會回復得比較生硬,并且也不會自動識別出相應的意圖并做出指令。按照現有的比較通用的方法,這個功能需要使用封閉域的語義識別在后臺預先配置相關答案,并且根據預先配置的信息抽取意圖,再根據意圖類別和槽位信息執行相應的動作——即調用微信的點贊接口(假設可以)進行相應的點贊操作。

聽起來好繞呀,是不是覺得還是自己手動點個贊簡單粗暴省事得多了呢?然而,一切現代人類做起來自然而然&毫不費力的動作,卻都是建構在經過了億萬年的學習進化,兆億次閉環重復練習的智人基因!而任何的人工智能技術也是需要一個巨量的數據訓練和一定的演變周期。并且在所有的科技發展進程中,率先取得突破并且在應用領域產品成熟化往往都是在封閉域,亦如現在正處封閉域產品化的語義識別(如:AIUI,echo等),而語音識別的產品成熟化已經走過了封閉域到達了開放域,正在向各行各業輸送人工智能的力量!

附圖:語音識別產品類別圖

關于語音識別類產品細分及其應用場景分析

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 語音識別
    +關注

    關注

    38

    文章

    1739

    瀏覽量

    112635
  • 云服務
    +關注

    關注

    0

    文章

    818

    瀏覽量

    38908
收藏 人收藏

    評論

    相關推薦

    PCBA分析儀的技術原理和應用場景

    PCBA分析儀,通常指的是多功能PCBA測試儀,是一種綜合性測試設備,能夠同時進行多種測試,如功能測試、ICT(在線測試)、AOI(自動光學檢測)、X射線檢測等。以下是對其技術原理和應用場景的詳細
    發表于 12-04 14:31

    測試接收機的技術原理和應用場景

    測試接收機是一種專門用于信號測量和分析的電子設備,具有高精度、高靈敏度、高穩定性等特點。以下將詳細闡述測試接收機的技術原理和應用場景。一、技術原理測試接收機的工作原理是將待測設備產生的信號通過
    發表于 12-03 14:23

    射頻分析儀的技術原理和應用場景

    射頻分析儀是一種功能強大的電子測量儀器,在無線通信、電子測試等領域具有廣泛的應用。以下是關于射頻分析儀的技術原理和應用場景的詳細介紹:一、射頻分析
    發表于 11-26 14:32

    無線通信頻譜分析儀的技術原理和應用場景

    無線通信頻譜分析儀是一種用于測量信號頻譜特性的重要儀器,其技術原理和應用場景如下:技術原理無線通信頻譜分析儀的工作原理主要基于傅立葉變換,這是一種將信號從時域轉換到頻域的數學工具。具體過程如下
    發表于 11-07 15:13

    SUMIF函數的應用場景分析

    SUMIF函數在Excel中是一個強大的數據分析工具,特別適用于需要對數據進行條件篩選并求和的場景。以下是對SUMIF函數應用場景分析: 1. 財務數據
    的頭像 發表于 10-30 09:55 ?315次閱讀

    便攜式示波器的技術原理和應用場景

    便攜式示波器作為示波器的一種,具有體積小、重量輕、便于攜帶等特點,在多個領域有著廣泛的應用。以下是對其技術原理和應用場景的詳細介紹:一、技術原理便攜式示波器的基本原理與傳統示波器相同,都是通過采集
    發表于 10-24 14:31

    實時示波器的技術原理和應用場景

    有頻譜分析功能,可以將時域信號轉換為頻域信號,從而顯示信號的頻譜特性。綜上所述,實時示波器憑借其獨特的技術原理和廣泛的應用場景,在電子工程和通信技術領域發揮著不可替代的作用。
    發表于 10-23 14:22

    參數分析儀的技術原理和應用場景

    參數分析儀的技術原理和應用場景因其具體類型和用途的不同而有所差異。以下是對參數分析儀技術原理和應用場景的詳細歸納: 技術原理 基于物理性質的測量: 某些參數
    發表于 10-17 14:42

    太陽膜測試儀的技術原理和應用場景

    性能及其在不同應用場景下的表現。這有助于推動太陽膜技術的發展和創新。 綜上所述,太陽膜測試儀通過其獨特的技術原理和廣泛的應用場景,在多個行業中發揮著重要的作用。隨著技術的不斷進步和應用領域的不斷拓展,太陽膜測試儀的性能和功能也將
    發表于 09-29 14:18

    物聯網系統智能控制產品語音識別方案_離線語音識別芯片分析

    01 物聯網系統中為什么要使用離線語音識別芯片 物聯網系統中使用離線語音識別芯片的原因主要基于以下幾個方面: 1、實時性與可靠性 實時性好:離線語音
    的頭像 發表于 09-26 17:56 ?558次閱讀
    物聯網系統智能控制<b class='flag-5'>產品</b>的<b class='flag-5'>語音</b><b class='flag-5'>識別</b>方案_離線<b class='flag-5'>語音</b><b class='flag-5'>識別</b>芯片<b class='flag-5'>分析</b>

    NFC協議分析儀的技術原理和應用場景

    的安全性,并提出相應的防護措施和改進建議。 綜上所述,NFC協議分析儀在移動支付、門禁系統、智能標簽識別、物聯網設備控制以及安全分析等領域都有廣泛的應用場景。它能夠幫助用戶快速準確地
    發表于 09-25 14:45

    USB協議分析儀的技術原理和應用場景

    USB協議分析儀的技術原理和應用場景可以詳細闡述如下:技術原理USB協議分析儀的技術原理主要基于以下幾個方面: 總線監聽:USB協議分析儀通過監聽USB總線上的數據傳輸過程,實時捕獲U
    發表于 09-24 14:29

    「芯知識」NRK3601語音識別芯片的功能特性及應用場景介紹

    NRK3601是一款高性能、低成本語音識別芯片,支持精準離線識別,降噪效果好,可應用于智能家居、智能小家電等場景。其具備多種功能特性和外設接口,適應性強,未來有望在更多領域發揮作用。
    的頭像 發表于 06-12 13:12 ?386次閱讀

    NanoEdge AI的技術原理、應用場景及優勢

    能耗并提高數據安全性。本文將對 NanoEdge AI 的技術原理、應用場景以及優勢進行綜述。 1、技術原理 NanoEdge AI 的核心技術包括邊緣計算、神經網絡壓縮和低功耗硬件設計。邊緣計算
    發表于 03-12 08:09

    AG32VF-MIPI應用場景

    to 1.2Gbps MIPI D-PHY以及DSI硬核 AG32VF-MIPI的應用場景,包括了基本的MIPI屏幕驅動,以及各種顯示橋接場合,如下圖所示。 AG32VF-MIPI系列產品即將正式發布。
    發表于 01-22 08:56
    主站蜘蛛池模板: 亚洲粉嫩美白在线| 男女久久久国产一区二区三区| 国产午夜伦鲁鲁| 国产香蕉视频在线观看| 国产中文字幕乱码免费| 精品亚洲国产成AV人片传媒| 久久黄色免费| 欧美gay老头互吃| 日韩精品a在线视频| 天天插天天舔| 野花香在线观看免费高清播放视频 | 97视频免费在线| 把内衣脱了把奶露出来| 国产精品九九九久久九九| 国内精品视频在线播放一区| 久久亚洲精品成人综合| 欧美亚洲精品午夜福利AV| 乌克兰10一12x video| 妖精视频在线观看高清| 99久久免费看少妇高潮A片| 岛国大片在线播放高清| 果冻传媒在线完整免费播放| 绝色娇嫩美人妻老师| 欧美性受xxxx狂喷水| 亚州综人网| 2022国产麻豆剧传媒剧情| 福利视频一二三在线观看| 精品无码乱码AV| 轻轻挺进女教师的身体| 亚洲成人免费看| 97精品在线观看| 国产睡熟迷奷系列网站| 免费一级片网站| 香蕉尹人综合精品| 97色伦久久视频在观看| 国产精品久久久久久久久齐齐| 久久综合电影| 丝瓜视频樱桃视频在线观看免费| 伊人综合在线22| 国产成人免费高清视频| 蜜桃成熟时2在线|