色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

回顧語音識別技術優勢及產品落地之路的應用發展

訊飛開放平臺 ? 來源:djl ? 作者:汪艦 ? 2019-10-08 08:32 ? 次閱讀

什么是語音識別

語音識別是以語音為研究對象,通過語音信號處理和模式識別讓機器自動識別和理解人類口述的語言。

語音識別技術歷史發展進程

語音識別的研究可以追溯到20世紀50年代AT&T貝爾實驗室的Audry系統,它是第一個可以識別十個英文數字的語音識別系統。

但真正取得實質性進展,并將它作為一個重要的課題開展研究則是在60年代末70年代初。計算機技術的發展為語音識別的實現提供了硬件和軟件的可能,語音信號線性預測編碼(LPC)技術和動態時間規整(DTW)技術的提出,有效解決了語音信號的特征提取和不等長匹配問題。這一時期語音識別主要基于模板匹配原理,研究的領域局限在特定人,小詞匯表的孤立詞識別,實現了基于線性預測倒譜和DTW技術的特定人孤立詞語音識別系統;同時提出了矢量量化(VQ)和隱馬爾可夫模型(HMM)理論。

80年代HMM和ANN在語音識別中成功應用。李開復實現了第一個基于HMM的大詞匯量語音識別系統Sphinx。90年代隨著多媒體時代的來臨,大量企業開始投入巨資語音識別系統逐漸從實驗室走向實用。00年代以來大數據、漣漪效應和深度神經網絡帶來了語音識別爆發。

語音識別的過程

首先是聲音的輸入,輸入的音頻可以是實時的來自于麥克風,也可以來自于現成的音頻文件。然后是音頻信號的預處理,包括降噪、回聲消除、端點檢查和模數轉換等等。特征提取,就是從音頻信號中提取出對識別有用的信息,將這些信息拿到聲學模型中去匹配,會得到這些音頻信號的發音信息,比如這里例子中的“科大訊飛”四個字的發音信息。然后把這些發音信息拿到語言模型中匹配,找出最大概率的發這四個音的漢字。這樣一個識別的過程就完成了。

這過程中比較核心的部分就是聲學模型和語言模型的匹配和處理,HMM(隱馬爾科夫模型)和深度神經網絡就是在這里發揮作用的。

由于HMM只需要少量的數據就能訓練出一個可用的模型,所以在上世界80、90年代,HMM技術在語音識別領域幾乎是處于統治地位的,直到移動互聯網還有大數據技術的爆發,數據的來源已經完全不是問題的情況下,深度神經網絡才逐漸讓HMM退居二線。下面我們以HMM為例,講解一下它在語音識別中是如何發揮作用的。

HMM淺析

首先和大家分享一個我在網上看到的關于異地戀的故事:小明有個女朋友在北京上學。

我們來給出一些假設條件,比如女朋友只有購物散步和宅家里這三種活動(這些叫可觀察到的狀態),天氣也只有多云晴天和下雨三種(這些叫隱藏的狀態,就是小明無法直接觀察到的狀態),如果第一天是多云的情況下,第二天還是多云的概率是0.5、晴天的概率0.3、下雨的概率0.2;再比如今天是晴天的情況下,女朋友去購物的概率是0.5,去散步的概率0.3,宅家里的概率0.2。那么所有上述的假設條件合在一起其實就形成了一個模型,這個模型就叫做HMM模型。

這三個問題在很早以前就有很多算法大師給出了解法,也就是說這些看起來很難解的問題對計算機來說都很快解出來。

那么這些和語音識別到底有什么關系?我將第二個問題和第三個問題抽象一下。

大家看這張PPT,左邊這個部分就對應剛剛的第二個問題:已知模型參數和女朋友的活動序列(就是可觀察狀態鏈),來求最大概率的隱藏狀態鏈(也就是這三天天氣的變化序列)。

而語音識別也是已知一個HMM和一段我們可觀察到的波形,來求這段音頻包含的最大概率的隱藏狀態,這里隱藏狀態鏈指的就是識別結果中的文字。

對于第三個問題,由于缺少了一個已知的HMM模型,所以我們需要先利用已知的歷史數據來訓練一個可用的模型,然后再來求識別結果。

同樣一個模型,同樣一套模型參數,各個狀態轉化和映射概率都沒有變,我們把可觀察狀態換成語音識別的輸入波形(或者說是波形特征),把隱藏狀態換成語音識別的輸出(也就是文字結果),就會發現這個HMM用來做語音識別簡直太合適啦。

比如這里的例子,這樣三個連續的波形隱含的文字到底是“是十四”還是“四十四”,我們只需要分別把它們的概率算出來,哪個概率大我們就認為是哪個結果。對于HMM模型未知的情況下,我們可以利用帶標注的數據按照鮑姆-韋爾奇算法訓練一個就可以了,足夠的數據就能訓練出趨于完美的模型。

注意,這個例子中我們并沒有區分聲學模型和語言模型,而是將兩者放在一起抽象出來一個大的模型,將波形直接映射成文字,而省去類似拼音發音的中間結果。事實上HMM也的確是既可以做聲學模型,也可以做語言模型。

訊飛開放平臺語音識別

本節公開課說的我們平臺的語音識別是專指語音聽寫的功能,就是將語音轉化成文字的功能,而和識別相關的命令詞識別和語義理解,會在后面的課程中為大家講解。

個性化識別指的是語音識別系統具備自動學習并適應用戶使用習慣的能力,你用的越多,它越懂你。

例如語言模型的個性化,我們可以將一些不容易識別的生僻的詞,比如人名地名等上傳到給我們云端,我們根據你上傳的信息有針對性的優化你的語言模型,提高這些詞的識別率。后面會有視頻給大家演示這樣的效果。

目前我們訊飛的識別支持中文和英文,還支持中文的21種方言,其中粵語和四川話是免費開放就可以使用的,其他的方言需要通過商務合作后才能使用。

離線聽寫也是有的,在訊飛輸入法和訊飛語記app中都已經使用了。大家要開發Android平臺的應用可以借助語記APP提供離線聽寫能力,來讓你自己的應用也具有離線聽寫的功能。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 語音識別
    +關注

    關注

    38

    文章

    1742

    瀏覽量

    112711
收藏 人收藏

    評論

    相關推薦

    基于語音識別的智能會議系統具備哪些交互功能

    標貝科技專注智能語音交互領域多年,在語音識別語音合成領域有著多項大型企業合作案例,標貝與多個智能會議系統廠商合作,成功將語音
    的頭像 發表于 12-20 10:35 ?143次閱讀

    標貝智能語音識別在智能會議場景中的落地案例

    標貝科技專注智能語音交互領域多年,在語音識別語音合成領域有著多項大型企業合作案例,標貝與多個智能會議系統廠商合作,成功將語音
    的頭像 發表于 12-20 10:31 ?202次閱讀
    標貝智能<b class='flag-5'>語音</b><b class='flag-5'>識別</b>在智能會議場景中的<b class='flag-5'>落地</b>案例

    語音識別技術的應用與發展

    語音識別技術發展可以追溯到20世紀50年代,但直到近年來,隨著計算能力的提升和機器學習技術的進步,這項
    的頭像 發表于 11-26 09:20 ?541次閱讀

    ASR語音識別技術應用

    ASR(Automatic Speech Recognition)語音識別技術,是計算機科學與人工智能領域的重要突破,能將人類語音轉換為文本,廣泛應用于智能家居、醫療、交通等多個領域。
    的頭像 發表于 11-18 15:12 ?803次閱讀

    HPLC智能電表有什么技術優勢嗎?

    HPLC(高速電力線通信)智能電表作為一種先進的智能計量設備,憑借其獨特的技術優勢,在電力管理領域得到了廣泛應用。下面我們將詳細介紹HPLC智能電表的主要技術優勢。1.高傳輸速率-高速數據傳輸
    的頭像 發表于 09-26 18:00 ?515次閱讀
    HPLC智能電表有什么<b class='flag-5'>技術優勢</b>嗎?

    智能玩具用離線語音識別芯片有什么優勢

    隨著科技的發展,很多智能電子產品和兒童玩具實現了與人類的交互,語音芯片在這些人機交互中起到了不可替代的作用,語音識別芯片在智能玩具中的應用就
    的頭像 發表于 09-20 10:00 ?296次閱讀
    智能玩具用離線<b class='flag-5'>語音</b><b class='flag-5'>識別</b>芯片有什么<b class='flag-5'>優勢</b>

    碳化硅功率器件的技術優勢

    優勢,成為了電力電子領域的一顆璀璨新星。本文將深入探討碳化硅功率器件的物性特征、技術優勢、應用前景以及面臨的挑戰。
    的頭像 發表于 09-11 10:43 ?317次閱讀

    Transformer模型在語音識別語音生成中的應用優勢

    隨著人工智能技術的飛速發展語音識別語音生成作為人機交互的重要組成部分,正逐漸滲透到我們生活的各個方面。而Transformer模型,自其
    的頭像 發表于 07-03 18:24 ?1180次閱讀

    人工智能的語音識別技術詳解

    隨著科技的飛速發展,人工智能(AI)技術已經滲透到我們生活的方方面面,其中語音識別技術作為AI領域的重要分支,更是以其獨特的魅力和廣泛的應用
    的頭像 發表于 07-01 11:39 ?1318次閱讀

    藍鵬測控的激光測徑儀有哪些技術優勢

    具有顯著的技術優勢,使得其產品在市場上具有較高的競爭力和應用價值。 網站名稱:保定市藍鵬測控科技有限公司 可根據客戶需求提供解決方案,定制產品。 歡迎QQ咨詢:2087627071 電話
    發表于 05-24 17:25

    高速信號差分線的技術優勢

    隨著信息技術的飛速發展,高速信號傳輸已成為現代通信和數據處理中不可或缺的一環。在高速信號傳輸中,差分線技術因其獨特的優勢而得到廣泛應用。本文將從差分線的基本原理、抗干擾能力、帶寬容量、
    的頭像 發表于 05-16 16:31 ?872次閱讀

    **十萬級口語識別,離線自然說技術,讓智能照明更懂你**

    固定詞條等。針對這些問題,啟英泰倫現已推出成熟的可應用于照明設備的離線自然說方案,該方案已在多家智能照明廠商最新產品上實現應用落地。 照明離線自然說方案采用啟英泰倫第三代AI語音芯片(芯片Flash
    發表于 04-29 17:09

    澎湃微離線語音識別應用實例

    隨著科技的飛速發展,人機交互的方式也在不斷演變。在鍵盤、觸摸屏之后,語音識別技術正逐漸成為人機交互的新寵。從技術路線上來講
    發表于 03-15 14:11 ?445次閱讀
    澎湃微離線<b class='flag-5'>語音</b><b class='flag-5'>識別</b>應用實例

    車內語音識別技術在智能駕駛中的應用與前景

    一、引言 隨著智能駕駛技術的快速發展,車內語音識別技術逐漸成為智能駕駛領域的研究熱點。語音
    的頭像 發表于 02-19 11:46 ?846次閱讀

    車內語音識別技術:智能駕駛的核心要素

    一、引言 隨著科技的飛速發展,智能駕駛已經成為未來出行的趨勢。作為智能駕駛的關鍵技術之一,車內語音識別技術發揮著越來越重要的作用。它不僅提升
    的頭像 發表于 02-19 11:42 ?803次閱讀
    主站蜘蛛池模板: 久久久久久久尹人综合网亚洲| 国产区免费在线观看| 成在线人免费| 久久中文字幕乱码免费| 亚洲精品综合在线影院| 国产精品青草久久福利不卡| 日韩精品a在线视频| 抽插喷S骚爽去了H| 日韩欧美成人免费中文字幕| 草草久久久亚洲AV成人片| 欧美男女爱爱| 伦理片在线线249| 夜月视频直播免费观看| 娇妻玩4P被三个男人伺候电影 | 国产精品第十页| 国产又黄又粗又爽又色的视频软件 | 午夜婷婷精品午夜无码A片影院| 一个人色导航| 调教女M屁股撅虐调教| 日本精品久久久久中文字幕 1| yellow在线中文| 秋霞网站一级一片| 一个人HD在线观看免费高清视频| 交换邻居波多野结衣中文字幕 | 人妻仑乱少妇88MAV| 亚洲乱码在线卡一卡二卡新区| 亚欧乱亚欧乱色视频| 强奸美女老师| 成人在线视频免费看| 石原莉奈rbd806中文字幕| 姉调无修版ova国语版| 麻豆成人啪啪色婷婷久久 | 亚洲第一天堂无码专区| 精品国产乱码久久久久久乱码| 影音先锋亚洲AV少妇熟女| 美国特级成人毛片| 丰满大屁俄罗斯肥女| 亚洲国产欧美另类| 久久综合丁香激情久久| 菠萝蜜国际一区麻豆| 亚洲国产精品久久又爽黄A片|