色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

關于語音增強技術的介紹和應用

貿澤電子 ? 來源:djl ? 作者:貿澤電子 ? 2019-08-20 17:33 ? 次閱讀

在嘈雜的環境中,對于手機、可穿戴設備和其它智能設備來說聲音隔離技術能夠提升語音增強和識別準確度

聲音或語音用戶接口在手機、平板電腦、可穿戴設備和其它智能設備上變得越來越普遍和重要,因為這項技術確實讓這些設備不需要再設計鍵盤或者觸摸屏。為了能夠提供更精確的語音處理過程,系統在設計時必須要保證對語音正確可靠的識別,即使在復雜的噪聲環境條件中。

目前已經有數百萬人已經依賴自動語音識別技術來將語音轉換為文字來編寫文檔和生成文本。然而自動語音識別的質量主要依賴于一些最優條件,比如假設每個人說話的方式與聲音訓練數據非常類似,講話處在安靜的環境中避免噪聲干擾,即使這樣也需要工作人員來修改文字錯誤、標點以及語法錯誤,此外還可能存在其他類型的翻譯錯誤。語音技術的持續改進對于提升設備對人類語言的識別準確度非常有必要,在手機、智能設備應用以及諸如汽車這樣的噪聲環境下語音識別技術的效果對其能否成功至關重要。

圖1:噪聲環境下聲音隔離技術提升設備的語音增強和識別效果(來源:安森美半導體

語音增強是基于聲音隔離和噪聲抑制技術,本篇文章主要介紹聲音隔離技術,實現噪聲剔除和語音增強,因此下面只對噪聲抑制做了簡要介紹。

噪聲抑制技術能夠幫助去除不同類型的背景噪聲,防止干擾語音識別。噪聲的顯著特征主要體現在時間域和頻域,時間域的噪聲包括連續、斷續和脈沖型的噪聲,頻域噪聲包括寬頻帶和窄頻帶噪聲。辦公室和交通的聲音、操作設備的聲音和嘶嘶聲是典型的連續型噪聲,這類噪聲變化非常慢。非連續型噪聲是重復的噪聲,比如喇叭或者鈴鐺的聲音。脈沖式的噪聲通常比較生硬如點擊和重擊的聲音。寬頻噪聲如嘶嘶聲可能有不同的頻率,窄頻噪聲的發生往往在一定的頻率范圍內,包括正弦波、嗡嗡聲和機器噪聲。

工程師們已經嘗試了各種濾波技術,每種技術會對不同類型的噪聲都有一定的積極作用。然而每種噪聲的特性會隨著時間有些改變,工程師可能也需要采用自適應算法來動態匹配噪聲的變化,一些噪聲剔除技術的例子包括頻率補償、脈沖過濾、自適應寬頻濾波、自適應逆向濾波和立體濾波等。

認識聲音隔離技術

聲音隔離是提升語音識別度的一種新型方法,傳統的方式是屏蔽和過濾不同的噪聲,聲音隔離技術則側重于鑒別人語音的某種具體特征來判定和傳輸有效的語音,從而過濾掉背景噪聲。聲音隔離技術能夠顯著提升語音的清晰度和識別度,即使在噪聲環境中。為了能夠可靠的鑒別人語音的部分,聲音隔離系統需要采用聲學和語言模型,這里向大家介紹了兩種目前嵌入式設計中采用的建模方法。第一種是深度神經網絡算法,第二種是耳蝸仿真,即模擬人聽力系統從內耳到大腦的行為。

采用深度神經網絡的方法需要一個大型數據庫,包含數百小時以上的噪聲和語音,用于訓練算法系統。起初在這個數據庫對語音沒有概念,通過大量的訓練開始學習鑒別人類不同的語音模式,聲音隔離的質量包括能夠判定不同聲音的來源,通過兩個或者更多的麥克風來采集音頻數據能夠提升其效果,這個網絡甚至能夠訓練識別是誰在發聲、何時在發聲等效果。

數據庫包含的信息會被用來創建小型快速算法,然后移植到目標數字信號處理器DSP)上來執行實現語音的監測和分類。根據數據庫中存儲的信息開發出來的自適應算法的組合就被稱為神經網絡。

神經網絡算法會將輸入的聲音進行分解,對不同的聲音分段來分析來判定人不同的語音模式,神經網絡會分析聲音段的不同特征包括頻率、諧波、“攻擊”和衰減特性,從而從環境聲音中區分出語音。神經網絡會基于音頻采樣率來權衡性能,低采樣率需要的處理更少當然精確度也會低,越高的采樣率越精確,當然計算處理過程也更復雜。

不同的濾波算法用于聲波紋識別同時移除不想要的音頻部分,多通濾波器的使用會更有效的過濾同時能夠恢復任何丟失的音頻部分。在后處理階段通過設置不同的算法參數,聲音能夠被一定程度的優化適合人的聽力系統或者用于語音識別系統,這非常重要因為人類和語音識別系統采用不同的語音解析方式。

耳蝸仿真

這種聲音隔離方法采用DSP平臺運行計算機聽覺場景分析(CASA)算法來模擬人類聽覺系統將語音從噪聲環境中提取出來。這種方式會對音頻信息進行編碼從而實現分組和解析。目前有幾十種分組依據涉及時間和頻率相關,包括音高、空間位置和起始/結束時間。

音高是一個非常重要的分組依據,它根據不同的諧波模式來鑒別某種聲音的唯一特征。當采用兩個或者多個麥克風時,聲音隔離系統可以根據空間位置信息來確定每個麥克風聲音的方向和距離。CASA建模方式使得聲音隔離系統實現“雞尾酒會效應”,讓系統能夠集中于某一聲音源,比如某個特定的人,并且屏蔽掉背景聲音。起始/停止時間分組指的是某一聲音成分開始出現和停止的時刻,這些數據與原始的頻率數據合并時就能夠判斷是否來自同一聲音源。

圖2:各種聲音隔離方法被采用實現所謂的“雞尾酒會效應”,即屏蔽掉一系列噪聲集中識別某一特定的聲音源。

具有相似屬性的聲音會形成同一音頻流,同樣的,不同的屬性的會形成各自的音頻流。這個系統就可以采用這些不同的音頻流來鑒別持續或者重復的聲源。一旦有了足夠的聲音分組,實際的聲音隔離處理就會從已經鑒別過的聲源中去匹配,并且響應真正說話者的聲音。逆向轉換可將數據重新構造為音頻流并傳輸供人來聽。

注意事項

聲音隔離不僅適合提供高質量的語音——語音識別系統,還有很多其他重要應用。比如在緊急情況下往往是比較嘈雜混亂的環境,這時快速且準確的語音通訊對于生命安全非常關鍵,通過清晰的語音識別急救人員就能夠快速的定位求救人員。相比噪聲抑制方法,聲音隔離提供了一種更加高效的機制,盡管在不可控的環境條件下也能夠提升語音通信識別度。

專用的DSP聲音處理器能夠帶來性能的優化同時保持較低的功耗,尤其對于一直打開的語音應用或者要求用戶手動(比如長按按鈕)初始化激活語音識別接口非常重要,需要一直打開的語音功能不可避免的要持續造成功耗,因為系統處理器一直保持活動狀態。與此相反,為了節省電池能量,需要一直打開的語音應用可以采用專用的語音處理器,這種處理器支持睡眠模式,保留一定的功能,此外還支持低功耗監聽模式以及全功能喚醒模式。

語音功能不再僅面向手持設備和智能手機了,可穿戴設備正式得益于用戶語音功能才不需要設計鍵盤或者觸摸屏功能了。隨著語音功能的成熟,用戶與設備之間的距離也會增加。舉個例子,現在一些智能電視支持語音命令,這些電視一般會放在客廳,同時需要考慮用戶隱私和安全問題,需要重新執行完善的方案,相信用戶語音功能會在更多的傳統電子產品設備中獲得應用。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 濾波
    +關注

    關注

    10

    文章

    667

    瀏覽量

    56687
  • 神經網絡
    +關注

    關注

    42

    文章

    4774

    瀏覽量

    100911
  • 語音增強技術

    關注

    0

    文章

    3

    瀏覽量

    5571
收藏 人收藏

    評論

    相關推薦

    色噪聲環境中TLS-ESPRIT諧波譜重構語音增強研究

    語音信號?!娟P鍵詞】:諧波譜重構;;總體最小二乘旋轉不變子空間技術;;語音增強;;空間譜估計【DOI】:CNKI:SUN:DSJS.0.2010-02-013【正文快照】:1引言在現
    發表于 04-22 11:56

    畢設 語音信號增強 急急急!??!

    語音信號增強技術哪位大神能把維納濾波語音增強算法的 MATLAB 的源程序給我啊 重謝吶?。?!
    發表于 05-17 22:29

    AR增強現實技術介紹

    AR增強現實技術解讀
    發表于 01-26 06:29

    關于MOST技術的基本介紹須知

    關于MOST技術的基本介紹須知
    發表于 05-19 06:27

    關于藍牙與WiFi共處技術介紹

    關于藍牙與WiFi共處技術介紹
    發表于 05-28 07:21

    sigmastudio有沒有語音增強的算法或組合實現功能?

    在ADAU1401芯片下,有沒有具體實現語音信號增強的算法實現
    發表于 11-29 07:55

    麥克風陣列語音增強技術及其應用

    本文簡要敘述了應用麥克風陣列進行語音增強的原理及方法。且由于麥克風陣列在實際語音處理時具有良好的拾取語音能力及噪聲魯棒性,本文將介紹
    發表于 09-08 10:20 ?52次下載

    基于CRV_LMS算法的語音增強技術的研究_伍彩云

    基于CRV_LMS算法的語音增強技術的研究_伍彩云
    發表于 03-19 11:45 ?0次下載

    稀疏卷積非負矩陣分解的語音增強算法

    鑒于卷積非負矩陣分解在語音增強算法中的成功應用,進一步考慮語音信號在時頻域的稀疏性,提出了稀疏卷積非負矩陣分解( Sparse convolutive nonnegative matrix
    發表于 03-14 14:02 ?2次下載

    關于實時語音轉寫技術的分析和介紹

    實時語音轉寫基于深度全序列卷積神經網絡框架,語音識別技術全球領先,在安靜環境,普通話標準下轉寫準確率可達95%以上。
    的頭像 發表于 09-27 08:38 ?4369次閱讀

    計算機視覺與語音處理的交叉增強

    往往效果不佳。 近年來一種視覺輔助的語音增強技術取得了突破,通過跟蹤視頻中人物口型,可以較好的輔助過濾環境噪聲。但其
    的頭像 發表于 02-17 13:36 ?1275次閱讀

    科大訊飛多模語音增強技術打造地鐵智慧交通應用

    多模語音增強技術,作為科大訊飛新推出的解決公共場景下語音交互難題的最新技術,打破以往純聲學降噪的方式,將機器視覺也融合到環境降噪
    發表于 01-16 14:15 ?640次閱讀

    深度學習在語音增強中的應用

    引起的混響等都會影響語音的感知質量,研究者將真實場景下影響語音質量的因素總結為三個方面:環境噪聲、房間混響和其他說話人干擾,語音增強的目的就是消除上述三個方面的影響。
    的頭像 發表于 07-11 09:39 ?1590次閱讀
    深度學習在<b class='flag-5'>語音</b><b class='flag-5'>增強</b>中的應用

    SmartAudio 100創新的聲音和語音增強技術

    電子發燒友網站提供《SmartAudio 100創新的聲音和語音增強技術.pdf》資料免費下載
    發表于 07-19 15:49 ?0次下載
    SmartAudio 100創新的聲音和<b class='flag-5'>語音</b><b class='flag-5'>增強</b><b class='flag-5'>技術</b>

    SmartAudio 350創新的聲音和語音增強技術

    電子發燒友網站提供《SmartAudio 350創新的聲音和語音增強技術.pdf》資料免費下載
    發表于 07-20 10:19 ?0次下載
    SmartAudio 350創新的聲音和<b class='flag-5'>語音</b><b class='flag-5'>增強</b><b class='flag-5'>技術</b>
    主站蜘蛛池模板: 中文字幕在线观看| 欧亚一卡二卡日本一卡二卡| 恋夜直播午夜秀场最新| 日韩黄色软件| 在线观看精品视频看看播放| 国产3级在线| 麻豆AV久久AV盛宴AV| 亚洲 欧美 中文字幕 在线| 99在线这精品视频| 精品国产午夜肉伦伦影院| 日日噜噜夜夜爽爽| 18禁黄久久久AAA片| 国产亚洲精品V在线观看一| 奇米精品一区二区三区在线观看| 亚洲伊人精品综合在合线| 丰满的女友1在线观看| 美女gif趴跪式动态图| 亚洲免费观看视频| 国产99网站| 欧美性受xxxx狂喷水| 稚嫩挤奶h调教h| 好爽胸大好深好多水| 特大黑人娇小亚洲女mp4| freehd另类xxxx喷水| 久久这里有精品| 亚洲人成网站7777视频| 国产精品www视频免费看| 欧美久久无码AV麻豆| 中文字幕A片视频一区二区| 国偷自产AV一区二区三区健身房| 日韩精品一卡二卡三卡四卡2021 | 日本阿v在线资源无码免费| 在线观看黄色小说| 国内精品伊人久久久影院| 天美传媒在线完整免费观看网站| xiao776唯美清纯| 内射爽无广熟女亚洲| 中文字幕亚洲无线码一区| 九九在线免费视频| 亚洲欧洲日韩视频在钱| 国产亚洲精品A久久777777 |