色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

針對設備上使用的Voice Filter的更新

LiveVideoStack ? 來源:LiveVideoStack ? 作者:LiveVideoStack ? 2020-12-07 13:48 ? 次閱讀

語音輔助技術使用戶能夠使用語音命令與他們的設備進行交互,并且依靠準確的語音識別來確保對特定用戶的響應。但是在許多實際的使用案例中,這類技術的輸入一般由重疊的語音組成,這給許多語音識別算法帶來了巨大的挑戰。

2018年,我們推出了VoiceFilter系統,該系統利用了谷歌的Voice Match,通過允許用戶注冊和登記自己的語音,實現與輔助技術的個性化交互。

雖然VoiceFiltr的方法很成功,并且實現了比傳統方法更好的信噪比(SDR),但高效的設備上流媒體語音識別需要解決模型大小、CPU、內存限制和電池使用注意事項和延遲最小化等的限制。

在“Voice Filter-lite方面:針對面向設備上語音識別的流媒體目標語音分離”中,我們推出了針對設備上使用的Voice Filter的更新,該更新可以通過利用選定發言人的注冊語音來達到顯著提高和改善重疊語音的語音識別。重要的是,該模型可以很容易地與現有的設備語音識別應用程序集成,允許用戶在極其嘈雜的條件下訪問語音輔助功能,即使互聯網連接不可用。我們的實驗表明,一個2.2MB的voice filer-lite模型在重疊語音上可以使誤詞率(WER) 改善25.1% 。

改進設備上的語音識別

雖然最初的VoiceFilter系統非常成功地將目標發言人的語音信號從其他重疊的信號源中分離出來,但它的模型大小、計算成本和延遲,對于移動設備上的語音識別是不可行的。

新的Voice Filter-Lite系統經過精心設計,與設備上的應用程序相適應。Voice Filter-Lite不需要處理音頻波形,而是采用與語音識別模型完全相同的輸入特征功能(stacked log Mel-filterbanks堆疊的對數Mel濾波器組) , 并通過實時過濾掉不屬于目標說話者的組成部分來直接增強這些特征。加上對網絡拓撲的多項優化,運行時操作的數量大大減少。在使用Tensor Flow Lite庫對神經網絡進行量化后,模型大小只有2.2MB,適合大多數設備上的應用程序。

為了訓練Voice Filter-Lite模型,將帶噪聲語音的濾波器組與代表目標發言人身份的嵌入向量(i.e.ad-vector d矢量)一起被輸進網絡。該網絡預測了一個掩碼,將其與輸入逐元素相乘,從而產生增強的過濾庫。在訓練過程中,我們定義了一個損失函數來最小化增強濾波器組和干凈語音的濾波器組之間的差異。

Voice Fliter-Lite系統的模型架構

Voice Filter-Lite是一種即插即用的模型,它允許實如果說話者沒有登記他們的聲音,那么實現它的應用程序可以輕松地繞過它。這也意味著語音識別模型和Voice Filer-Lite模型可以分別進行訓練和更新,這在很大程度上降低了部署過程中的工程復雜性。

作為即插即用模型,如果發言人沒有注冊他們的聲音,Voice Fliter-Lite可以很輕易地被忽略。

應對過度抑制的挑戰

當使用語音分離模型來改進語音識別時,可能會出現兩種類型的錯誤:抑制不足,即模型無法濾除信號中的噪聲成分;以及過度抑制,當模型不能保留有用的信號時,導致一些單詞從識別的文本中丟失。過度抑制問題尤其嚴重,因為現代語音識別模型通常已經使用大量的增強數據(如房間模擬和SpecAugment) 進行訓練,因此對抑制不足更有魯棒性。

Voice Filter-Lite通過兩種新方法解決了過度抑制的問題。首先,它在訓練過程中使用了非對稱性損失,使得模型對過度抑制的容忍度低于抑制不足的。其次,它對運行時的噪聲類型進行預測,并根據預測結果自適應地調整抑制強度。

檢測重疊語音時,Voice Filter-Lite自適應地應用更強的抑制強度。

通過這兩種解決方案,Voice Filter-Lite模型在其他場景(如安靜或各種噪聲條件下的單揚聲器語音)的流媒體語音識別方面保持了出色的性能,同時在重疊語音方面仍然提供了顯著的改進。從我們的實驗中,我們觀察到將2.2MB Voice Filter-Lite模型應用于附加性重疊語音后,單詞錯誤率改善了25.1%。對于混響重疊語音,模擬遠場設備(如智能家庭揚聲器)是一項更具挑戰性的任務, 我們還觀察到使用Voice Filter-Lite可以改善14.7%的單詞錯誤率。

未來的工作

雖然Voice-Filter Lite在各種設備語音應用程序中顯示出了巨大的潛力,但我們也在探索其他幾個方向,以使Voice-Filter Lite更有用。首先,我們目前的模型只用英語語音進行訓練和評估。我們很高興能夠采用同樣的技術來改進更多語言的語音識別。其次,我們想在訓練Voice Filter-Lite的過程中直接優化語音識別損失,這可能會進一步提高語音識別,而不僅僅是重疊語音。

感謝

本文所描述的研究代表了谷歌中多個團隊的共同努力。貢獻者包括Quan Wang, Ignacio Lopez Moreno, Mert Saglam, Kevin Wilson, Alan Chiao, Renjie Liu, Yanzhang He, Wei Li, Jason Pelecanos, Philip Chao, Sinan Akay, John Han, Stephen Wu, Hannah Muckenhirn, Ye Jia, Zelin Wu, Yiteng Huang, Marily Nika, Jaclyn Konzelmann, Nino Tasca, and Alexander Gruenstein.Share on Twitter Share on Facebook在Twitter上的分享,在Facebook上的分享。

責任編輯:lq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 流媒體
    +關注

    關注

    1

    文章

    194

    瀏覽量

    16662
  • 語音識別
    +關注

    關注

    38

    文章

    1742

    瀏覽量

    112691
  • 應用程序
    +關注

    關注

    37

    文章

    3277

    瀏覽量

    57734

原文標題:使用VoiceFliter-Lite改進設備上的語音識別

文章出處:【微信號:livevideostack,微信公眾號:LiveVideoStack】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    AirPods如何進行固件更新

    AirPods的固件更新通常是通過與iPhone、iPad或Mac等蘋果設備連接時自動進行的。以下是更新AirPods固件的介紹: 一、準備工作 確保設備連接 : 將AirPods放入
    的頭像 發表于 12-05 14:59 ?397次閱讀

    Android 16發布計劃曝光,谷歌將同步更新AOSP與Pixel設備

     據外媒最新報道,谷歌計劃在2025年6月3日邁出安卓系統更新的一大步,屆時將正式將Android 16推送至Android開放源代碼項目(AOSP),并同步為Pixel設備帶來這一全新系統的更新
    的頭像 發表于 11-06 17:05 ?903次閱讀

    MSP430 MCU的USB現場固件更新

    電子發燒友網站提供《MSP430 MCU的USB現場固件更新.pdf》資料免費下載
    發表于 10-18 09:27 ?0次下載
    MSP430 MCU<b class='flag-5'>上</b>的USB現場固件<b class='flag-5'>更新</b>

    請問Pre-Filter PBTL和Post-Filter PBTL相比有什么優缺點?

    Pre-Filter PBTL和Post-Filter PBTL 相比有什么優缺點
    發表于 10-18 06:54

    高鴻信安助力中央企業大規模設備更新

    高鴻信安針對信息系統及工業控制系統兩大類系統,發布如下信創及本質安全方案,助力中央企業大規模設備更新
    的頭像 發表于 09-20 14:22 ?375次閱讀

    蘋果推送針對Beats Studio Buds+最新固件更新

    蘋果公司今日悄然推送了針對Beats Studio Buds+的最新固件更新,標志著自該耳機于2023年問世以來,首次迎來系統層面的優化升級。此次更新的固件版本躍升至2C318,相較于先前的2A219版本,預示著性能或體驗
    的頭像 發表于 09-05 17:08 ?1051次閱讀

    Jetpack Compose和設備類型的三大重要更新

    2024 年 Google I/O 大會上我們分享了大量更新和公告,幫助開發者提升工作效率。了解 2024 年 Google I/O 大會上有關 Jetpack Compose 和設備類型的三大重要更新
    的頭像 發表于 08-09 17:07 ?695次閱讀

    四大Google更新將登陸Samsung設備

    在近期的 Galaxy Unpacked 發布會上,我們宣布了四項即將在 Samsung 最新設備中推出的 Google 更新,這些設備包括 Galaxy Z Flip6、Z Fold6 和最新款 Galaxy 手表。
    的頭像 發表于 08-09 16:58 ?802次閱讀

    谷歌針對Android和iOS版Chrome發布五項更新

    在移動設備搜索內容應該像在電腦一樣流暢。近期,我們針對 Android 和 iOS 版 Chrome 發布了五項更新,旨在讓您能夠更輕松
    的頭像 發表于 08-09 16:56 ?769次閱讀

    把好事辦好:工業設備更新云難題與破解

    工業設備是制造業重要生產資料之一,2024年《政府工作報告》中提出,要“推動各類生產設備、服務設備更新和技術改造”。隨著設備
    的頭像 發表于 08-02 11:01 ?393次閱讀

    XMOS xcore-voice 解決方案

    XMOS xcore-voice 解決方案是一個完整的產品,基于 xcore 平臺的硬件、軟件和工具構建。
    的頭像 發表于 06-12 16:00 ?439次閱讀
    XMOS xcore-<b class='flag-5'>voice</b> 解決方案

    多地發布設備更新“白名單”,儀器采購一觸即發

    近日,多地發布了設備更新服務機構、優勢企業及產品的白名單,諸多儀器設備企業上榜,成為需求方設備更新采購時優先選擇的“優質供應商”。
    的頭像 發表于 05-23 09:10 ?445次閱讀

    吉林省全面推動設備更新與消費品以舊換新實施方案

    5月13日訊,據吉林省人民政府官網公布,該省已制定并發布了《吉林省推動大規模設備更新和消費品以舊換新實施方案》,明確表示將針對汽車、家電等耐用品推出以舊換新的活動計劃。
    的頭像 發表于 05-13 10:15 ?512次閱讀

    泰凌微電子藍牙Mesh設備固件更新功能和測試說明(一)

    藍牙Mesh 協議規范1.1引入了一組新的功能,稱為設備固件更新(Device Firmware Update)(DFU),使得用戶可以通過更新mesh網絡設備
    的頭像 發表于 01-24 09:05 ?2056次閱讀
    泰凌微電子藍牙Mesh<b class='flag-5'>設備</b>固件<b class='flag-5'>更新</b>功能和測試說明(一)

    如何從USB設備更新軟件?

    您們好! 我想通過我的USB設備口,來更新我的軟件,那么我怎么操作比較安全呢? 可以直接接收數據然后寫入FLASH,但是這樣可有點風險性,一旦更新過程中斷電, 那么整臺機器就要重新寫程序了
    發表于 01-12 07:39
    主站蜘蛛池模板: 大稥焦伊人一本dao| 伊人久久精品中文字幕| 中文字幕无码A片久久| 国产制服丝袜91在线| 三级黄网站| 大地影院日本韩国电影免费观看| 青娱乐在线一区| 国产精品国产三级国AV在线观看| 天天看高清影视在线18| 国产精华av午夜在线观看| 网友自拍成人在线视频| 国产伦精品一区二区三区免费| 亚洲成年男人的天堂网| 狠狠色丁香婷婷久久综合| 一个色综合久久| 美女医生深夜在家裸睡惨死| 99久久99久久精品| 善良的小峓子2在钱中文版女主角| 国产精品亚洲国产三区| 亚洲最大成人| 美女扒开尿孔| 草莓视频app深夜福利| VIDEOSGGRATIS欧美另类| 人人爽天天碰狠狠添| 国产色婷婷亚洲99精品| 97人人添人人澡人人澡人人澡| 亚洲 欧美 视频 手机在线| 年轻的搜子8中字在线观看| 国产亚洲精品久久精品6| 97在线播放视频| 亚洲区视频| 天天操天天干天天爽| 欧美白人极品性喷潮| 久久www99re在线播放| 国产精品毛片AV久久97| AV无码九九久久| 又爽又黄又粗又大免费视频| 午理论理影片被窝| 强奷乱码中文字幕熟女免费| 久久久久国产一级毛片高清片| 国产精品第十页|