在线观看日本,亚洲区免费,中文字幕波多野结衣免费视频

谷歌和Idiap研究所的研究人員訓練了兩個獨立的神經網絡，能夠顯著降低多說話者信號的語音識別詞錯誤率。

把一個人的聲音從嘈雜的人群中分離出來是大多數人潛意識里都會做的事情——這就是所謂的雞尾酒會效應。像谷歌Home和亞馬遜的Echo這樣的智能揚聲器實現分離人群中的聲音可能還要再經歷一段時間，但多虧了AI，它們或許有一天能夠像人類一樣過濾掉聲音。

谷歌和位于Switerzland的Idiap研究所的研究人員發表在Arxiv上的一篇論文中描述了一種新的解決方案。他們訓練了兩個獨立的神經網絡——說話者識別網絡（a speaker recognition network）和聲譜掩碼網絡（a spectrogram masking network）——這兩個網絡一起“顯著”降低了多說話者信號的語音識別詞錯誤率（WER）。

他們的工作建立在麻省理工學院計算機科學和人工智能實驗室今年早些時候發表的一篇論文的基礎上，該論文描述了一個名為PixelPlayer的系統，該系統能夠將單個樂器的聲音從YouTube視頻中分離出來。

論文：

VoiceFilter: Targeted Voice Separation by Speaker-Conditioned Spectrogram Masking

論文地址：

https://arxiv.org/pdf/1810.04826.pdf

在最新的論文中，研究人員寫道：“我們的任務是將一部分感興趣的說話者的聲音與所有其他說話者和聲音的共性分離開來。例如，這樣的子集可以由一個目標揚聲器對個人移動設備發出語音查詢，或者由一個家庭成員對一個共享的家庭設備進行交談而形成。”

研究人員的語音過濾系統分為兩部分，包括LSTM模型和卷積神經網絡(只有一個LSTM層)。第一個采用預處理的語音采樣和輸出揚聲器嵌入（即矢量形式的聲音表示）作為輸入，而后者預測來自嵌入的軟掩模或濾波器以及根據噪聲音頻計算的幅度譜圖。掩模用于生成增強幅度譜圖，當與噪聲音頻的相位（聲波）組合并變換時，產生增強的波形。

AI系統被訓練以便最大限度地減少屏蔽幅度頻譜圖與從干凈音頻計算的目標幅度頻譜圖之間的差異。

該團隊為訓練樣本提供了兩個數據集：(1)來自13.8萬名演講者的大約3400萬個匿名語音查詢日志；(2)開源語音庫LibriSpeech、VoxCeleb和VoxCeleb2的匯編。VoiceFilter網絡對來自CSTR VCTK數據集(由愛丁堡大學維護的一組語音數據)和LibriSpeech的2338個貢獻者的語音樣本進行了訓練，并使用來自73名演講者的話語進行評估。

在測試中，VoiceFilter在雙揚聲器方案中將字錯誤率從55.9％降低到23.4％。

研究人員寫道：“我們已經證明了使用經過專門訓練的揚聲器編碼器來調整語音分離任務的有效性。這樣的系統更適用于真實場景，因為它不需要事先知道揚聲器的數量……我們的系統完全依賴于音頻信號，可以很容易地通過使用具有高度代表性的嵌入向量來推廣到未知的揚聲器。”

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

谷歌

谷歌

+關注

關注
27

文章
6171

瀏覽量
105472
神經網絡

神經網絡

+關注

關注
42

文章
4772

瀏覽量
100838
語音識別

語音識別

+關注

關注
38

文章
1742

瀏覽量
112691

原文標題：谷歌神經網絡人聲分離技術再突破！詞錯率低至23.4%

文章出處：【微信號：AI_era，微信公眾號：新智元】歡迎添加關注！文章轉載請注明出處。

神經網絡教程（李亞非）

　　第1章概述　　1.1 人工神經網絡研究與發展　　1.2 生物神經元　　1.3 人工神經網絡的構成　　第2章人工神經網絡基本模型　　2.

發表于 03-20 11:32

人類首創能生成神經細胞的“迷你大腦”，更精確模擬神經網絡！

`近日，凱斯西儲大學醫學院、紐約干細胞基金會（NYSCF）研究所和喬治華盛頓大學的研究人員聯合提出了一種新方法，通過人類胚胎干細胞培育生成3D版的“迷你大腦”。這些“迷你大腦”名為“大腦類器官

發表于 08-21 09:26

【案例分享】ART神經網絡與SOM神經網絡

今天學習了兩個神經網絡，分別是自適應諧振（ART）神經網絡與自組織映射（SOM）神經網絡。整體感覺不是很難，只不過一些最基礎的概念容易理解不清。首先ART

發表于 07-21 04:30

如何移植一個CNN神經網絡到FPGA中？

訓練一個神經網絡并移植到Lattice FPGA上，通常需要開發人員既要懂軟件又要懂數字電路設計，是個不容易的事。好在FPGA廠商為我們提供

發表于 11-26 07:46

基于BP神經網絡的PID控制

最近在學習電機的智能控制，上周學習了基于單神經元的PID控制，這周研究基于BP神經網絡的PID控制。神經網絡具有任意非線性表達能力，可以通過對系統性能的學習來實現具有最佳組合的PID控

發表于 09-07 07:43

圖像預處理和改進神經網絡推理的簡要介紹

為提升識別準確率，采用改進神經網絡，通過Mnist數據集進行訓練。整體處理過程分為兩步：圖像預處理和改進神經網絡推理。圖像預處理主要根據圖像的特征，將數據處理成規范的格式，而改進

發表于 12-23 08:07

卷積神經網絡模型發展及應用

network，DBN）[24]，從此拉開了深度學習大幕。隨著深度學習理論的研究和發展，研究人員提出了一系列卷積神經網絡模型。為了比較不同模型的質量，收集并整理了文獻中模型在分類任務上的識別率，如圖 1

發表于 08-02 10:39

如何進行高效的時序圖神經網絡的訓練

現有的圖數據規模極大，導致時序圖神經網絡的訓練需要格外長的時間，因此使用多GPU進行訓練變得成為尤為重要，如何有效地將多GPU用于時序圖神經網絡訓練

發表于 09-28 10:37

谷歌最新AI算法遞歸神經網絡繪制大腦神經圖像

谷歌研究人員使用了一種邊緣檢測算法，該算法可以識別神經突（神經元本體的分支）的邊界，以及一種復發性卷積神經網絡（復發性

發表于 07-20 09:45 ?2349次閱讀

研究人員開發解釋多義詞的神經網絡

艾倫人工智能研究所和華盛頓大學的研究人員正在使用可以根據上下文來確定英文單詞含義的神經網絡。

發表于 09-12 15:52 ?2213次閱讀

神經網絡有什么天生的性質

谷歌大腦研究人員通過精簡神經網絡結構，在前幾代中發現了最小架構的神經網絡能夠控制此處所示的雙足機器人，即使它的得分不高。

發表于 02-05 16:55 ?1224次閱讀

邊緣計算中深度神經網絡剪枝壓縮的研究

深度神經網絡與其他很多機器學習模型一樣，可分為訓練和推理兩個階段。訓練階段根據數據學習模型中的參數（對神經網絡來說主要是

發表于 03-27 15:50 ?2989次閱讀

研究人員開發“液態”神經網絡 可適應快速變化的訓練環境

設計出了一種具有重大改進的“液態”神經網絡。其特點是能夠在投入訓練階段之后，極大地擴展 AI 技術的靈活性。通常情況下，研究人員會在訓練階段向神經

發表于 01-29 10:46 ?1566次閱讀

BP神經網絡的研究進展

通過對傳統BP神經網絡缺點的分析，從參數選取、BP算法、激活函數、網絡結構4個方面綜述了其改進方法。介紹了各種方法的原理、應用背景及其在BP神經網絡中的應用，同時分析了各種方法的優缺點

發表于 06-01 11:28 ?5次下載

怎么對神經網絡重新訓練

重新訓練神經網絡是一個復雜的過程，涉及到多個步驟和考慮因素。引言 神經網絡是一種強大的機器學習模型，廣泛應用于圖像識別、自然語言處理、語音識別等領域。然而，隨著時間的推移，數據分布可

發表于 07-11 10:25 ?469次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

谷歌和Idiap研究所的研究人員訓練了兩個獨立的神經網絡

評論

神經網絡教程（李亞非）

人類首創能生成神經細胞的“迷你大腦”，更精確模擬神經網絡！

【案例分享】ART神經網絡與SOM神經網絡

如何移植一個CNN神經網絡到FPGA中？

基于BP神經網絡的PID控制

圖像預處理和改進神經網絡推理的簡要介紹

卷積神經網絡模型發展及應用

如何進行高效的時序圖神經網絡的訓練

谷歌最新AI算法遞歸神經網絡繪制大腦神經圖像

研究人員開發解釋多義詞的神經網絡

神經網絡有什么天生的性質

邊緣計算中深度神經網絡剪枝壓縮的研究

研究人員開發“液態”神經網絡可適應快速變化的訓練環境

BP神經網絡的研究進展

怎么對神經網絡重新訓練