色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

計算模型通過預測對語音進行解碼

倩倩 ? 來源:互聯網分析沙龍 ? 2020-07-03 10:17 ? 次閱讀

大腦通過識別音節來分析口語。日內瓦大學(UNIGE)和不斷發展的語言國家能力研究中心(NCCR)的科學家設計了一種計算模型,該模型再現了中樞神經系統執行此操作所采用的復雜機制。該模型匯集了兩個獨立的理論框架,使用等效于大腦活動產生的神經元振動來處理關聯語音的連續聲音流。

該模型根據稱為預測編碼的理論起作用,從而大腦通過不斷嘗試基于候選假設(此模型中的音節)來預測感覺信號來優化感知。結果模型在《自然通訊》雜志上進行了描述,該模型有助于實時識別以自然語言說出的數百個句子中包含的數千個音節。這證實了神經元振動可以用來協調我們聽到的音節流與大腦預測的想法。

UNIGE醫學院基礎神經科學系教授,不斷發展的語言NCCR聯合主任Anne-Lise Giraud說:“腦部活動會產生可通過腦電圖測量的神經元振蕩。”這些是電磁波,是由整個神經元網絡的相干電活動產生的。有幾種類型,根據它們的頻率定義。它們被稱為α,β,θ,δ或γ波。這些節奏單獨或疊加在一起,與不同的認知功能相關,例如感知,記憶,注意力,機敏性等。

但是,神經科學家尚不知道他們是否對這些功能做出積極貢獻以及如何發揮作用。在2015年發表的一項較早研究中,Giraud教授的團隊表明,theta波(低頻)和gamma波(高頻)相互配合,對音節中的音流進行排序,并分析其內容,以便對其進行識別。

總部位于日內瓦的科學家根據這些生理節律開發了一種突跳的神經網絡計算機模型,該模型在現場(在線)音節排序方面的性能優于傳統的自動語音識別系統。

在他們的第一個模型中,theta波(介于4赫茲與8赫茲之間)使跟隨系統感知的音節節奏成為可能。伽馬波(大約30赫茲)用于將聽覺信號切成較小的切片并進行編碼。這會產生一個鏈接到每個聲音序列的“音素”配置文件,可以將其與后一個音節進行比較,并與已知音節庫進行比較。這種類型的模型的優點之一是,它可以自發地適應語音速度,語音速度可能因人而異。

在這篇新文章中,為了更接近生物學現實,Giraud教授和她的團隊開發了一種新模型,其中結合了來自另一個理論框架的元素,而與神經元振蕩無關:“預測編碼”。

“該理論認為,大腦的功能是如此之好,因為它一直在使用外界事件如何產生感官信號的學習模型來不斷嘗試預測和解釋環境中正在發生的事情。就口語而言,它試圖找到最有效的方法。根據已學到的,并且正在不斷更新的一組心理表征,可能會隨著聲音的發展而使耳朵感知到的聲音的可能原因。” Giraud小組的計算神經科學家Itsaso Olasagasti博士說。模型實施。

“我們開發了一種模擬這種預測編碼的計算機模型,”基礎神經科學系研究員,該論文的第一作者Sevada Hovsepyan解釋說。“而且我們通過引入振蕩機制來實現它。”

進入系統的聲音首先由類似于神經元種群產生的θ(慢)波調制。這樣就可以發信號通知音節的輪廓。然后,(快速)伽馬波序列有助于在音節被感知時對音節進行編碼。在此過程中,系統會建議可能的音節,并在必要時更正選擇。在兩個級別之間來回幾次后,它會發現正確的音節。隨后,系統在每個音節結束時將其重置為零。

該模型已成功使用220個句子中的2888個不同音節以英語自然語言進行了測試。Giraud教授說:“一方面,我們成功地將兩個非常不同的理論框架整合到一個計算機模型中。”“另一方面,我們已經表明,神經元振蕩很可能在節奏上使大腦的內源性功能與通過感覺器官從外部傳入的信號對齊。如果將其放回預測編碼理論中,則意味著這些振蕩可能使大腦大腦在正確的時機做出正確的假設。”

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4773

    瀏覽量

    100876
  • 計算模型
    +關注

    關注

    0

    文章

    29

    瀏覽量

    9866
  • 自然語言
    +關注

    關注

    1

    文章

    288

    瀏覽量

    13359
收藏 人收藏

    評論

    相關推薦

    語音識別機器人的工作原理

    語音識別機器人的工作原理主要基于一系列復雜的技術流程,包括信號采集、預處理、特征提取、聲學模型匹配、語言模型預測以及最終的解碼輸出。 一、信
    的頭像 發表于 10-25 09:25 ?490次閱讀

    NVIDIA Modulus助力風阻預測模型實現

    NVIDIA 與百度飛槳雙方技術團隊通過在數據、算法、模型等多個方面的合作,共同打造了一款適用于車輛空氣動力學數值模擬的 3D 高精度汽車風阻預測模型——DNNFluid-Car。經過
    的頭像 發表于 08-23 17:10 ?898次閱讀

    【《大語言模型應用指南》閱讀體驗】+ 基礎知識學習

    習語言的表達方式和生成能力。通過預測文本中缺失的部分或下一個詞,模型逐漸掌握語言的規律和特征。 常用的模型結構 Transformer架構:大語言
    發表于 08-02 11:03

    matlab預測模型怎么用

    MATLAB預測模型是一種基于統計和數學方法的預測工具,廣泛應用于各種領域,如金融、氣象、生物醫學等。本文將介紹MATLAB預測模型的使用方
    的頭像 發表于 07-11 14:33 ?635次閱讀

    MATLAB預測模型哪個好

    在MATLAB中,預測模型的選擇取決于數據類型、問題復雜度和預測目標。以下是一些常見的預測模型及其適用場景的介紹: 線性回歸(Linear
    的頭像 發表于 07-11 14:31 ?438次閱讀

    如何使用MATLAB創建預測模型

    在這篇文章中,我們將討論如何使用MATLAB創建預測模型。MATLAB(矩陣實驗室)是一種用于數值計算、可視化和編程的高級編程語言和交互式環境。它廣泛應用于工程、科學研究和金融領域。 1.
    的頭像 發表于 07-11 14:29 ?694次閱讀

    matlab預測模型有哪些

    環境,使其成為預測模型開發和實現的理想平臺。本文將詳細介紹MATLAB中常用的預測模型及其應用。 線性回歸模型 線性回歸是一種簡單的
    的頭像 發表于 07-11 14:27 ?781次閱讀

    arimagarch模型怎么預測

    GARCH模型則用于捕捉時間序列的波動性。 以下是使用ARIMA-GARCH模型進行預測的一般步驟: 數據準備:首先需要收集和整理預測所需的
    的頭像 發表于 07-09 10:22 ?516次閱讀

    神經網絡預測模型的構建方法

    神經網絡模型作為一種強大的預測工具,廣泛應用于各種領域,如金融、醫療、交通等。本文將詳細介紹神經網絡預測模型的構建方法,包括模型設計、數據集
    的頭像 發表于 07-05 17:41 ?687次閱讀

    Transformer模型語音識別和語音生成中的應用優勢

    隨著人工智能技術的飛速發展,語音識別和語音生成作為人機交互的重要組成部分,正逐漸滲透到我們生活的各個方面。而Transformer模型,自其誕生以來,憑借其獨特的自注意力機制和并行計算
    的頭像 發表于 07-03 18:24 ?1164次閱讀

    如何使用神經網絡進行建模和預測

    神經網絡是一種強大的機器學習技術,可以用于建模和預測變量之間的關系。 神經網絡的基本概念 神經網絡是一種受人腦啟發的計算模型,由大量的節點(神經元)組成,這些節點通過權重連接在一起。每
    的頭像 發表于 07-03 10:23 ?777次閱讀

    聆思CSK6視覺語音模型AI開發板入門資源合集(硬件資料、大模型語音/多模態交互/英語評測SDK合集)

    對話 + 文生圖 + 設備控制該示例展示了如何通過模型實現語音輸入意圖的理解,實現對話、繪圖和控制開發板屏幕顏色進行切換,用戶可參考代碼與教程自行修改。 4接入自定義應用講解如何在云
    發表于 06-18 17:33

    基于助聽器開發的一種高效的語音增強神經網絡

    。雖然模型壓縮技術是一個活躍的研究領域,但我們是第一個證明其有效性的RNN語音增強,使用剪裁和權重/激活的整型量化。我們還演示了狀態更新跳躍,它可以減少計算負載。最后,我們對壓縮模型
    發表于 06-07 11:29

    助聽器降噪神經網絡模型

    在堆棧網絡方法中,參數少于一百萬個。該模型使用挑戰組織者提供的 500 小時的嘈雜語音進行訓練。 該網絡能夠進行實時處理(一幀輸入,一幀輸 出)并達到有競爭力的結果。將這兩種類型的信號
    發表于 05-11 17:15

    數字信號處理操作教程_音頻解碼:3-8 G711A音頻解碼實驗

    用脈沖編碼調制對音頻采樣,采樣率為8k每秒。它利用一個 64Kbps 未壓縮通道傳輸語音訊號。起壓縮率為1:2,即把16位數據壓縮成8位。G711是主流的波形聲音編解碼器。 PCM是對模擬的連續信號進行
    發表于 04-24 15:09
    主站蜘蛛池模板: 亚洲成人在线免费观看| 久久亚洲伊人中字综合精品| 国产一区二区不卡老阿姨| 男人把女人桶到高潮嗷嗷叫| 野花影院手机在线观看| 国产精品久久久久久久久久影院| 人人干人人看| qvod12| 欧美男女爱爱| FREE性丰满HD毛多多| 欧美日韩久久久精品A片| 99热国产这里只有精品免费| 免费看黄的片多多APP下载| 91九色porny蝌蚪| 免费看黄色小说| av影音先锋影院男人站| 啪啪啪社区| 不戴套挺进人妻怀孕| 人与禽物videos另类| 高h gl肉文| 午夜不卡久久精品无码免费| 国产精品无码久久久久不卡| 性色无码AV久久蜜臀| 黑兽在线观看高清在线播放樱花| 亚洲色噜噜狠狠站欲八| 久久99精品涩AV毛片观看| 最近中文字幕免费高清MV视频| 麻豆国产人妻精品无码AV| JEALOUSVUE成熟老师APP| 日韩在线中文字幕无码| 国产嫩草影院精品免费网址| 亚洲免费va在线观看| 老司机福利在视频在ae8| chinesevideos原创麻豆| 日韩亚洲不卡在线视频| 国产一区二区波多野结衣| 又大又硬又爽免费视频 | 2021久久精品免费观看| 欧美牲交A欧美牲交| 国产SUV精品一区二区69| 亚洲欧美高清在线|