色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何利用非監督學習實現了不同音樂間的樂器、體裁和風格間的轉換

nlfO_thejiangme ? 來源:未知 ? 作者:李倩 ? 2018-06-16 16:09 ? 次閱讀

Facebook上月末發表了一篇名為“A Universal Music Translation Network”的文章(原文鏈接在文末),詳細闡述了如何利用非監督學習實現了不同音樂間的樂器、體裁和風格間的轉換。相信小伙伴們或多或少地了解過這篇論文。

但是如果從音樂家的角度來看這個過程是如何進行的呢?本文將從四個不同的層次帶領我們更深入地理解這篇論文中所描述的方法,看看到底是什么神奇的魔力將長笛的悠揚轉換為了鋼琴的動聽的。

level-0:新手

對于新手來說想要快速實現風格轉換,傅里葉變換將是一個不錯的手段。利用頻譜分析將會迅速的找出對應的和弦和音符并在新的樂器上演奏出來。事實上傳統的處理方法提供了一系列這樣的手段:通過解碼器與基于本征樂器的樂器歸一化方法或者復調方法來實現。每一種樂器都有獨特的音符集和時域瞬態特征,但困難的是即使對于單一樂器來說,其頻譜包絡在不同的音高下并不服從同峰值模式。同時還有不同的泛音和諧頻需要處理。所有的這些使得音樂在不同樂器間的風格轉換十分困難。

level-1:深度學習專業的同學

如果擁有一點樂理基礎的話,可以使用CNN模型通過MIDI格式的音樂生成的label來學習音樂的表達和轉錄。MIDI是一種在合成器中常用的數字音樂,每一個鍵被按下或者抬起都意味著一次事件的觸發。可以通過如MAPS一樣的數據集來實現復調鋼琴音樂的轉錄問題。

level-2:NLP學者將如何處理呢?

NLP學者最有可能使用的方法應該是sequence to sequence模型了,但這種方法需要同時追蹤原始樂器和目標樂器的發音序列。

level-3:直接學習轉換和鄰域歸一化

對于十分優秀的音樂家來說,他們會明白每一種樂器之間的細微差別是MIDI所不能捕捉到的,而這個問題就是facebook文章中的創新所在。研究人員借鑒了wavenet的自回歸架構并充分利用它將這一問題轉換為了“下一個音符是什么”的類似問題,從而將其變成了一個非監督問題來解決。

wavenet本質上使用隨學習過程不斷擴大的卷積得到了增加的感受野,從而可以得到更好的預測結果和包含更為豐富特征的隱含空間。這些特征抓住了人類聲音和樂器聲音的本質,就像cnn中抽取的圖像特征一樣。此時如果你想要通過學習一個自回歸模型來預測鋼琴的下一個音調,你只需要簡單的學習一對兒wavenet編碼器和解碼器。編碼器將把原始的音樂序列投射到隱含空間中,而解碼器將盡力理解隱含空間的中的數值并解碼成下序列的下一個值。

是不是很奇妙?如果一個模型可以編碼鋼琴但解碼成其他樂器是不是就可以實現音樂在不同樂器間的轉換啦?這就是FacebookAI研究人員的努力。他們利用一個相同的編碼器對多種樂器進行編碼,而后利用不同的解碼器實現不同樂器的解碼,實現了多種樂器之間的風格互轉。那么它是如何工作的呢?下面讓我我們來具體看一看。

多個樂器間共享同一個解碼器會迫使這個解碼器去學習音樂間的相同特征。但對于解碼器來說,我們需要告訴它這到底是什么樂器,需要解碼的目標域是什么。這就需要對于不同樂器的域訓練特殊的解碼器來實現。論文中使用了對抗的方法來實現這一目標。由于通用的潛在空間希望去尋找通用的特征而忽略了每種樂器的特殊性,而混淆矩陣則希望分割共同特征中不同的表達并盡可能的實現不同的類別特征。通過特殊與一般之間的對抗得到了兩個性能強大的編碼和解碼模型。值得注意的是要想同時獲得兩個性能優異的編解碼模型,需要仔細地選擇正則化系數來實現。

讓我們來看看這個模型的損失函數。具體的訓練過程是這樣的,首先在不同樂器的域中選取一個樣本sj,隨后利用隨機變調來避免模型無腦地對數據進行記憶。論文中對0.25-0.5s長的樣本使用了-0.5-0.5的半步變調,可以用O(sj,r)來表示,其中r是隨機種子。你也許會對這一步感到疑惑,但使用過谷歌magenta模型或者瞬時生成模型的人都會有這樣的經歷,有的時候模型會像鸚鵡學舌一樣簡單的重復記憶下的序列,簡直是公然的過擬合了。而這就是數據增強和偏移過程的關鍵所在,也是訓練多種樂器的編碼器關鍵所在。

隨后增強數據通過wavenet編碼器中擴大的卷積層轉換到了隱含空間中,并通過對應的解碼器Dj還原到了其對應的樂器空間中并預測出了下一個音符輸出。研究人員通過交叉熵比較實際的下一個輸出和預測的下一個輸出來計算損失函數。其中第一項代表重建誤差要盡可能的小,而第二項領域分類的誤差則用于盡可能的分開不同域的特征,這也是網絡進行對抗訓練的表現。作為一個對抗模型,一個監督的正則項通過后編碼的特征矢量用于預測不同的域。它被稱為域混淆網絡(Domain Confusion Network)。

網絡在實際工作過程中,輸入的一個交響樂片段會被轉換和翻譯為一種特殊的樂器,但這個模型最令人驚嘆的能力還不止于此。當輸入一種模型從未見過的樂器時,通過自動編碼和解碼過程它依然可以完美的工作!這證明了模型中的編碼器確實可以提取出音樂中的一般化特征并在隱含空間中表示出來,及時沒有見過這個樂器。這是很多生成算法的核心概念,像GANs和變分自編碼都利用這一思想創造了很多迷人的工作。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • Facebook
    +關注

    關注

    3

    文章

    1429

    瀏覽量

    54720
  • 傅里葉變換
    +關注

    關注

    6

    文章

    441

    瀏覽量

    42592
  • 深度學習
    +關注

    關注

    73

    文章

    5500

    瀏覽量

    121111

原文標題:深度解析Facebook的音樂轉換AI模型

文章出處:【微信號:thejiangmen,微信公眾號:將門創投】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    監督學習-Hierarchical clustering 層次聚類python的實現

    【深度學習基礎-17】監督學習-Hierarchical clustering 層次聚類-python實現
    發表于 04-28 10:07

    如何用卷積神經網絡方法去解決機器監督學習下面的分類問題?

    人工智能下面有哪些機器學習分支?如何用卷積神經網絡(CNN)方法去解決機器學習監督學習下面的分類問題?
    發表于 06-16 08:09

    基于半監督學習的跌倒檢測系統設計_李仲年

    基于半監督學習的跌倒檢測系統設計_李仲年
    發表于 03-19 19:11 ?4次下載

    基于半監督學習框架的識別算法

    人體行為識別是計算機視覺研究的熱點問題,現有的行為識別方法都是基于監督學習框架.為了取得較好的識別效果,通常需要大量的有標記樣本來建模.然而,獲取有標記樣本是一個費時又費力的工作.為了解決這個
    發表于 01-21 10:41 ?1次下載

    英偉達通過利用GAN及無監督學習實現場景的四季轉換

    英偉達近期在GAN相關研究和應用方面進展迅猛,在前一陣的成果展示中,通過利用生成對抗網絡(GAN)及無監督學習兩種深度學習技術,實現場景
    發表于 05-16 15:55 ?2556次閱讀

    你想要的機器學習課程筆記在這:主要討論監督學習和無監督學習

    with experience E(一個程序從經驗E中學習解決任務T進行某一任務量度P,通過P測量在T的表現而提高經驗E(另一種定義:機器學習是用數據或以往的經驗,以此優化計算機程序的性能標準。) 不同類型的機器學習算法:主要
    發表于 12-03 17:12 ?549次閱讀

    如何用Python進行無監督學習

    監督學習是一種用于在數據中查找模式的機器學習技術。無監督算法給出的數據不帶標記,只給出輸入變量(X),沒有相應的輸出變量。在無監督學習中,算法自己去發現數據中有趣的結構。
    的頭像 發表于 01-21 17:23 ?4249次閱讀

    機器學習算法中有監督和無監督學習的區別

    監督學習的好處之一是,它不需要監督學習必須經歷的費力的數據標記過程。但是,要權衡的是,評估其性能的有效性也非常困難。相反,通過將監督學習算法的輸出與測試數據的實際標簽進行比較,可以很容易地衡量
    的頭像 發表于 07-07 10:18 ?5756次閱讀

    最基礎的半監督學習

    導讀 最基礎的半監督學習的概念,給大家一個感性的認識。 半監督學習(SSL)是一種機器學習技術,其中任務是從一個小的帶標簽的數據集和相對較大的未帶標簽的數據中學習得到的。SSL的目標是
    的頭像 發表于 11-02 16:08 ?2648次閱讀

    監督學習最基礎的3個概念

    有趣的方法,用來解決機器學習中缺少標簽數據的問題。SSL利用未標記的數據和標記的數據集來學習任務。SSL的目標是得到比單獨使用標記數據訓練的監督學習模型更好的結果。這是關于半
    的頭像 發表于 11-02 16:14 ?2956次閱讀
    半<b class='flag-5'>監督學習</b>最基礎的3個概念

    為什么半監督學習是機器學習的未來?

    揭示添加無監督數據可以提高模型泛化和性能。事實上,在非常多的場景中,帶有標簽的數據并不容易獲得。半監督學習可以在標準的任務中實現SOTA的效果,只需要一小部分的有標記數據 數百個訓練
    的頭像 發表于 11-27 10:42 ?3896次閱讀

    監督學習:比監督學習做的更好

    監督學習是人工智能領域的第一種學習類型。從它的概念開始,無數的算法,從簡單的邏輯回歸到大規模的神經網絡,都已經被研究用來提高精...
    的頭像 發表于 12-08 23:32 ?1403次閱讀

    機器學習中的無監督學習應用在哪些領域

    監督學習|機器學習| 集成學習|進化計算| 監督學習| 半監督學習| 自
    發表于 01-20 10:52 ?4958次閱讀
    機器<b class='flag-5'>學習</b>中的無<b class='flag-5'>監督學習</b>應用在哪些領域

    監督學習的一些思考

    監督學習的流行是勢在必然的。在各種主流有監督學習任務都做到很成熟之后,數據成了最重要的瓶頸。從無標注數據中學習有效信息一直是...
    發表于 01-26 18:50 ?1次下載
    自<b class='flag-5'>監督學習</b>的一些思考

    深度學習中的無監督學習方法綜述

    應用中往往難以實現。因此,無監督學習在深度學習中扮演著越來越重要的角色。本文旨在綜述深度學習中的無監督學習方法,包括自編碼器、生成對抗網絡、
    的頭像 發表于 07-09 10:50 ?676次閱讀
    主站蜘蛛池模板: 免费在线视频成人| 我的美女房东未删减版免费观看| 天上人间影院久久国产| 巨乳中文无码亚洲| 国产精品无码中文在线AV| 最近2019中文字幕免费| 亚州天堂在线视频av| 欧美亚洲国产激情一区二区| 久久久免费观看| 果冻传媒2021在线观看| 国产产乱码一二三区别免费| 92午夜理论第1000集 app| 亚洲视频网站欧美视频网站| 十九禁啊啪射视频在线观看 | 把她带到密室调教性奴| 一区二区三区毛AAAA片特级| 亚洲成年人影院| 亚洲AV无码国产精品色在线看| 青青青手机视频| 日本美女色| 三级中国免费的| 十8禁用B站在线看漫画| 色欲AV亚洲永久无码精品| 日本50人群体交乱| 色狠狠一区二区| 天天爽夜夜爽8888视频精品| 色爱AV综合区| 香蕉59tv视频| 一本二卡三卡四卡乱码麻豆| 亚洲男同tv| 在线视频 中文字幕| 99国产精品久久久久久久日本竹| 97人人看碰人免费公开视频 | 亚洲看片网站| 中国xxxxxxxxx孕交| 99精品国产高清自在线看超| 99精品视频免费在线观看| 超碰97视频在线观看| 国产线精品视频在线观看| 黄页网址大全免费观看| 免费乱理伦片在线观看八戒|