色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

用AI自動生成嘻哈歌詞的隊伍獲得了“最佳DEMO獎”

電子工程師 ? 來源:未知 ? 作者:李倩 ? 2018-08-28 09:14 ? 次閱讀

8月23日,“2018年全球高校學生DeeCamp AI訓練營”在北大舉行閉幕式,經過層層評比,來自全球高校的300學生組成的28支隊伍選出了8支優勝隊伍。其中,一只用AI自動生成嘻哈歌詞的隊伍獲得了“最佳DEMO獎”。

AI寫嘻哈歌詞的水平如何?能達到以假亂真的地步嗎?不看廣告看療效,我們先來猜猜下面的歌詞哪些是AI寫的:

不是樂理專修 做點兒曲式研究 我們的力量來自宇宙 自己的節奏不是樂理專修 所有聽的觀眾 打破他們傳統 進到環球 繼續讓你感受

再來一個:

自己就帶上了有色眼鏡 金錢摧毀多少事情 瓦解你的中樞神經自己就帶上了有色眼鏡 我只想把世界分的更清 卻發現自己卻模糊了心

正確答案是:第一行都是模型生成的,第二行是原作。可以看出,AI的效果還是不錯的,至少挺押韻的。

那么,這個有嘻哈精神的團隊到底是怎樣搭建這個 AI 模型的?

首先我們需要定義這個問題,也就是根據一句歌詞迭代生成一段嘻哈歌詞。另外一個是押韻,這是嘻哈歌詞一大特點。

清楚了問題,我們去調研一下已經有的文本聲稱方案,最終把它的優點和缺點列出來,然后我們選擇了SequenceGAN作為基礎模型,并且在這個之上提出我們的模型——SequenceGAN。

SequenceGAN 有兩個組件,生成器、判讀器,讓生成器生成足以逼真的歌詞。

我們在這個基礎之上,有一個嘻哈生成網絡。第一點是在這個之前我們增加了一個編碼網絡,將然后生成一些跟主題相關的歌詞,第二點是把目標函數修改。

以下是SequenceGAN的效果,它有非常多的重復的語句,這就是GAN的一個通病,對于不同的輸入,輸出卻很相同。

我們知道嘻哈歌手不可能一句話唱一整首,所以我們調研了一些文獻,并且借鑒今年SentiGAN的想法,對生成器的目標函數進行修改,最后效果非常顯著,有一個質的變化。

有了多樣化的文本之后,我們下一步要解決的問題就是如何去實現押韻。我們嘗試兩種方案,一種是基于目標函數,增加押韻場景項,就好像考試的附加題,做對了給額外得分。但是我們希望它一直能夠去做附加題,實現押韻的功能。但是它并不能很自主地學習到押韻的關。

最后我們嘗試了基于規則的方式來實現這個押韻。比如輸入“你真美麗”,我們根據這個i的韻腳去構建一個向量,做一個簡單的操作,就能夠得到必然是押韻的結果,同時可以控制押韻的概率。

▌附完整解讀

項目作者:孫蒙新(廈門大學)、項瑞昌(華中科技大學)、伊瑋雯(北京郵電大學)、陸亦揚(合肥工業大學)、石華(西南石油大學)、汪自力(西安電子科技大學)、龐雲升(重慶大學)、周子群(東北大學)、王超群(北京林業大學)、詹玨岑(VanderniltUniversity)

1、數據

我們一共使用了 10w 條嘻哈歌詞,并且已經將一些不符合社會主義核心價值觀的句子標注了出來。數據的預處理主要步驟如下:

在對句子進行篩選之后,我們利用 Jieba 進行分詞,觀察到單句長度集中在 8~10 左右;

在利用 Tensorflow 中的 Tokenizer 進行 tokenize 并構建 word2idex 字典后,詞表大小在 11000 左右,考慮到這個大小還可以接受,沒有做限制詞表大小的操作;

利用 pad_sequence 將句子 padding 到 20(和 SeqGAN 中相同);

構建 x-y pair,利用上一句預測下一句(導師后來建議可以借鑒用 Skip-gram 的思路,同時預測上一句和下一句,但沒有時間去嘗試了),分割數據集。

訓練數據地址:

https://drive.google.com/drive/folders/1QrO0JAti3A3vlZlUemouOW7jC3K5dFZr)

2、模型

我們的生成模型的整體基于 SeqGAN,并對其做了一些修改,模型架構如下:

主要改動有兩點:

1.增加輸入語句的編碼:這一點類似 Seq2Seq 的 Encoder,SeqGAN 原本的 initial state 是全 0 的,為了將上文的信息傳遞給生成器,我們采用了一個簡單的全連接層(Fully Connected Layer),將輸入句子的 Word Embedding 經過一個線性變化之后作為生成器的 LSTM。事實上也可以嘗試使用 RNN(LSTM)來作為 Encoder,不過這樣模型的速度可能會比較慢。

2.將原先 Generator 的 Loss Function 改為 Penalty-based Objective:在訓練模型的過程中我們發現,模型在 Adversarial Training 多輪之后出現了嚴重的 mode collapse 問題,比如:

別質疑自己 遮罩錯的消息不要過得消極 世間人都笑我太瘋癲 世間人都笑我太瘋癲 守護地獄每座墳墓 世間人都笑我太瘋癲你不知道rapper付出多少才配紙醉金迷 世間人都笑我太瘋癲 但卻從來沒有心狠過 如果你再想聽你不知道rapper付出多少才配紙醉金迷 你不知道rapper付出多少才配紙醉金迷

可以看到“世間人都笑我太瘋癲”和“你不知道rapper付出多少才配紙醉金迷”占據了我們生成的結果。mode collapse,簡單來說就是輸入的改變不會影響生成的結果。為此我們調研了一些 Paper,最終采用了SentiGAN 中提出的 Penalty-based Objective Function:

3、押韻

嘻哈歌詞非常重要的一個特點就是句與句之間的押韻,我們在實現這一功能的時候嘗試了兩種方案:

1.Reward based,在 reward 函數上增加額外的押韻獎賞項, r(rhyme):對 Generator 的生成的句子和輸入的句子進行押韻的判斷,如果押韻,則提供額外的獎賞。

2.Rule-based,生成時只對押韻的詞進行采樣:在生成句尾的詞的概率分布時候,通過獲取和輸入句尾押韻的詞,只在這些押韻的詞進行采樣。

方法一,如果能夠通過設計 reward function 就能實現押韻的功能,那模型就是完全 end2end,非常 fancy 了。但是理想很豐滿,現實很骨感,經過幾天的調整押韻獎賞的權重,都沒能看到押韻率(我們設置的用于檢測押韻獎賞效果的指標,每個 batch 中和 input 押韻的句子的比例)的上升 。我們懷疑是這種獎賞的結合會讓 Generator 產生混淆,并不能明確自己 reward 來自何處,應該需要更加具體的一些限制才能夠實現這一方法。

方法二,一開始我是拒絕這么做的,用基于規則的方法不是我的理想。但是為了做出產品來,我還是屈服了。但還有一個問題擺在面前:怎么知道生成的是句尾呢?導師提醒我們,我們可以把輸入倒過來。這是 NMT 中常用的一個手段,對于 LSTM,句子是真的還是反的差別不大,即使有差別,也可以通過一個 Bi-LSTM 來捕獲不同順序的信息。而為了知道哪些字詞是押韻的,我們實現制作了一張 vocab_size x vocab_size 的大表 rhyme,如果兩個詞(index 分別為 i, j)押韻,則 rhyme[i, j] 非 0,否則為 0。

如上圖所示,如果我們的輸入為“你真美麗”,句尾詞為“美麗”,韻腳為 i;最終采樣結果只會在押韻的詞中采樣,示例的采樣結果為“春泥”。

據此,我們就可以對生成過程的第一個詞的詞表分布進行一個 mask 操作,使得非押韻的詞的概率都變成 0,就能夠保證押韻了,代碼片段如下:

#獲取input的最后一個詞first_token=self.inputs[:,0]#(batch_size,1)#控制押韻的概率,現在設置為1.0,即100%押韻select_sampler=Bernoulli(probs=1.0,dtype=tf.bool)select_sample=select_sampler.sample(sample_shape=self.batch_size)#獲取對應的index押韻行token_rhyme=tf.cast(tf.gather(self.table,first_token),tf.float32)#進行maskprob_masked=tf.where(select_sample,tf.log(tf.multiply(token_rhyme,tf.nn.softmax(o_t))),tf.log(tf.nn.softmax(o_t)))#根據mask之后的概率分布進行采樣next_token=tf.cast(tf.reshape(tf.multinomial(prob_masked,1),[self.batch_size])

不過這個制表的過程比較耗費時間(大約跑了 3 個小時,i7)。另一種思路是可以根據韻腳對字詞進行分類,將相同韻腳的詞的 index 編到一起,這樣我們可以通過獲取每個詞的韻腳來知道目標詞的范圍,而不用挨個的去判斷是否押韻。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    30752

    瀏覽量

    268901
  • 函數
    +關注

    關注

    3

    文章

    4327

    瀏覽量

    62574
  • 生成器
    +關注

    關注

    7

    文章

    315

    瀏覽量

    21003

原文標題:AI有嘻哈!

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    為什么只有藍色LED獲得了諾貝爾

    電路元器件邏輯電路
    學習電子知識
    發布于 :2023年08月14日 20:09:04

    慶科智慧應用創新設計大賽決賽圓滿落幕 S-max智能騎行頭盔斬獲頭獎

    獲得三等的則是施飛峰團隊的夾心餅電子積木項目。周忠S-max智能騎行頭盔路演現場前三甲隊伍與評委合影此外,有六支參賽隊伍的項目獲得了優勝
    發表于 12-21 21:48

    第二屆“全志杯”微創客挑戰賽圓滿落幕,比派科技 Banana Pi作為官方合作伙伴全程參與

    ,來自中國科學院沈陽自動化研究所的sia-robot,重慶郵電大學的奶牛護衛隊,電子科技大學/哈爾濱工業大學Robot+,分別獲得了最佳技術難度
    發表于 04-20 10:19

    壯大隊伍呀!

    迅速把隊伍壯大起來呀,我們是深圳市阿米諾技術有限公司,專業做智能醫療產品,歡迎大家來進行技術交流。
    發表于 09-30 13:27

    為什么我示例項目從EEPROM閱讀只獲得了0xFF?

    示例項目從EEPROM寫和讀。但在閱讀方面,我只獲得了0xFF。
    發表于 08-05 10:53

    OpenHarmony開源開發者成長計劃—解決方案學生挑戰賽Demo Day

    賽制說明Demo Day 是配套解決方案學生挑戰賽的活動,向全國各地的開發者展示參賽作品并評選一等的線上直播活動。本次大賽技術評審團已評選出十支參賽隊伍,來參加成長計劃學生挑戰賽Demo
    發表于 09-22 10:01

    Demo Day直播 | 成長計劃解決方案學生挑戰賽一等即將揭曉!

    Demo Day直播 | 成長計劃解決方案學生挑戰賽一等即將揭曉!OpenAtom OpenHarmony開源開發者成長計劃解決方案學生挑戰賽Demo Day來襲!每一支隊伍心懷夢想
    發表于 09-26 11:25

    羅技推出便攜防水藍牙音箱 十足

    最近極客之選體驗了一款音箱,不論是外觀還是聲音都十足,我們一起來看看它有什么特別。 不得不說,《中國有》、《這!就是街舞》等節目的出現,令國內的
    的頭像 發表于 03-28 10:17 ?4679次閱讀

    5個AI隊伍竟然可以在《Dota2》戰勝人類5人隊伍

    之前AI在中單solo打敗知名選手Dendi的事情過了很久了,同團隊開發的5個神經網絡AI隊伍已經能在《Dota2》中戰勝業余的人類5人隊伍
    的頭像 發表于 07-25 11:18 ?3071次閱讀

    億智電子獲評AI+芯片領域「AI最佳商用成長

    據悉,「AI最佳商用成長」的評審維度包含:商用落地領域類型與客戶數、商用問題解決能力、項目售前服務能力、售后客戶評價指數、KA客戶與年度合作金額等。一直以來,億智電子
    的頭像 發表于 09-07 16:21 ?2383次閱讀

    IBM已獲得認證的金牌服務提供商資格

    IBM已幫助數百名客戶加快了自動化進程,包括與 Jaguar Land Rover和Pearson的合作,后者在2019年獲得了Blue Prism的``人民選擇‘’,并且與美國退
    的頭像 發表于 09-11 11:05 ?2334次閱讀

    WXYZ 7050隊獲得了FTC項目的最高獎項啟迪

    隊長。2019賽季遠征香港斬獲了冠軍聯盟隊長。在2020這個特殊的賽季,取得了北京市智能機器人大賽FTC項目一等,又獲得FTC南京邀請賽冠軍聯盟隊長和設計獎。最為激動人心的是在剛剛結束的FTC全國線上評審活動中,第一梯隊WXY
    的頭像 發表于 10-10 14:02 ?2580次閱讀

    2020 年度最佳 5G 手機:魅族17系列手機拿到手軟!

    魅族17系列手機最近是拿到手軟了,前不久剛剛獲得日本GOOD DESIGN AWARD 2020優良設計獎,今天魅族17 Pro又獲得了CMC天鵝“ 2020 年度
    的頭像 發表于 11-05 16:13 ?1782次閱讀

    Seucre-IC與合作伙伴獲得了硬件安全與信任(HOST)的最佳演示

    Secure-IC與NaghmehKarimi博士的團隊(SECRETS實驗室成員)及巴黎電信的合作者在2023年IEEE國際研討會上獲得了硬件安全與信任(HOST)的最佳硬件演示,這是具有標志性的硬件安全方面的會議,在加利福
    的頭像 發表于 05-18 10:04 ?853次閱讀
    Seucre-IC與合作伙伴<b class='flag-5'>獲得了</b>硬件安全與信任(HOST)的<b class='flag-5'>最佳</b>演示<b class='flag-5'>獎</b>!

    長城汽車弗H6斬獲巴西最佳混合動力汽車

    近日,長城汽車弗H6 PHEV兩驅版在巴西權威的“頂級汽車電視”(Top Car TV Award)評選中,連續兩年斬獲“最佳混合動力汽車”獎項,獲得了當地汽車行業和用戶的高度認可
    的頭像 發表于 11-27 09:55 ?146次閱讀
    主站蜘蛛池模板: 果冻传媒2021一二三区| a圾片目录大全| 中文字幕永久在线观看| 影音先锋亚洲AV少妇熟女| 自拍视频亚洲综合在线精品| 97草碰在线视频免费| 99久久精品国产高清一区二区| 成人国产免费| 国产又爽又黄又不遮挡视频| 久久成人免费观看草草影院| 蜜桃无码AV视频在线观看| 欧美午夜精品一区二区蜜桃| 美国caopo超碰在线视频| 国产精品嫩草影院| 24小时日本高清免费看| 国产午夜精品一区二区| 国产精品亚洲精品爽爽| 久久88综合| 漂亮的保姆5电影免费观看完整版中文 | 亚洲精品成人无码A片在线| 亚洲精品一区二区在线看片| 2022一本久道久久综合狂躁| 帝王被大臣们调教高肉| 黑人巨大交牲老太| 欧美不卡一区二区三区| 午夜宅宅伦电影网| 20岁中国男同志china1069| 国产激情文学| 久就热视频精品免费99| 日韩精品熟女一区二区三区中文| 亚洲精品色婷婷在线蜜芽| 97超在线视频| 国产欧美一区二区精品性色tv | 久久九九久精品国产尤物| 青青青视频在线| 亚洲欧美日本国产在线观18| A级毛片无码久久精品免费| 国精产品一区二区三区有限公司| 奶头好翘是不是想要了| 亚洲精品国产高清不卡在线| FERRCHINA内入内射|