色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

用NLP技術(shù)分析了一位出名卻也具有爭議的嘻哈歌手——Drake創(chuàng)作的歌詞

電子工程師 ? 來源:未知 ? 作者:李倩 ? 2018-10-04 09:08 ? 次閱讀

【導讀】如何評定一首歌的歌詞的創(chuàng)造性?有些歌詞是否真的套詞或假借他人之手?本文作者就嘗試用 NLP 技術(shù)分析了一位出名卻也具有爭議的嘻哈歌手 —— Drake 創(chuàng)作的歌詞,來看看他的歌詞中到底蘊藏著什么秘密。

背景

每隔幾年就會有一位藝術(shù)家風靡世界。甲殼蟲樂隊和邁克爾杰克遜的盛名不必多說。 這些藝術(shù)家用他們天才般的創(chuàng)造力感染著數(shù)百萬人。現(xiàn)在,許多藝人爭相想成為 Top 1。有些出乎意料的是,一位多倫多本地,藝名叫“Drake”的藝人,近年來聲勢頗盛。

Drake最初聲名鵲起的原因他參演了一部在21世紀初流行的青少年情景喜劇《德格拉西:下一代》中的角色。然而,當 Drake 想成為一名說唱歌手時,他便退出了演出。在與唱片公司簽約后,Drake 發(fā)行了他的第一張專輯《So Far Gone》。這張專輯獲得了 Platinum 認證,并讓Drake迅速登頂了嘻哈世界的頂峰。在接下來的八年里,他又連續(xù)出了多張專輯,其中專輯Scorpion 是他最近發(fā)行的新專輯。

為什么 Drake 的作品很受歡迎?這里面可能包含很多原因。然而,我選擇從他歌曲的歌詞方分析入手。獲取 Drake 歌曲的歌詞文本數(shù)據(jù)并不困難,難的是,如何分析它們?這就要感謝如今日益提升的 NLP(自然語言處理)技術(shù),使分析文本數(shù)據(jù)比以往容易很多。

今天,神經(jīng)網(wǎng)絡已經(jīng)成為無數(shù) NLP 算法的通用框架,有各種各樣的工具可供使用,因此開發(fā)者可以使用它們解決大量的 NLP 問題。這些工具讓我可以分析 Drake 的歌詞。

在進入實際分析之前,我需要先處理一下 Drake 的歌詞。雖然有幾個在線的歌詞資源可用,但我決定使用 Genius.com。Genius 是一個注釋歌詞的網(wǎng)站,并且有一個很棒并易于使用的API。

Drake 的哪一首歌有最獨特的歌詞?

大家似乎對 Drake 的創(chuàng)造力并不買賬,經(jīng)常批評他缺乏創(chuàng)造力。過去,他常被指控竊取其他說唱歌手的 flow 并且擁有幕后的作詞者。我打算去看看這些評論是否合理。

我從其他文章中提到的處理方法獲得靈感。不分析歌詞的總字數(shù),在我看來一首歌的歌詞總字數(shù)并不能作為衡量創(chuàng)造性的主參考,我改為分析歌詞中的獨特詞。

在完成清理文本數(shù)據(jù)后,我開始分析每首歌曲中獨特歌詞的數(shù)量。下面是 Drake 所有歌曲中獨特歌詞分布的直方圖。似乎他的大多數(shù)歌曲都有 100 到 200 個獨特詞。但是沒有其他藝術(shù)家歌曲的分布作參考,這個直方圖目前并不能說明 Drake 的創(chuàng)造力。

一個更好的方法是根據(jù)專輯的獨特詞來看他的創(chuàng)造力。下圖是在 Tableau 中完成的可視化結(jié)果。x 軸表示專輯的名稱,y軸表示獨特詞的數(shù)量。每個Bubble(氣泡)代表一首歌。就獨特的歌詞而言,似乎沒有任何一張專輯顯得更具創(chuàng)意。但是,每件作品在獨特歌詞數(shù)量方面至少有一個異常值。令人吃驚的是,盡管有如此龐大的作品數(shù)量(25首歌曲),他最近發(fā)行的專輯 Scorpion 上的歌曲在獨特歌詞的數(shù)量上幾乎沒有變化。

現(xiàn)在,再回答上面的問題,哪首歌具有最獨特的歌詞?答案似乎是 6PM in New York。 下表列出了排名前十的歌曲。

命名實體識別(NER)

命名實體識別屬于“信息提取”的子任務,旨在將文本中的命名實體定位和分類為預定義的類別,例如人員,組織,地點,時間表,數(shù)量,貨幣價值,百分比等等。”(維基百科)。 NER是一項特別棘手的任務。由于語言的復雜性,使得創(chuàng)建一個對所有文本都準確的 NER 算法非常困難。某個算法或許可以在一個語料庫(在我們的例子中就是 Drake 歌詞的集合)上效果很好,但是在另一個語料庫上表現(xiàn)就不好。這種不一致性使得有必要多嘗試幾種 NER 算法。我也嘗試了集中不同的算法,發(fā)現(xiàn)有些算法并不是非常不準確。下面簡要介紹一下我使用的兩個 NER 算法:NLTK 和 CRF-NER。

第一個是 NLTK 提供的命名實體算法。“Ne_chunk”使用了部分語音標簽(POS標簽)的單詞列表來推斷哪些單詞是命名實體。從下面的結(jié)果中可以看出,NLTK的算法本身并沒有做得很好。

我嘗試的第二個命名實體算法是由斯坦福提出的令人印象深刻的 NER 工具 —— CRF-NER。

與NLTK算法相比,它需要更長的運行時間,但會產(chǎn)生更準確的結(jié)果。雖然它并不完美,但有明顯的進步。

主題建模

NLP中最有趣的方向之一就是主題建模了。主題模型是一種統(tǒng)計模型,用于發(fā)現(xiàn)在文檔集合中的抽象主題。它是一種常用的文本挖掘工具,用于在文本中發(fā)現(xiàn)隱藏的語義結(jié)構(gòu)”。主題建模有幾種突出的算法。其中最突出的是顯式語義分析和非負矩陣分解。在這次的分析中我選擇用線性判別分析(LDA)。LDA是由 Andrew Ng,Michael I. Jordan和David Blei 開發(fā)的一種生成統(tǒng)計模型。首先通過學習給定語料庫中固定數(shù)量的主題表示,然后在給定的主題數(shù)量的情況下,LDA將學習語料庫中每個文檔的主題分布。

▌1.給所有Drake的歌詞進行主題建模

想要使用 LDA 的第一件事就是學習 Drake 所有歌曲中最突出的主題。為了實現(xiàn)這一點,我先將所有歌曲放入列表中。然后,使用 SciKitLearn 的 CountVectorizer 工具,創(chuàng)建了所有這些歌曲的詞袋表示。詞袋模型是一種通過矩陣表示單詞的簡單方法。 然后,使用SciKitLearn 版本的LDA,我訓練了一個可以在給定文本中找到8個主題的模型。

▌2.可視化主題

有兩種將 LDA 模型進行可視化的方法。第一個是通過寫一個函數(shù),輸出為每個主題中最突出的單詞。這個結(jié)果似乎很有意思,但它只能提供了少量的信息。例如下圖中的結(jié)果,能知道主題7與主題2不同,但無法得知更多它們之間不同程度的信息。

出于這個原因,我用了另一種可以在文本中顯示主題的方法。

Python中,有一個很棒的庫叫做 pyLDAvis。它是一個專門使用 D3 來實現(xiàn) LDA 模型可視化的庫。D3可以說是目前最好的可視化工具。(但是,它主要為 Javascript 用戶準備的。因此擁有此插件但對JavaScript 不太了解的人非常有用。)這個庫通過降維來實現(xiàn)可視化。 降維將有許多變量的數(shù)據(jù)集壓縮為較少量的特征。降維技術(shù)對于數(shù)據(jù)可視化非常有用。基于我要解決的問題,我認為最好使用T-SNE(T分布的隨機鄰域嵌入)來降低維數(shù)。

從我訓練好的模型來看,Drake的大部分歌詞都可以分類到了 Topic 2,一個占據(jù)圖表大部分的大型主題。

▌Drake 所有主要專輯的主題又是什么樣的呢?

我按照與之前相同的步驟來嘗試處理這個問題,這次我沒有用 LDA 算法去找每個專輯間的主題。 而是使用了定義函數(shù)的方法來顯示他所有主要作品中最突出的單詞。

總結(jié)

每當 Drake 發(fā)布新歌或?qū)]嫊r,肯定會有不滿的聲音。但他的作品幾乎總是在人氣榜上排名靠前的位置。他的歌詞瞬間也成為 Instagram 和 Facebook 話題的主要內(nèi)容,還會霸占數(shù)星期。他的歌讓人很容易記住,大部分原因要歸功于他的歌詞。

通過主題建模和命名實體識別完成了一個簡單的 NLP 項目,也對文本內(nèi)容(Drake的歌詞)有了不同且更具體的理解。這只是一個起點,也建議大家在工作和生活中進行一些實踐,不斷嘗試,積累技能。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡

    關(guān)注

    42

    文章

    4771

    瀏覽量

    100719
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4607

    瀏覽量

    92841
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    488

    瀏覽量

    22033

原文標題:如何評價創(chuàng)作歌手的業(yè)務能力?試試讓NLP幫你分析一下

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    ACHO MP3歌詞不能同步顯示,而且有時出現(xiàn)亂碼怎么辦?

    ;歌詞文件和歌曲文件不同,改為致的文件即可,只是兩個文件的后綴不同,如:江南—林俊杰.
    發(fā)表于 10-19 10:00

    一位全加器代碼VHDL

    VHDL的人好少,哎……一位全加器的邏輯表達式是: S=A⊕B⊕Ci Co=AB+ACi+BCi 然后是代碼:[code]USE IEEE.STD_LOGIC_1164.ALL; USE
    發(fā)表于 12-09 22:16

    一位全加器代碼VHDL

    VHDL的人好少,哎……一位全加器的邏輯表達式是: S=A⊕B⊕Ci Co=AB+ACi+BCi 然后是代碼:[code]USE IEEE.STD_LOGIC_1164.ALL; USE
    發(fā)表于 12-09 22:17

    請問是否可以GIOA口中某一位代替GIOB的某一位

    本帖最后由 只耳朵怪 于 2018-5-22 10:41 編輯 問是否可以GIOA口中某一位代替GIOB的某一位
    發(fā)表于 05-22 04:12

    什么是一位全加器,其原理是什么?

    什么是一位全加器,其原理是什么  加器是能夠計算低位進位的二進制加法電路 一位全加器由2個半加
    發(fā)表于 03-08 17:13 ?7.6w次閱讀

    逆天音質(zhì)“Hi”個夠 華為nova 2系列帶你玩純正

    當你蹬上麥黃短靴、提上工裝仔褲、套上大號白T時準備出門時,千萬別忘了在兜里揣上你的華為nova 2系列,只會穿衣打扮那叫膚淺,時刻在Hip-Hop節(jié)奏里生活,才是Gangsta的入門指南。
    發(fā)表于 07-19 19:59 ?1447次閱讀

    羅技推出便攜防水藍牙音箱 十足

    最近極客之選體驗款音箱,不論是外觀還是聲音都十足,我們起來看看它有什么特別。 不得不說,《中國有
    的頭像 發(fā)表于 03-28 10:17 ?4679次閱讀

    NLP的介紹和如何利用機器學習進行NLP以及三種NLP技術(shù)的詳細介紹

    本文簡潔易懂的語言,講述自然語言處理(NLP)的前世今生。從什么是NLP到為什么要學習NLP,再到如何利用機器學習進行
    的頭像 發(fā)表于 06-10 10:26 ?7.7w次閱讀
    <b class='flag-5'>NLP</b>的介紹和如何利用機器學習進行<b class='flag-5'>NLP</b>以及三種<b class='flag-5'>NLP</b><b class='flag-5'>技術(shù)</b>的詳細介紹

    AI自動生成歌詞的隊伍獲得了“最佳DEMO獎”

    我們在這個基礎(chǔ)之上,有生成網(wǎng)絡。第點是在這個之前我們增加了個編碼網(wǎng)絡,將然后生成
    的頭像 發(fā)表于 08-28 09:14 ?1.3w次閱讀

    回顧2018年深度學習NLP十大創(chuàng)新思路

    Sebastian Ruder 是一位 NLP 方向的博士生、研究科學家,目前供職于家做 NLP 相關(guān)服務的愛爾蘭公司 AYLIEN,同時,他也是
    的頭像 發(fā)表于 01-08 11:25 ?3546次閱讀

    一位NLP算法工程師對NLP的看法

    最近的項目就是NLP相關(guān),說些個人對NLP的看法。直觀地看,NLP算法工程師的經(jīng)驗和算法工程師的經(jīng)驗沒有太大差別。NLP的發(fā)展并不是那么快
    的頭像 發(fā)表于 04-24 09:37 ?5216次閱讀

    人工智能創(chuàng)作,難以符合“知人論世”標準

    當我們將“陽光失玻璃窗”作為句詩來賞析時,我們認為它是出自某位詩人之手的,或許他不是一位出名的詩人,但并不影響我對這句詩的欣賞分析。但如
    的頭像 發(fā)表于 01-15 10:10 ?2050次閱讀

    人臉識別是安防系統(tǒng)最具安全爭議技術(shù)?

    被認為十大人類突破性技術(shù)的人臉識別,具有色彩賦予創(chuàng)新的意義,卻也是最具爭議技術(shù),作為重要的身份鑒別身份,人臉識別
    發(fā)表于 11-17 16:54 ?685次閱讀

    獨家!Intel 正在尋找一位新 CEO

    近日,據(jù)外媒 HEXUS 報道,一位為 uzzi38 的 Reddit 用戶公布份投資者和分析師會議實錄,該會議由知名投資機構(gòu) SIG
    的頭像 發(fā)表于 12-23 09:39 ?1316次閱讀

    學生通過AI應用創(chuàng)作音樂劇歌詞

    據(jù)外媒CNET報道,由林-曼努爾·米蘭達編劇、作曲及主演的音樂劇《漢密爾頓》( Hamilton )口碑極高,鐵桿粉絲們可能永遠也聽不夠其悅耳易記的配樂。現(xiàn)在查普曼大學電影制作專業(yè)的學生Eli Weiss使用了Shortly Read(款為寫作而設(shè)計的人工智能應用)來模仿創(chuàng)作
    的頭像 發(fā)表于 12-30 14:34 ?1659次閱讀
    主站蜘蛛池模板: 久久精品影院永久网址| 秋霞伦理电影在2017韩国在线伦| 日本久久中文字幕| 真实处破女全过程完免费观看| 冠希和阿娇13分钟在线视频| 久久中文字幕亚洲| 亚洲国产中文字幕在线视频综合| 饱满奶大30p| 伦理片天堂eeuss影院| 亚洲国产成人私人影院| 床伴在线观看免费高清完整泰剧第四集 | 久久午夜一区二区| 香蕉精品国产自在现线拍| yellow在线观看免费观看大全| 久久综合亚洲色hezyo| 亚洲欧美日韩在线码不卡| 国产成人女人在线视频观看| 欧美男同gay粗大又长| 最近中文字幕高清中文| 精品亚洲欧美中文字幕在线看| 翁公吮她的花蒂和奶水| 超碰97人人做人人爱少妇| 男女AA片免费| 40岁东北老阿姨无码| 久久re视频这里精品免费1 | 一二三四在线观看高清电视剧 | 久久视频这里只精品99热在线观看| 亚洲不卡视频在线观看| 国产精品999| 受喷汁红肿抽搐磨NP双性| 第一次玩老妇真实经历| 奇米狠狠一区二区三区| 91天堂国产在线 在线播放| 久久在精品线影院精品国产| 伊人久久伊人| 久久精品18| 再深点灬舒服灬太大了在线视频| 精品四虎国产在免费观看| 亚洲视频欧美视频| 精品视频网站| 伊人网伊人网|