色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

情感分析常用的知識有哪些呢?

深度學習自然語言處理 ? 來源:哈工大SCIR ? 作者:哈工大SCIR ? 2021-04-15 14:22 ? 次閱讀

1.引文

情感分析 知識

當training數據不足以覆蓋inference階段遇到的特征時,是標注更多的數據還是利用現有外部知識充當監督信號

基于機器學習深度學習的情感分析方法,經常會遇到有標注數據不足,在實際應用過程中泛化能力差的局面。為了彌補這一缺點,學者們嘗試引入外部情感知識為模型提供監督信號,提高模型分析性能。本文從常見的外部情感知識類型出發,簡要介紹在情感分析中使用知識的一些代表性工作。

2.正文

我們為什么要不斷嘗試在情感分析中融入知識呢?筆者以為有如下幾點原因:

1)一般的文本分類任務只提供句子或文檔級別的情感標簽,引入情感詞典等先驗情感知識可以給情感文本引入更細粒度監督信號,使得模型能學到更適合情感分析任務的特征表示。

2)底層的詞性、句法等分析任務能給下游的情感分類、抽取任務提供參考信息,如評價表達通常是形容詞或形容詞短語,而評價對象通常是名詞;不同情感分析任務本身存在相互促進作用,如評價對象和評價詞在句子中出現的距離通常比較近,聯合抽取能同時提高兩者的性能表現。

3)短文本評論通常略去了大量的背景常識知識,從文本本身通常難以推斷真實情感傾向性。例如一條有關大選的推文內容是“I am so grateful for Joe Biden. Vote for #JoeBiden!!”,文本中并未涉及任何有關Trump的描述,要判斷它關于Trump的立場傾向性時,需要了解的背景知識是,二者是這次大選的競爭對手,支持一個人就意味著反對另一個人。

那情感分析常用的知識又有哪些呢?

2.1 知識的類型及情感分析常用知識庫

依據對知識獲取途徑的劃分方式[1],我們簡單總結了情感分析中常用的知識類型:

顯性知識

一般情感詞典(如MPQA,Bing Liu詞典等),情感表情符;否定詞(Negation)、強化詞(Intensification)、連接詞(Conjunction)等規則

SentiWordNet

ConceptNet,SenticNet

數據

數據 (Twitter、微博表情符弱標注數據)

領域數據集 (例如某一類別商品評論數據)

學習算法

詞法、句法、語義依存等模型

多任務學習算法

預訓練語言模型、詞向量學習算法

其中,以情感詞典最為常用。情感分析數據通常結合語言模型算法,產生情感向量表示作為下游任務輸入;詞法、句法分析模型一般直接為下游情感分析任務提供特征輸入或者以多任務學習的方式參與到下游情感分析任務的訓練過程中;結構化的外部知識庫通常需要借助圖算法進行特征挖掘,為文本提供更豐富的常識、情感上下文信息。

2.2 知識的引入方式及在情感分析部分任務上的應用

下表展示了幾種常見的知識類型及其特點,我們將根據知識的獲取途徑及引入方式,結合具體論文闡述其使用方式。

人工情感詞典 質量高 規模小,靜態,覆蓋低
自動情感詞典 規模大 靜態、質量低
語言學規則 適用范圍廣 不夠準確
預訓練語言模型 上下文建模能力強 參數量大,訓練時間長,運行速度慢
常識知識庫 規模大、質量高、覆蓋全 利用困難
知識類型 優點 缺點

目前,相關的情感分析工作可以大致分為以下幾類:

引入情感詞典知識

要說情感知識,大部分人首先會想到的就是人工編纂的情感詞典,它簡明直觀、質量高、極性明確,使用方便,廣泛應用在情感分類、情感元素抽取、情感原因發現、情感文本風格遷移等多種情感分析任務上。情感詞區別于非情感詞的地方在于,它們一般表征一定的情感/情緒狀態,通常情感詞典中還會給出其強度打分。類似的,現在網絡上流行的部分表情符 (emoj,如:) 、:( 、、)也能表征某些情感/情緒狀態。

圖1 人工編纂的情感詞典

我們在這里介紹一個同時使用情感詞典中詞的極性和打分的工作,看看前人們是如何在神經網絡中把情感詞的情感信息融入文本的情感表示中的。

給定一段評論文本,Teng等人[2]首先找出其中的情感相關詞匯(如情感詞、轉折詞、否定詞),并計算其對文本整體情感極性的貢獻程度,然后將每個詞的貢獻值乘上其情感得分作為局部的情感極性值,最終加上全局的情感極性預測值作為整個文本的情感得分。

8cd4870a-9cd8-11eb-8b86-12bb97331649.png

圖2 同時使用情感詞典中詞的極性和打分

雖然上述工作在計算情感得分時,考慮了not、very等否定詞、強化詞的得分信息,但是沒有顯式把這些詞對周圍詞的情感語義表示的影響刻畫出來,Qian等人[3]考慮到情感詞、否定詞、強化詞在情感語義組合過程中起到的不同作用,對文本建模過程中對不同位置詞的情感分布加以約束。例如,若一個詞的上文是not等否定詞,會帶來not處文本情感語義的翻轉。

8ce570c4-9cd8-11eb-8b86-12bb97331649.png

圖3 對不同位置詞的情感分布加以約束

總體來看,情感詞典作為一種易于獲取、極性準確的情感知識,能夠在標注語料之外,為情感分析提供額外的監督信號,既可以提升有監督模型的泛化能力,也能夠為半監督、無監督模型提供一定的指導。

引入大規模無標注語料

語言建模作為一個典型的自監督學習任務,其語言模型產生的詞表示作為下游任務網絡模型的輸入,表現出優越的性能,因而得到廣泛的應用。如果能將情感知識融入到語言模型中,其產生的詞表示必然對情感分析各子任務帶來性能提升。

我們接著介紹一個在詞向量中融入顯式情感詞典知識(實際使用的是表情符)的方法。

Tang等人[4]觀察到,一般的詞向量對于“good”和“bad”這種上下文相近但極性相反的詞,給出的向量表示沒有很強的區分性,不利于下游的各情感分析任務。Twitter和微博中有海量包含表情符的文本,利用這些情感極性明確的表情符可以過濾得到大量弱標注的情感文本。Tang等人使用這些語料,他們在普通的C&W模型基礎上,引入情感得分相關的損失,將這些弱標注的情感信息融入詞向量表示中,使“good”和“bad”這種上下文相近但情感不同的詞的向量表示有明顯的差異。在情感分類任務上,他們驗證了融入情感表情符知識的有效性。在此基礎上,他們還進一步自動構建大規模情感詞典,該詞典被[2]應用到Twitter情感分類任務上。

8cf22e7c-9cd8-11eb-8b86-12bb97331649.png

圖4 將基于表情符過濾的弱標注情感信息融入詞向量表示中

引入外部特征提取算法

除了準確的情感詞知識,詞法、句法、語義依存信息、評價詞和評價表達等情感信息在文本的情感語義建模過程中也發揮了重要作用,這些知識不是顯性存在于大規模的知識圖譜中,而是存在于對應的人工標注數據中。一般利用學習算法從這些數據中訓練用于提取特征的模型。

Tian等人[5]在近期的預訓練BERT語言模型基礎上,將文本中的評價對象(屬性)、情感詞等情感元素引入Mask Language Model預訓練任務,進一步提高了BERT類模型在多個情感分類數據集上的性能。

8d0c8e5c-9cd8-11eb-8b86-12bb97331649.png

圖5 將多種情感元素引入Mask Language Model預訓練任務 同[3]類似,Ke等人[6]在預訓練語言模型中引入詞級別的情感、詞性知識。他們先給每個詞預測詞性信息,然后依據詞性信息從SentiWordNet中推斷其情感極性。基于獲得的詞性和情感信息,他們在一般的Masked Language Model基礎上同時預測這些語言學標簽,實現在預訓練語言模型中注入情感知識。該模型在主流的情感分類、細粒度情感分析數據集上取得了目前最好的結果,證明引入詞性和情感極性知識在預訓練任務中的有效性。

8d1fa410-9cd8-11eb-8b86-12bb97331649.png

圖6在預訓練語言模型中引入詞級別的情感、詞性知識

Sun等人[7]提出在面向屬性的情感分類(ABSA)任務上,引入Stanford parser解析得到的依存樹信息輔助識別評價對象相關的評價詞。他們將GCN在依存樹上學習得到的表示與BLSTM學習到的特征結合,判斷句子針對評價對象的情感極性。

8d3b0ef8-9cd8-11eb-8b86-12bb97331649.png

圖7將GCN在依存樹上學習得到的表示與BLSTM學習到的特征結合

在外部特征引入方式上,目前方法以兩種方法為主:(1)直接作為特征輸入模型(2)以多任務學習的方式,作為輔助任務與主任務一同訓練。這些方法的區別主要在引入特征類別或者輔助任務的任務設計。

引入常識知識

除了情感詞典、情感詞向量、情感預訓練語言模型、文本特征抽取器外,結構化的外部知識也是很常見的一種情感知識來源。它的特點是規模大,覆蓋面廣,蘊含豐富的實體、事件或者常識概念間相關關系知識。結構化知識中具備高質量的關系類型,因而適用于需要推理、泛化的情感分析任務。

一個典型的需要泛化的任務是跨領域文本情感分類任務。源端和目標端的評價對象、評價詞等情感相關特征差異較大,訓練時模型依賴的源端分類特征未必會在目標端文本中出現,如何將這些情感特征進行對齊是一個重要且富有挑戰性的問題。一類方法是使用通用情感詞典作為pivot信息,建立源端、目標端共享特征的對齊,但這類方法只考慮共享的情感詞信息,且通過文本本身學習到的情感表達對齊也不充分、準確,同時無法捕獲到不同領域之間評價對象之間鏈接關系。

而結構化外部知識正好彌補了這些缺點,它蘊含情感詞到非情感詞、不同領域評價對象之間的關聯關系。近年由于圖表示算法的進步,學者們能夠更高效的對這些結構化外部知識加以利用。

在跨領域情感文檔情感分類任務上,Ghosal等人[8]在ACL2020上提出KinGDOM算法, 利用ConceptNet為所有領域構建一個小規模知識圖譜,然后找出每個文檔中獨有的名詞、形容詞、副詞集合,再依據從中抽取出一個文檔相關的子圖,進而提供一個由知識庫知識提取而來的特征表示,與文檔本身的情感表示一起做最后的情感分類。

8d6956f0-9cd8-11eb-8b86-12bb97331649.png

圖8KinGDOM算法

類似地,在跨目標立場分類任務上,Zhang等人[9]利用SenticNet和EmoLex構建學習帶情緒關系連接的語義-情緒圖譜(SE-graph),并使用圖卷積神經網絡(GCN)學習節點表示。給定一段文本,他們使用SE-graph為每個詞學習構建一個子圖并學習其表示,得到的外部特征表示送入修改后的BLSTM隱層,與當前上下文特征進行融合。

8d7c327a-9cd8-11eb-8b86-12bb97331649.png

圖9基于SE-graph 使用GCN學習節點表示

這兩個工作都使用外部結構知識,擴展了輸入特征空間,利用知識庫中的連接將源端和目標端的評價詞、評價對象等特征進行對齊,極大地豐富了情感上下文信息。

3.總結

本文介紹了情感分析中引入外部知識的部分工作,簡要介紹了現階段情感分析常用的外部知識,從最常見的情感詞典入手,逐步介紹基于情感詞典的情感詞向量、預訓練語言模型,展示了使用多任務學習融合詞性、依存句法等文本底層特征抽取器的工作,最后介紹了近期熱門的使用結構化外部知識的文本情感遷移學習工作。我們可以看出,情感詞典雖然最為簡單,卻是情感知識引入多種引入方式的基石,在情感分析算法中地位無出其右。

對于未來工作,一方面,由于目前的情感分析中知識引入的應用場景仍局限在情感分類任務中,有待擴展到情感抽取、情感(多樣性)生成等各個情感分析任務上;另一方面,在情感分析專用預訓練語言模型中融合結構化外部知識,增強預訓練語言模型對情感分析相關世界知識的理解仍有待探索。

責任編輯:lq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 文本分類
    +關注

    關注

    0

    文章

    18

    瀏覽量

    7330
  • 數據集
    +關注

    關注

    4

    文章

    1208

    瀏覽量

    24737
  • 情感分析
    +關注

    關注

    0

    文章

    14

    瀏覽量

    5246

原文標題:【情感分析】基于知識引入的情感分析

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    Minitab常用功能介紹 如何在 Minitab 中進行回歸分析

    Minitab是一款強大的質量管理統計軟件,為質量改善、教育和研究應用領域提供統計軟件和數據分析工具。以下是對Minitab常用功能的介紹,以及使用Minitab進行回歸分析的具體步驟
    的頭像 發表于 12-02 15:38 ?791次閱讀

    基于LSTM神經網絡的情感分析方法

    情感分析是自然語言處理(NLP)領域的一項重要任務,旨在識別和提取文本中的主觀信息,如情感傾向、情感強度等。隨著深度學習技術的發展,基于LSTM(長短期記憶)神經網絡的
    的頭像 發表于 11-13 10:15 ?563次閱讀

    常用的仿真軟件哪些

    在當今的工程和技術領域,仿真軟件已經成為了一種非常重要的工具。它們可以幫助工程師和研究人員在實際制造和測試之前,對系統或產品進行模擬和分析。以下是一些常用的仿真軟件及其特點: MATLAB
    的頭像 發表于 08-22 09:18 ?3221次閱讀

    smt貼片加工常用的檢測修理方法哪些

    一站式PCBA智造廠家今天為大家講講SMT貼片加工常見問題哪些?SMT貼片加工常用的檢測修理方法。隨著電子產品的不斷發展,SMT貼片加工成為電子制造業中常見且關鍵的工藝。然而,貼片加工過程中可能會
    的頭像 發表于 06-13 09:32 ?602次閱讀

    常用的電源模塊哪些

    常用的電源模塊哪些 電源模塊是電子設備中不可或缺的組成部分,它們將輸入的電壓轉換為設備所需的電壓,以保證設備的正常運行。本文將詳細介紹常用的電源模塊類型、特點以及應用場景。 一、線性電源模塊 線性
    的頭像 發表于 06-10 16:28 ?1924次閱讀

    常用的電機控制算法哪些

    在電機控制領域,選擇合適的控制算法對于實現高效、精確且穩定的電機運行至關重要。以下將詳細介紹幾種常用的電機控制算法,并通過具體的分析和實例,探討它們的特點、應用以及優勢。
    的頭像 發表于 06-05 16:31 ?2459次閱讀

    三星貼片電容規格哪些?怎么選擇

    在這里可以明確的告訴大家,三星貼片電容的規格很多。目前有上百種電三星貼片電容的規格,因為不同的三星貼片的規格,所適用的電器是不一樣的。那么三星貼片的電容哪些?如果大家想要知道三星貼片電容的規格
    的頭像 發表于 05-24 16:31 ?375次閱讀
    三星貼片電容規格<b class='flag-5'>有</b>哪些<b class='flag-5'>呢</b>?怎么選擇<b class='flag-5'>呢</b>?

    如何使用頻譜分析儀進行峰值信噪比的測量

    頻譜分析儀是一種常用于測量信號頻譜特性的儀器,它能夠測量信號的幅度、頻率以及信噪比等參數。
    的頭像 發表于 05-20 15:30 ?768次閱讀

    德國Embedded World 2024大會關鍵盤點:亮點演講Static Sentiment Analysis(靜態情感分析)和汽車軟件開發的現狀

    Sentiment Analysis(靜態情感分析)和汽車軟件開發的現狀 今年,Perforce參與了兩場演講,討論了2024年的嵌入式軟件趨勢和嵌入式開發的未來。
    的頭像 發表于 04-28 23:27 ?1099次閱讀
    德國Embedded World 2024大會關鍵盤點:亮點演講Static Sentiment Analysis(靜態<b class='flag-5'>情感</b><b class='flag-5'>分析</b>)和汽車軟件開發的現狀

    氧化硅薄膜具體什么用途

    氧化硅薄膜整個半導體制造過程是十分常見且不可或缺的,那么它具體什么用途
    的頭像 發表于 04-22 09:52 ?767次閱讀

    電勢和電壓什么關系

    電勢和電壓是電學中常用的兩個概念,它們之間有著密切的關系。本文將從不同角度對電勢和電壓進行分析。 首先,我們來對電勢和電壓這兩個概念進行定義和解釋。電勢(Electric Potential)是描述
    的頭像 發表于 02-26 14:07 ?8844次閱讀

    gis中常用的空間分析方法

    GIS中常用的空間分析方法 GIS(地理信息系統)是一種用于收集、存儲、處理、分析和展示地理數據的技術。空間分析是GIS的核心部分,它包括一系列方法和技術,用來研究地理空間數據之間的關
    的頭像 發表于 02-25 13:44 ?5821次閱讀

    arcgis空間分析方法哪些

    ArcGIS是一種廣泛使用的地理信息系統(GIS)軟件,它提供了許多強大的空間分析方法。空間分析是用來理解和解釋地理現象及其相互關系的過程。以下是一些常用的ArcGIS空間分析方法:
    的頭像 發表于 02-25 11:36 ?2420次閱讀

    升壓芯片的封裝的類型 常用的升壓芯片哪些?

    升壓芯片的封裝的類型 常用的升壓芯片哪些?
    的頭像 發表于 01-24 17:10 ?1023次閱讀
    升壓芯片的封裝的類型 <b class='flag-5'>常用</b>的升壓芯片<b class='flag-5'>有</b>哪些?

    靜止無功補償與動態無功補償哪些區別

    靜止無功補償與動態無功補償哪些區別? 靜止無功補償和動態無功補償是電力系統中常用的無功補償技術,兩者在原理、應用和效果等方面有著明顯的區別。下面將詳細介紹靜止無功補償和動態無功補償的區別。 一
    的頭像 發表于 01-23 16:28 ?3627次閱讀
    主站蜘蛛池模板: 久久婷婷国产五月综合色啪最新| 欧美丰满熟妇无码XOXOXO| 国产成人精品免费青青草原app | 国产日韩欧美另类| 韩国黄电影| 久久草香蕉频线观| 美女pk精子2小游戏| 欧美亚洲精品午夜福利AV| 色中色论坛网站| 亚洲 日韩 欧美 国产专区| 夜里18款禁用的免费B站动漫| 中文无码第3页不卡av| TUBE8最新日本护士| 国产精品99久久久久久AV下载 | 97视频在线播放| 成人无码国产AV免费看直播| 国产乱码卡二卡三卡4W| 久久久久免费视频| 日本一本在线播放| 亚洲免费无码中文在线| 99国产在线观看| 国产精品人妻久久无码不卡| 久9视频这里只有精品123| 久久精品一卡二卡三卡四卡视频版 | 亚洲 欧美 国产 伦 综合| 伊人久综合| 成人免费视频在线看| 国产精品免费小视频| 久久re6热在线视频精品| 欧美精品做人一级爱免费| 婷婷激情综合色五月久久竹菊影视| 亚洲乱码国产一区三区| 97视频在线观看视频最新| 国产成人精品一区二区三区视频| 久草精品在线| 日本无码免费久久久精品| 亚洲精品久久久无码AV片软件| 在线 无码 中文 强 乱| 成年人视频在线免费看| 国产亚洲AV无码成人网站| 男人J桶进男人屁股过程|