色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

從不同方面圍繞立場檢測領域進行研究

深度學習自然語言處理 ? 來源:復旦DISC ? 2020-08-27 17:52 ? 次閱讀

引言

從自然語言文本中自動提取語義信息是許多實際應用領域中的重要研究問題。尤其是在最近通過社交媒體網站,新聞門戶網站和論壇等渠道在線發布內容之后;大量相關的科學出版物揭示了諸如情感分析,嘲諷/爭議/真實性/謠言/假新聞檢測以及論據挖掘等問題的解決方案的影響和意義越來越大。

立場檢測作為情感分類任務中的一個子任務,在上述領域中都起著舉足輕重的作用,并且在不同的場景設置中任務的定義方式也不同,其中最常見的定義是將文本生產者的立場朝著目標自動分類為以下三個類別之一:{支持,反對,中立}。

本次DISC小編分享的三篇ACL2020論文將從不同方面圍繞立場檢測領域進行研究,包括新任務、新數據集、以及加入外部知識的新模型等。

文章概覽

網絡論辯中的一致性預測——立場極性與強度檢測(Agreement Prediction of Arguments in Cyber Argumentation for Detecting Stance Polarity and Intensity)

論文地址:https://www.aclweb.org/anthology/2020.acl-main.509.pdf

在在線辯論中,用戶對彼此的論點和想法表達不同程度的同意/反對。通常,同意/反對的語義隱含在文本中,必須經過預測才能分析集體意見。現有的立場檢測方法可以預測帖子對主題或帖子的立場的極性,但不考慮該立場的強度。我們在判斷兩段對話的關系中引入了一個新的研究問題,即立場極性和強度預測。這個問題具有挑戰性,因為立場強度上的差異通常很細微,需要細致的語言理解。在網絡辯論數據中心的研究表明,將立場極性和強度數據都納入在線辯論中可以帶來更好的討論分析。

走出“回聲室”:檢測反對辯論發言(Out of the Echo Chamber: Detecting Countering Debate Speeches)

論文地址:https://www.aclweb.org/anthology/2020.acl-main.633.pdf

隨著從傳統新聞媒體向社交媒體和類似場所的轉變,讀者更傾向于被困在“回音室”中,并且可能成為假新聞和虛假信息的犧牲品,缺乏容易獲得不同意見的渠道。因此,作者提出了檢測反對立場發言的任務,具體來說,是給定一段辯論文本(長文本),從當前的大語料庫中找到與其意見相反的辯論文本(長文本)。操作層面上,作者在文中遵循論辯領域的規范標準構建了3685篇辯論長文本作為該任務的數據集,并進行了人工以及機器模型的實驗,結果顯示該任務設置合理且極具挑戰性。

使用可遷移的語義-情感知識增強跨領域立場檢測(Enhancing Cross-target Stance Detection with Transferable Semantic-Emotion Knowledge)

論文地址:https://www.aclweb.org/anthology/2020.acl-main.291.pdf

當有足夠的帶標簽的訓練數據可用時,立場檢測任務中人們已經取得了巨大的成功。但是,注釋足夠的數據會占用大量人力,這為將立場分類器推廣到具有新目標的數據建立了很大的障礙。在本文中,作者提出了一種用于跨目標立場檢測的語義-情感知識轉移(SEKT)模型,該模型使用外部知識(語義和情感詞典)作為橋梁來實現跨不同目標的知識轉移。在大型現實數據集上進行的大量實驗結果證明,SEKT模型相對于最新的基線方法具有優越性。

數據概覽

對于立場檢測任務,不同的應用場景中的任務設置會存在一定的差異,例如在最傳統的設置中,立場檢測被定義為給定兩段文本,我們需要判斷出兩段文本之間的支持/反對關系;在另一些場景中可能定義為給定文本和某一主題,判斷它們之間的語義關系等等,上述提到的三篇論文所使用到的數據集分別如下所示:

ICAS: 上述第一篇文章中所構建的新數據集。數據來源自作者所搭建的智能網絡論辯系統(intelligent cyber argumentation system, ICAS)中2017年秋季至2019年春季所積累的數據,數據結構包含用戶回復時輸入文本以及他們對于自己所產生的回復的立場極性/強度的打分。

IBM Debater - Recorded Debating Dataset - Release #5: 第二篇論文中所構建的新數據集,作者采用(Mirkin et. al., 2018)所提出的辯論文本生成規范,通過聘請專業辯論人員進行給定主題、立場的口頭陳述,再通過語音轉文本技術生成對應的辯論文本,最終得到了3684條辯論長文本。

SemEval-2016 Task 6: 第三篇論文中所使用的數據集,來自于SemEval2016年的第六個任務,共包含在4個話題上的4870條推特文本,每條推特文本都包含在一個話題上的立場標簽。

論文


1

動機

強度是立場關系的重要方面,這一維度的信息可以幫助我們對于用戶之間的回復進行更為深入的分析;

先前的立場檢測方法大多僅判斷立場的極性(同意/不同意/中立),但極少數考慮立場的強度(強,弱等)。

在研究立場強度的前人工作中,對于立場強度判別建模為更細粒度的分類問題(如:強烈同意/同意/中立/反對/強烈反對)并進行更為詳細的標注,但發現這樣的分類數據在使得模型在原來的三分類問題的任務中出現了明顯的性能下降。

創新點

從上述動機出發,作者提出了給論點編碼的新方式:一致值編碼。

一致值編碼(取值范圍為[-1.0,+1.0])由兩個因子構成:

符號(+/-/0),分別對應立場極性(支持/反對/中立)

振幅(取值范圍[0,1.0]),對應上文中所提到的立場強度(0代表無強度/中立;1.0代表完全支持/完全反對)

立場的一致值=符號*振幅

數據集

作者搭建了智能網絡論辯系統(intelligent cyber argumentation system, ICAS),并邀請研究生在該平臺上進行論辯互動,并為自己的回復進行一致值的標注(一致值的標注以0.2為最小間隔),如下圖所示:

作者收集了從2017年秋季至2019年春季所記錄的所有文本、一致值標注的數據,共計從904位用戶中得到了22606條論點數據。

模型

作者應用了SemEval 2016 Twitter 立場檢測任務中表現最好的五個模型,進行了相應改動(注:由于原本的立場檢測任務為分類任務,而上文提到的強度判別為回歸任務,故在本任務中需要將這些模型最后的分類層進行改為輸出[-1.0,+1.0]的實值)應用到了上文所描述的新數據集中,模型分別如下所示:

Ridge-M以及Ridge-S

這兩個回歸模型基于1-3gram的詞特征、2-5gram的字符特征等文本特征表示(Ridge-S模型還加入了詞嵌入特征),并將其輸入SVM模型從而得到在立場上的分類標簽(在此任務中SVM被替換成了Ridge回歸模型)。

SVR-RF-R整合模型

該模型利用語言特征、主題特征、詞嵌入特征以及一些詞法特征(共2855維),并將其輸入至一個SVM分類器、一個隨機森林分類器、一個樸素貝葉斯模型進行多數投票從而得到最后的分類結果(在此任務中三個模型被替換為SVR、隨機森林回歸器以及Ridge回歸模型)。

pkudblab-PIP

該模型如下圖所示,是一個卷積神經網絡模型,通過將輸入句子的詞向量依次送入2D卷積層、最大池化層、全連接稠密層從而得到最終的標簽分類(該任務中輸出層替換為sigmoid層,從而輸出實值一致值)。

T-PAN-PIP

該模型如下圖所示,是一個基于遞歸神經網絡的模型。該模型通過將輸入句子的詞向量依次送入BiLSTM以及注意力層,從而得到最終的標簽分類(該任務中輸出替換為sigmoid層,從而輸出實值一致值)。

實驗

該論文的實驗主要從兩方面進行:

上述五個在立場極性檢測中表現最好的模型在新任務新數據集上的表現:

如圖所示,五個模型在新數據集上的RMSE(均方誤差根)分布在0.596~0.718之間,作者稱這個表現與原任務上的效果接近。其中SVR-RF-R整合模型的RMSE指標最低,取得了最好的效果。

所提出的新任務是否提升了模型在原任務上的表現:

注意到當前新任務的標簽以及預測都是一個取值范圍為[-1.0,+1.0]的實數值,為了與傳統的立場極性檢測作比較,作者將新任務的一致值標簽以及預測都取其符號,于是新任務又被轉化成了分類問題。最終,作者將僅預測極性任務的模型性能與上述預測一致值的模型在極性標簽上的性能做對比(如下圖所示),發現了大多數模型(4個)在經過了一致值預測任務的訓練后,在立場極性的判斷上都比原分類任務的模型表現更好,從而得出了新任務單就立場極性的判斷上也能提升模型的性能,是一個合理的任務。

2

動機

缺乏對特定觀點提出異議的相反觀點的了解,可能導致我們的決策最終基于片面或者存在偏見的信息。

具體操作上,該任務定義為:給定輸入文本和語料庫,請從該語料庫中檢索一個包含與輸入文本中提出的論點相駁斥的反文本。

數據集

數據集構建

本篇文章作者采用(Mirkin et. al., 2018)所提出的辯論文本生成規范,通過聘請專業辯論人員進行給定主題、立場的口頭陳述,再通過語音轉文本技術生成對應的辯論文本,具體的數據集生成過程如下:

錄制支持論題的演講

專業辯手給定一系列論題(motion)以及相關的背景資料(從Wikipedia等在線資源網站上獲得)

每位辯手每次被給予十分鐘的準備時間

準備時間結束后每位辯手每次錄制一段長度為四分鐘的的辯論演講(用于支持給定論題)

將上述得到的演講錄音通過語音轉文字技術轉換為文本

錄制反對論題的演講

專業辯手給定一系列論題(motion)、一篇由上述過程生成的支持論題的演講稿以及相關的背景資料(從Wikipedia等在線資源網站上獲得)

每位辯手每次被給予十分鐘的準備時間

準備時間結束后每位辯手每次錄制一段長度為四分鐘的的辯論演講(用于反對給定的支持演講稿)

將上述得到的演講錄音通過語音轉文字技術轉換為文本

上述過程中所涉及的論題、論點之間的關系如下圖所示(其中、為兩個不同的論題,表示支持論題的演講,表示反對這些支持演講的演講,實線和虛線分別表示顯式反對與隱式反對):

數據集分析

共包含460個不同論題

總共錄制了1797段支持論題的演講

總共錄制了1887段反對這些支持演講的演講

348篇為顯式反駁

1389篇為隱式反駁

150篇為直接反對給定議題的演講,并不駁斥任何一篇支持議題的演講

實驗

人工表現

在收集到上述數據集之后,作者先進行了人工表現的實驗。作者共組織了兩場實驗,第一場參與者為進行過多次數據標注任務的標注專家,第二場參與者為隨機招募的實驗者。

對于每一段支持論題的演講,組織方都會給出3~5段反對演講,其中有一段是正確的駁斥所給定的支持言論,剩余則為同一論題下與支持言論不構成駁斥關系的錯誤選項,受試者需要從給定的候選文本給出自己認為的正確答案,當無法確定時,需要他們隨機猜一個答案并說明情況。人工實驗的結果如下表所示(A表示人工試驗的準確率,R表示隨機猜的準確率;Ex表示標注專家的結果,Cr表示隨機招募的受試者的結果):

由上表我們可以得出如下幾個結論:

人工表現遠超隨機猜測的準確率,說明這個任務是可行的;

標注專家結果比受試者有明顯提升;

隱式駁斥的文本相比顯示駁斥文本更難選擇正確。

模型表現

在進行完人工實驗之后,作者采用了較多的語言模型來進行自動化實驗,實驗結果如下表所示:

其中值得一提的是BERT的表現差強人意,在眾多基于特征的方法中處于下游,甚至與隨機猜的準確率相近,這是因為根據之前的方式所生成的數據集長度遠超BERT的最大長度512,因此作者不得不對原文以及候選項都進行截斷,但仍然未能得到使人滿意的結果,這也從另一方面體現出當前對于長文本的處理方法仍存在較大的局限性。

3

動機&貢獻

當前階段盡管立場檢測任務已經有了長足發展,但跨領域的的目標立場檢測(指訓練集和數據集在領域上存在差異)進展較小。

本文從語義相關和情感相關的詞匯表中構建語義情感知識圖(SE圖),并通過應用圖卷積網絡(GCN)對上述的情感知識圖進行表示學習,并將傳統的BiLSTM進行了改進,使其可以更好地使用上述SE圖所帶來的外部知識。

實驗結果顯示,通過上述方式的處理,模型在跨領域的目標立場檢測任務上取得了SOTA的表現。

數據集

本篇文章所采用的數據集來自于SemEval2016年的第六個任務,共包含在4個話題,包括Donald Trump (DT), Hillary Clinton (HC), Legalization of Abortion (LA), 和Feminist Movement (FM)上的4870條推特文本,每條推特文本都包含在一個話題上的立場標簽。作者還向其中加入了一個新的話題,Trade Policy (TP),其包含了1245條推特文本。之后作者將這五個話題按照其語義分為了兩組:婦女權利(FM, LA)以及美國政治(DT,HC,TP)。由此,作者構造出了八組跨領域的目標立場檢測任務 ( DT→HC, HC→DT, FM→LA, LA→FM, TP→HC, HC→TP, TP→DT, DT→TP)。(左箭頭表示從源領域到目標領域)

模型

作者所提出的模型SEKT整體架構如下圖所示,其主要由兩部分構成:SE圖以及知識增強的BiLSTM:

語義-情感知識圖(SE圖)構建

將SenticNet中的同義/近義詞兩兩之間連邊

將EmoLex中每個詞及其對應的可能的情感兩兩連邊

上述過程如下圖所示,注意這里我們構建的是包含詞和情感標簽的異質網絡圖:

語義-情感知識圖表示

對于每個節點,我們從全知識圖中抽出一個的子圖(文中k取1)

接下來把傳到一個兩層GCN中

最后我們將傳入一個全連接層來得到圖的最終表示

知識增強的BiLSTM

該模塊結構如下圖所示:

上圖中左邊藍色部分為普通BiLSTM的結構組件,按如下公式更新狀態:

該模塊中右半部分為知識知曉的記憶模塊,按如下方式更新狀態:

對于每一個詞,我們從SE圖中抽取出其對應的實體,并且獲得以其為中心的子圖表示。

最終,將所得到的目標表示以及句子表示再通過一個注意力層,便可得到句子在目標上的立場分類預測結果。

實驗

與基線模型相比

作者所提出的完整模型在SemEval 2016 任務6數據集上的表現如下圖所示:

可以看出作者的SEKT模型在8個跨領域的目標立場檢測任務中的表現都超過了大多數基線模型,達到了SOTA的效果,說明作者這種通過加入語義詞典與情感詞典的外部知識模型,完成了領域遷移中對于關鍵詞的表示以及關系建模。

消融實驗

在驗證了完整模型的SOTA性能后,作者進一步進行了消融實驗,在上述8個任務中去掉SE圖建模以及將拓展的BiLSTM替換為傳統LSTM,分別進行性能對照,結果如下圖所示:

可以看出在大多數跨領域的目標立場檢測中,去掉SE圖表示或去掉對于BiLSTM的改進,都會使得模型性能下降0.02左右的指標,從而證明了這兩部分的重要性。(注:作者此處的消融實驗不僅僅是去掉了SE兩個詞典中的信息以及圖表示學習的信息,而是保留這些信息,但在模型層面去掉上述較為復雜的操作,因此在不影響輸入的信息量的情況下,但就模型設計方面證明了所提模型的優越性)。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 檢測
    +關注

    關注

    5

    文章

    4480

    瀏覽量

    91443
  • 數據集
    +關注

    關注

    4

    文章

    1208

    瀏覽量

    24689
  • 自然語言
    +關注

    關注

    1

    文章

    287

    瀏覽量

    13346

原文標題:【論文分享】ACL 2020 立場檢測相關研究

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    高校開展RK3588課題研究 只能人工標注練算法?

    進行研究開發,是一個不錯的選擇。這個過程中如何讓算法更加精準的識別檢測目標成為首要解決的問題。要想讓AI算法更能精確的識別檢測目標,可以利用AI的深度學習能力,讓
    的頭像 發表于 10-23 08:07 ?228次閱讀
    高校開展RK3588課題<b class='flag-5'>研究</b>    只能人工標注練算法?

    環境檢測艙:技術優勢引領檢測檢驗領域革新

    。這些檢測艙不僅具備高精度、多功能性、智能化等特點,還在安全性、靈活性和持續創新方面展現出顯著優勢,為多個行業提供了可靠的環境監測解決方案。本文將深入探討廣州澳企環境檢測艙的技術優勢,揭示其在
    的頭像 發表于 09-30 14:22 ?187次閱讀

    如何進行IP檢測

    如何避免網絡出現故障,增強網絡安全性?又如何更加合理的規劃分配網絡資源?這就不得的提到我們需要定期給自家或企業中的IP進行檢測了。IP 地址就像是網絡世界中設備的“身份證號碼”,定時進行檢測,能夠
    的頭像 發表于 07-26 14:09 ?535次閱讀
    如何<b class='flag-5'>進行</b>IP<b class='flag-5'>檢測</b>

    電壓放大器在鋼筋剝離損傷識別試驗中的應用

    實驗名稱:鋼筋剝離損傷識別試驗研究方向:無損檢測測試目的:采用壓電導波檢測技術針對鋼筋混凝土結構中鋼筋的腐蝕問題進行研究,提出一種基于壓電超聲導波利用連續小波變換技術的鋼筋腐蝕
    的頭像 發表于 07-24 17:39 ?390次閱讀
    電壓放大器在鋼筋剝離損傷識別試驗中的應用

    目標檢測識別主要應用于哪些方面

    目標檢測識別是計算機視覺領域的一個重要研究方向,它主要關注于從圖像或視頻中識別和定位目標物體。隨著計算機視覺技術的不斷發展,目標檢測識別已經廣泛應用于各個
    的頭像 發表于 07-17 09:34 ?1040次閱讀

    新型材料在生物檢測方面的應用和前景

    隨著醫學科學的發展,對于生物分子、病原體、細胞等生物檢測的需求越來越高。生物檢測技術可以用于診斷、治療、監測、預防等各個領域。然而,傳統的生物檢測方法往往存在靈敏度低、穩定性差、操作復
    的頭像 發表于 07-14 09:34 ?2949次閱讀
    新型材料在生物<b class='flag-5'>檢測</b><b class='flag-5'>方面</b>的應用和前景

    人臉檢測模型的精確度怎么算

    人臉檢測模型的精確度評估是一個復雜的過程,涉及到多個方面的因素。本文將從以下幾個方面進行介紹:人臉檢測模型的基本概念、評估指標、評估方法、影
    的頭像 發表于 07-04 09:14 ?498次閱讀

    微波檢測的應用方面 微波檢測的特點

    一、引言 微波檢測技術是一種利用微波信號對物體進行檢測的技術。它具有高分辨率、高靈敏度、非接觸式檢測等特點,廣泛應用于各個領域。本文將詳細介紹微波
    的頭像 發表于 05-28 15:26 ?1002次閱讀

    無損檢測技術的基本概念、原理、方法和應用領域

    一、無損檢測技術概述 無損檢測技術是一種在不破壞被檢測物體的情況下,對其進行內部結構、缺陷、性質等進行檢測的技術。這種技術具有
    的頭像 發表于 05-24 15:08 ?4872次閱讀

    軟通計算(同方計算機)入圍中標興業銀行信創辦公終端采購項目

    的影響力,軟通計算(同方計算機)信創自主安全終端產品在金融應用領域實現重要突破,彰顯了在軟通計算(同方計算機)信創終端領域的領先實力。
    的頭像 發表于 05-21 09:45 ?679次閱讀

    示波器噪聲的信號處理技術研究

    處理技術進行研究,對于提高示波器的測量性能具有重要意義。本文將對示波器噪聲的來源、特點以及常用的信號處理技術進行詳細的分析和探討。
    的頭像 發表于 05-17 17:17 ?553次閱讀

    大基金二期出手!入股EDA企業九同方

    近日,國家集成電路產業投資基金二期股份有限公司(以下簡稱“大基金二期”)入股湖北九同方微電子有限公司(以下簡稱“九同方”),這一消息在業界引起了廣泛關注。
    的頭像 發表于 04-17 11:21 ?1093次閱讀

    電壓放大器在合成射流高效摻混機理研究中的應用

    進行研究。   研究方向:合成射流高效摻混機理   測試設備:信號發生器,ATA-214高壓放大器,合成射流激勵器,高速相機,雙脈沖激光器等   實驗過程:信號發生器產生正弦電壓信號,經過
    發表于 03-08 17:47

    寬帶放大器在陣列渦流檢測技術研究中的應用

      實驗名稱:陣列渦流檢測技術研究   實驗原理:渦流檢測基于在電磁感應原理,僅適合用于導電材料的檢測。其檢測原理是:載有交變電流的
    發表于 02-28 16:04

    從不同應用,劃片機主要包括如下幾個方面

    在半導體行業中,劃片機被廣泛應用于各種材料和應用的切割和加工。根據不同的應用,劃片機主要可以分為以下幾個方面:一、半導體材料劃片半導體材料劃片是劃片機最早的應用領域之一。在這個領域中,劃片機主
    的頭像 發表于 01-03 15:35 ?796次閱讀
    <b class='flag-5'>從不</b>同應用,劃片機主要包括如下幾個<b class='flag-5'>方面</b>
    主站蜘蛛池模板: 成人在线免费视频观看| yellow视频免费观看高清在线| 最新国产精品福利2020| 国产免费人成在线视频有码| 日本久久久久久久做爰片日本| 88福利视频| 久久精品一本到东京热| 亚洲第一区欧美日韩精品| 国产AV午夜精品一区二区入口| 青青青国产依人精品视频| 中国jjzz| 久久嫩草影院网站| 野花韩国免费高清电影| 含羞草免费完整视频在线观看| 午夜精品久久久内射近拍高清| 国产1广场舞丰满老女偷| 日韩视频中文在线一区| 蜜桃臀无码内射一区二区三区| 亚洲精品白色在线发布| 国产无遮挡色视频免费观看性色| 十八禁肉动漫无修在线播放| 短篇合集纯肉高H深陷骚| 日本一卡二卡三卡四卡无卡免费播放 | 亚洲人成电影网站在线观看| 国产色精品VR一区二区| 校园刺激全黄H全肉细节文| 国产精品系列在线一区| 私人玩物在线观看| 国产成人免费高清激情视频| 天美传媒果冻传媒入口视频| 国产成人拍精品视频网| 午夜成a人片在线观看| 国产人妻人伦精品熟女麻豆| 亚洲成a人片777777久久| 国自精品三七区| 艳鉧动漫1~6全集观看在线| 久久免费精品一区二区| 中文字幕 日韩 无码 在线| 美女被强奷到抽搐的动态图| 98色精品视频在线| 彭丹吃奶门|