色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

論辯挖掘在不同領域下的應用

深度學習自然語言處理 ? 來源:復旦DISC ? 作者:李寅子 ? 2022-03-30 16:15 ? 次閱讀

引言

論辯研究和推理是一個涉及到邏輯、語言、計算機等多學科領域的過程,在人工智能興起的時代,計算論辯試圖將人類對于論辯領域的知識和人工智能結合起來,用計算機深度模型來挖掘論辯語義、論辯結構等方面,達到自動推理的效果。論辯挖掘是計算論辯中的一個重要任務,它的主要任務有單篇式論辯挖掘,包括提論點分類、論點評估等;交互式論辯挖掘,包括論點對抽取等。此次的三篇論文將闡述論辯挖掘在司法領域、論辯領域、同行評議領域等的證據鏈支持、反駁證據評估、論點對抽取等方面應用。

文章概覽

1.Argumentation-Driven Evidence Association in Criminal Cases

刑事案件中的證據關聯是將一組司法證據劃分為若干不重疊的子集,提高定罪的可解釋性和合法性??梢杂^察到,分成同一子集的證據通常支持同一主張。在證據關聯步驟中,此篇文章提出了一種基于論證驅動(argumentation-driven)的監督學習方法來計算證據對之間的聯系。在實際數據集上的實驗結果證明了該方法的有效性。

2. Knowledge-Enhanced Evidence Retrieval for Counterargument Generation

找到對陳述的反證是許多任務的關鍵。此篇文章建立了一個系統,給出一個陳述,從Web上不同的來源檢索反證據。該系統的核心是一個自然語言推理(natural language inference, NLI)模型,它可以判斷一個候選句子是否為有效反證。作者提出了一個知識增強的NLI模型,旨在通過整合知識圖來處理基于因果關系和實例的推理。在實際數據集上的實驗結果證明了該方法的有效性。

3. Argument Pair Extraction with Mutual Guidance and Inter-sentence Relation Graph

此篇文章通過一個相互引導的框架來處理論點對抽?。ˋPE)任務,利用一個段落中一個論點的信息來指導識別另一個段落中可以與之配對的論點。此外,此篇文章還提出了一個句間關系圖來有效地模擬兩個句子之間的相互關系,從而有利于論點對的提取。實驗結果表明,我們的方法明顯優于目前SOTA的模型。

論文細節

1

31e12e0c-afe7-11ec-aa7f-dac502259ad0.png

動機

司法證據的作用是用來支持有利于定罪的訴訟請求,證據描述是刑事判決書的重要組成部分。然而,在不同的法律文件中,證據的組織是不同的。證據關聯的形式主要有收集式(collection)和論證驅動式(argumentation-driven)。

31fca178-afe7-11ec-aa7f-dac502259ad0.png

在目前大多數的刑事裁判文書中,證據只是以集合的形式羅列出來,沒有明確的主張,這被認為是集合的形式。但僅在5%左右的刑事判決文書中,依據相關主張將證據收集分為幾個子集,被認為是論證驅動的形式。

由此,此篇文章提出了一項刑事案件中的證據關聯任務,通過有監督的方法學習距離度量,無需額外的人工標注即可進行后續證據的聚類。

任務定義

給定證據集合,此篇文章將證據分為不重疊的個子集。

模型

(1)聚合方法

每一種情況下的聚類數量是不同的,所以不能像K-Means方法那樣設置一個特定的聚類數量。作者通過層次聚類來聚類證據(Day and Edelsbrunner, 1984),它可以學習停止閾值,該閾值決定何時停止合并兩個聚類。

(2)距離度量

本文提出了三種距離度量的概念,分別是Latent Distance、Explicit Distance和Ensemble Distance。

Latent Distance是證據之間的距離。在不給出明確主張的情況下,只能利用證據對的信息來計算它們之間的距離。支持同一主張的證據對之間的距離被標記為0,支持不同主張的證據對之間的距離被標記為1。

Explicit Distance是證據與主張之間的距離。證據和相應的主張之間有很強的相關性,例如,交通事故責任證明可以支持交通事故的責任劃分。證據與相應主張的相關性分值為1,證據與其他主張的相關性分值為0。

Latent Distance僅利用證據之間的語義信息來計算相似度。Explicit Distance僅利用證據與主張之間的推理關系來計算證據之間的距離。Ensemble Distance將這兩種方法融合在一起,同時利用證據之間的語義信息和證據與主張之間的推理信息,定義為這兩個距離的加權和。

數據集及實驗

作者以China Judgements Online中已發表的法律文件構建了一個數據集,選擇如下圖所示證據描述為論證驅動形式的法律文件進行實驗。

321a08f8-afe7-11ec-aa7f-dac502259ad0.png

作者主要采用ESIM和BERT進行有監督學習的距離預測,結果如下表所示。

32355220-afe7-11ec-aa7f-dac502259ad0.png

表中的結果顯示,有監督方法的性能較好。同時,BERT模型優于ESIM模型??赡艿脑蚴?,支持同一觀點的證據對有共現趨勢,這可以在BERT模型的下一個句子預測(next sentence prediction)任務中學習到。

Latent distance算法利用了證據對之間的語義信息,其性能優于explicit distance。基于ensemble distance的聚類結果由于整合了證據對之間和證據主張之間的關系,比單一距離的聚類結果有很大的提高。

3250a840-afe7-11ec-aa7f-dac502259ad0.png

如上圖所示,claim1和claim2分別代表受害人的出生日期和死亡日期。受害者的戶籍證明和死亡證明都能部分支持受害者的身份信息,但由于在使用Latent distance時只考慮證據對之間的關系,誤將它們聚在一起。Claim4和claim5是相似的,它們都是對交通事故現場的描述,但由于在使用explicit distance時幾乎沒有考慮證據對之間的語義關系,將被告人王某的供述和證人董某的證言誤聚在一起。從而將證據對之間的語義關系與證據主張之間的信息相結合,通過ensemble distance得到的聚類結果是正確的。

2

326bb46e-afe7-11ec-aa7f-dac502259ad0.png

動機

先前的研究大多集中于對長論點的主要結論提出反駁。雖然這樣的反駁是有用的,但辯論式的對話通常是互動的,例如,在Change-MyView (CMV)中,挑戰者經常引用特定的陳述來進行反駁。因此,本文的目標是為論點中的特定陳述找到反證,而不是為一個完整的論點生成一個反證。

任務定義

自然語言推理(natural language inference, NLI)模型是本文的核心,給定一個要反駁的陳述,系統對相關文檔進行檢索和排序,然后得到一組反證候選句。對于每個候選句,NLI模型決定它和陳述的關系是否包含、矛盾,或兩者都不是。

模型

在本篇文章中,作者提出了知識增強NLI模型(KENLI),如下圖所示。

3280ee42-afe7-11ec-aa7f-dac502259ad0.png

KENLI(圖左)是基于RoBERTa-base ,以一對前提P和假設H為輸入,計算其關系是蘊含、矛盾還是中性的概率。為了連接P和H之間的實體,知識增強(Knowledge Enhancement, KE)網被插入到某兩層之間,將RoBERTa分為Encoder1和Encoder2。最后的預測是基于【CLS】進行的。

KE Net(圖中)利用了知識圖譜(knowledge graph, KG),其中節點是實體,邊是實體之間的有向關系。KG目標是讓信息通過KG在P和H的實體之間流動。KE Net是由一堆KE單元組成,每個KE單元使用兩個transformer TR1和TR2處理KG上的單跳推理。TR1根據相鄰實體更新每個實體embedding,TR2根據實體embedding更新詞項embedding。本篇文章中使用了兩個知識圖譜CauseNet和Wikidata。

數據集及實驗

此篇文章的數據主要來自公開的NLI數據集:MNLI (Williams et al., 2018)、ANLI (Nie et al., 2020b)、SNLI (Bowman et al., 2015)和FEVER-NLI (Nie et al., 2019)。實驗的結果如下表所示,顯示了每個模型5次實驗的平均F1得分。

32a33cae-afe7-11ec-aa7f-dac502259ad0.png

表中可以看出KENLI(6-9行)基本上優于Baseline模型(1-5行)。這表明KENLI有效地整合了知識,有利于預測陳述之間的關系。

最后作者建立了反證檢索系統,是在DeSePtion (Hidey et al., 2020)的基礎上建立的。如下圖所示。

32c2ae22-afe7-11ec-aa7f-dac502259ad0.png

給定一個要驗證的陳述語句,檢索相關文檔并對其進行排序,對候選證據句進行排序,并預測該語句是被支持、被反駁還是都不支持。作者通過提出的知識增強NLI模型來強化了最后一個階段。

3

32ddfc18-afe7-11ec-aa7f-dac502259ad0.png

動機

論點對抽取(Argument pair extraction, APE)的目的是從討論的兩段中抽取出交互式的論證對。

32f88ede-afe7-11ec-aa7f-dac502259ad0.png

以往的研究將該任務應用在同行評議中,但是缺乏論點對之間的論點級別交互的顯式建模。此篇文章通過一個相互引導的框架來處理APE任務,利用一個段落中一個論點的信息來指導識別另一個段落中可以與之配對的論點。此外,此篇文章還提出了一個句間關系圖來有效地模擬兩個句子之間的相互關系,從而有利于論點對的提取。實驗結果表明,我們的方法明顯優于目前SOTA的模型。

模型

此篇文章提出了一個具有句間關系圖的APE相互引導框架MGF,如下圖所示。

3325aaa4-afe7-11ec-aa7f-dac502259ad0.png

(1)Inter-sentence Relation Graph

該圖將review和rebuttal中的每一個句子作為節點,從兩個角度進行構建。

In-passage Edge:根據句子(同一個段落中)在review/rebuttal段落中的相對位置,構建句子之間的邊。兩個in-passage句子之間邊的權重的定義為:

Cross-passage Edge:基于兩句之間的共現詞,構建跨段落的句子邊緣。兩個in-passage句子之間邊的權重的定義為:

(2)Mutual Guidance Framework

相互引導框架(mutual Guided Framework, MGF)首先使用BERT對句子進行編碼,然后通過圖卷積得到面向關系的句子表示法后,使用兩個相互引導的標記器提取論點對。

數據集及實驗

此篇文章使用Cheng等人(2020)提出的Review-Rebuttal (RR)數據集進行實驗,該數據集包含從openreview.net收集的4,764篇ICLR的review/rebuttal文本對。Baseline是Cheng等人(2020)提出的PL-H-LSTM-CRF和MT-H-LSTM-CRF 。實驗的結果如下表。

334e342e-afe7-11ec-aa7f-dac502259ad0.png

從表中可以看出,作者提出的模型MGF在數據集上取得了最好的性能。在不使用BERT微調的情況下,Non-FT-MGF的性能仍然優于MT-H-LSTM-CRF,這表明MDF實現的性能增益不僅僅是由于BERT微調。通過對MGF和Non-FT-MGF的比較,可以發現BERT微調可以進一步改善模型結果。

參考文獻

[1] Yefei Teng and WenHan Chao. 2021.Argumentation-Driven Evidence Association in Criminal Cases. InFindings of the Association for Computational Linguistics: EMNLP 2021, pages 2997–3001, Punta Cana, Dominican Republic. Association for Computational Linguistics.

[2] Yohan Jo, Haneul Yoo, JinYeong Bak, Alice Oh, Chris Reed, and Eduard Hovy. 2021.Knowledge-Enhanced Evidence Retrieval for Counterargument Generation. InFindings of the Association for Computational Linguistics: EMNLP 2021, pages 3074–3094, Punta Cana, Dominican Republic. Association for Computational Linguistics.

[3] Jianzhu Bao, Bin Liang, Jingyi Sun, Yice Zhang, Min Yang, and Ruifeng Xu. 2021.Argument Pair Extraction with Mutual Guidance and Inter-sentence Relation Graph. InProceedings of the 2021 Conference on Empirical Methods in Natural Language Processing, pages 3923–3934, Online and Punta Cana, Dominican Republic. Association for Computational Linguistics.

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1794

    文章

    47622

    瀏覽量

    239584
  • 模型
    +關注

    關注

    1

    文章

    3296

    瀏覽量

    49042
  • 數據集
    +關注

    關注

    4

    文章

    1209

    瀏覽量

    24789

原文標題:EMNLP 2021 | 論辯挖掘在不同領域下的應用

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    AI主導科技領域的蓬勃發展與變革

    24 位行業領袖的深度訪談,為我們揭示了 2025 年極具影響力的科技趨勢,展現出 AI 主導科技領域的蓬勃發展與變革。 一、AI 驅動的科技變革核心地位 AI 和生成式 AI 是貫穿報告中諸多科技趨勢的核心驅動力。從企業運營到科技創新,從能源
    的頭像 發表于 01-23 13:58 ?123次閱讀

    risc-v芯片在電機領域的應用展望

    RISC-V作為一種開源的指令集架構,近年來芯片設計領域嶄露頭角,并逐漸電機控制領域展現出其獨特優勢。隨著電機技術的不斷進步和應用需求的多樣化,RISC-V芯片有望為電機控制帶來更
    發表于 12-28 17:20

    精準定位隧道挖掘通訊難題:虹科PCAN卡如何滿足專業通訊需求?

    現代隧道挖掘行業中,電控系統作為設備的“大腦”,其性能優劣直接關系到設備的整體運作效率與安全性。本文將深入探討虹科PCAN卡在隧道挖掘機器電控系統中的應用,了解它是如何提升設備性能,確保工程
    的頭像 發表于 11-14 01:01 ?219次閱讀
    精準定位隧道<b class='flag-5'>挖掘</b>通訊難題:虹科PCAN卡如何滿足專業通訊需求?

    RISC-VAI領域的發展前景怎么樣?

    隨著人工智能的不斷發展,現在的視覺機器人,無人駕駛等智能產品的不斷更新迭代,發現ARM占用很大的市場份額,推出的ARM Cortex M85性能也是杠杠的,不知道RISC-VAI領域有哪些參考方案?
    發表于 10-25 19:13

    FPGA圖像處理領域的優勢有哪些?

    FPGA(Field Programmable Gate Array,現場可編程門陣列)圖像處理領域具有顯著的優勢,這些優勢主要體現在以下幾個方面: 一、高并行處理能力 FPGA內部擁有大量的邏輯
    發表于 10-09 14:36

    電感式傳感器工程機械之挖掘機上的應用

    蘭寶傳感的電感式傳感器挖掘機上的應用提高了作業的自動化和智能化水平,增強了設備的可靠性和安全性,是現代工程機械設備中不可或缺的重要組成部分。隨著技術的不斷進步,電感式傳感器的應用范圍將進一步擴大,為工程建設帶來更多的便利和效率。
    的頭像 發表于 09-14 09:20 ?394次閱讀

    中科曙光受邀參加第十屆中國數據挖掘會議

    近日,國內數據挖掘領域最主要的學術活動之一—第十屆中國數據挖掘會議(CCDM2024)于山東泰安舉行,中科曙光參與并分享了曙光AI構建產學研用的生態實踐。
    的頭像 發表于 08-01 10:43 ?618次閱讀

    FPGA自動駕駛領域有哪些應用?

    FPGA(Field-Programmable Gate Array,現場可編程門陣列)自動駕駛領域具有廣泛的應用,其高性能、可配置性、低功耗和低延遲等特點為自動駕駛的實現提供了強有力的支持。以下
    發表于 07-29 17:09

    論述RISC-CIOT領域的發展機會

    RISC-VIoT(物聯網)領域的發展機會可以歸納為以下幾點: 高度開源與可擴展性: RISC-V作為一個開源且免費的指令集架構(ISA),為IoT設備提供了極高的靈活性和可擴展性。企業可以根據
    發表于 06-27 08:43

    標貝語音識別技術金融領域中的應用實例

    隨著語音識別技術與文本挖掘、自然語言處理等技術的不斷融合,智能語音交互技術金融領域中爆發了出巨大的應用潛力。標貝科技根據自身與金融領域合作的經驗為大家梳理出以下幾點智能語音識別技術
    的頭像 發表于 05-16 16:55 ?666次閱讀
    標貝語音識別技術<b class='flag-5'>在</b>金融<b class='flag-5'>領域</b>中的應用實例

    牽引機和挖掘機裝配流水線自動互鎖防呆系統無線通訊應用

    挖掘機裝配工序中,液壓系統檢測、調試是其生產工藝中的重要環節。液壓檢測過程中需要操作鏟斗、斗桿、動臂動作,這一過程中流水線挖掘機因帶動偏移易發生安全事故及機械損傷故障等情況,需要采用牽引機鏈條牽引
    的頭像 發表于 02-26 08:52 ?394次閱讀
    牽引機和<b class='flag-5'>挖掘</b>機裝配流水線自動互鎖防呆系統無線通訊應用

    挖掘機生產裝配線無線通訊應用

    一、應用背景 山東某挖掘機機械有限公司主要產品有裝載機、挖掘機、道路機械及核心關鍵零部件等系列工程機械產品。為加速新舊動能轉換,全新挖掘機整機裝配線配合勞動組合的調整,提高裝配水平和生產效率;可集中
    的頭像 發表于 02-22 09:44 ?427次閱讀
    <b class='flag-5'>挖掘</b>機生產裝配線無線通訊應用

    iBeLink KS MAX 10.5T大算力領跑KAS新領域

    Kaspa是一種基于DAG(有向無環圖)技術的加的密的貨的幣,它擁有高速、安全、可擴展的特點,是未來區的塊的鏈領域的新星。為了挖掘Kaspa,我們需要一款專門的挖掘機,能夠適應Kaspa的特殊算法
    發表于 02-20 16:11

    數據挖掘的應用領域,并舉例說明

    揭示數據中隱藏的規律、關聯和趨勢,支持決策和預測。 數據挖掘廣泛應用于各個領域,涉及金融、電子商務、醫療健康、交通運輸、社交網絡、市場營銷、能源資源、航空航天、環境保護、國防安全等等。下面將詳細介紹數據挖掘
    的頭像 發表于 02-03 14:19 ?3242次閱讀

    GNSS模塊不同的領域運用范圍

    全球導航衛星系統(GNSS)模塊各個領域都有廣泛的應用,其高精度的定位和導航能力使其成為多種行業的關鍵技術。以下是GNSS模塊不同領域的運用范圍: 交通與汽車行業: GNSS模塊
    的頭像 發表于 02-01 14:11 ?957次閱讀
    主站蜘蛛池模板: 亚洲高清视频网站| 女人被躁到高潮嗷嗷叫69| 国产一区二区三区影院| 国产九九九九九九九A片| 精品午夜寂寞影院在线观看| 日本久久久WWW成人免费毛片丨| 精品久久免费视频| 日本夜夜夜| avtt天堂网2014| 久久9精品区-无套内射无码| 日本无码人妻丰满熟妇5G影院| 亚洲视频在线观看地址| xxnx日本| 酒色.com| 亚洲绝美精品一区二区| 粉嫩AV国产一区二区福利姬| 男男高h浪荡受h| 一本之道高清视频在线观看| 俄罗斯另类Z0Z0ZOZO| 美女的隐私蜜桃传媒免费看| 亚洲精品久久久WWW游戏好玩| 大乳牛奶女在线观看| 久久66热在线视频精品| 亚洲国产cao| 黑人巨大交牲老太| 亚洲欧美中文字幕5发布| 狠狠久久免费视频在线| 婷婷四房播客五月天| 高清国产一区| 色欲AV亚洲永久无码精品麻豆| lesbabes性欧美| 人妻天天爽夜夜爽三区麻豆A片| 99久久久无码国产精品免费人妻| 巨大乳hdbbw| 中文字幕1| 欧美另类一区| 国产超碰AV人人做人人爽| 小莹的性荡生活| 久久精品免费看网站| 97在线视频免费| 四虎国产精品高清在线观看|