色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

了解信息抽取必須要知道關系抽取

深度學習自然語言處理 ? 來源:CSDN ? 作者:CSDN ? 2021-04-15 14:32 ? 次閱讀

本文主要詳細解讀關系抽取SOTA論文Two are Better than One:Joint Entity and Relation Extraction with Table-Sequence Encoders[1], 順帶簡要介紹關系抽取的背景,方便完全不了解童鞋。

信息抽取

我們說的信息抽取一般是指從文本數據中抽取特定數據結構信息的一種手段。對于不同結構形式的數據如結構化文本,半結構化文本,自由文本,有各自對應的方案,其中從自由文本中抽取難度最大。總之,我們的目的是希望在海量文本中,快速抽出我們關注的事實。

了解信息抽取必須要知道關系抽取。

關系抽取

大部分情況下,我們喜歡用三元組的數據結構來描述抽取到的信息

三元組

三元組的表達能力非常豐富,幾乎所有事情都可以自然或者強行的表達成三元組,比如隨便一句”今天天氣真冷“ 表達為天氣-狀態-冷。

三元組與后續的知識圖譜工作非常適配,如Neo4j等圖數據庫就是以三元組為存儲單位,圖譜的查詢推斷等工具使用三元組比普通的關系型數據庫來的方便的多。

三元組千千萬,我應該怎么抽?

Schema

當我們拿到一個信息抽取的任務,需要明確我們抽取的是什么,”今天天氣真冷“,我們要抽的天氣的狀態天氣-狀態-冷,而非今天-氣候-冷(雖然也可以這樣抽),因此一般會首先定義好我們要抽取的數據結構模式shcema, 會確定謂詞以及主語并與的類型

一個三元組schema的例子,其中Subject_type代表主語類型,Predicate是謂詞,Object_type指賓語類型:

Subject_type:人物 Predicate:出生地 Object_type:地點

確定了schema,我們一般如何抽取呢?

常規RE方案

目前主流關系抽取一般兩種解決方法

pipline兩步走:將關系抽取分解為NER任務和分類任務,NER任務標注主語或賓語,分類主要針對定義的schema中的有限個謂詞進行分類。根據具體任務不同,有些可能是兩步走或者三步走,pipline任務的順序先分類還是先標注也會有差異

Pipline優勢:每一步分別針對各個任務進行,表征是task-specific, 相對來說精度較高

Pipline缺陷:- 任務有順序會存在誤差傳遞問題,即在預測時下一步任務會受上一步誤差影響,而在訓練階段沒有這種誤差,因此存在訓練和預測階段的gap- 分開的任務在一句話中多個實體關系時,比較難解決實體和關系的對應問題,以及重疊關系

joint learning:joint learing可以理解為采用多任務的方式,同時進行NER和關系分類任務, 在眾多joint learning中最出眾的是采用tabel filled 方式,即任務的輸出是filled一張有text-sequence構成的表,在表中的位置表達除了詞與詞的連接,該位置的標注則標出了謂語(如下圖)

a82e50a8-9cd8-11eb-8b86-12bb97331649.jpg

優勢:1. 兩個任務的表征有交互作用可能輔助任務的學習2. 不用訓練多個模型,一個模型解決問題,不存在訓練與預測時的gap

缺陷:1. 兩個任務的表征可能沖突,影響任務效果2. 解決了主謂賓之間的對應關系,無法解決重疊問題3. Fill table本質仍然是轉成sequence來fill,未能充分利用table結構信息(下文會解釋)

下面重點解讀table fill方式的一篇SOTA,解決了joint learning的多任務表征沖突以及為利用table結構信息

RE with Table Sequence

終于來到本篇的主題啦,為了解決一般filled table的問題, 作者提出table-sequence encoder的方法,分別對table和sequence做表征,本文的最大貢獻在于

分別對table和sequence做表征(encoder),并設計了一個Table-Guided Attention來對table和sequence進行交互,這樣即不會完全共享表征導致對不同的任務表征沖突,也不會丟失表征的相互指導作用

在table encoder中采用多維GRU來捕獲更多的句子結構信息

在架構上table encoder和 sequence encoder多層交互

a84af794-9cd8-11eb-8b86-12bb97331649.jpg

下面仔細介紹各個部分,看看它是如何神奇做到SOTA的

Text Embedder

在上圖的結構圖中,Text Embedder采用類似FLAT分別做了基于lstm的char()和word(),以及基于bert的word ()作為預訓練的embedding ,并拼接起來

圖中

Table Encoder

整個Table Encoder部分由多個Table Encoding的單元組成,每個Encoding單元的輸入分別是起始輸入,對應senquence結構的輸入,以及上一個Tabel Encoding單元的輸出,Table Encoding 采用MDRNN結構提取輸入的特征信息,作者在這選擇MDGRU(多維度GRU),tabel結構本身有2維,加上前后層實際有4維,但是層的維度信息單向流動,實際上是只用到了3個方向()

a879c3bc-9cd8-11eb-8b86-12bb97331649.jpg

如圖所示,是來自sequence的輸入,作者分別測了使用所有方向和分別使用幾個方向,發現上圖中a,c效果類似,這種多維GRU全面的考慮了整個table的結構信息,即一個詞的狀態跟其他所有詞的狀態相關,并且受其他詞的不同程度的影響,這種影響程度由GRU門控機制控制

Sequence Encoder

sequence Encoder 也由多個sequence encoding夠成,sequence encoding結構直接采用transformer中的encoder

a88c27dc-9cd8-11eb-8b86-12bb97331649.jpg

只不過將其中的self attention替換為table-guide attention,這種attention的改造非常巧妙,能更好捕捉word-word之間的關系

a8c91868-9cd8-11eb-8b86-12bb97331649.jpg

正常的dot attention如上圖

Table-Guided attention具體來說:

參數矩陣

采用加性

是table encoder中的table的隱藏節點,該節點由多個方向的經過GRU編碼得到,不管是哪個方向它的來源始終是由構造而來,理論上是可以由擬合而來,因此這里直接由 來代替 ,也就是這個attention,其實是計算了table 結構中各個位置對該的權重,是一個四面八方attention

剩下就是transform中正常的LayerNorm 和殘差結構了

輸出和loss

輸出比較常規,loss采用常規

輸出:

loss:

實驗 and 效果

作者在各個數據集上進行實驗,對比各個目前SOTA分別有一定的提高,且時效果最佳,模型參數量不到5M,要什么自行車,附上開源地址[2],作者的代碼與論文在attention計算有一丟丟不一致,但是并不影響效果

a8d23eac-9cd8-11eb-8b86-12bb97331649.jpg

責任編輯:lq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據庫
    +關注

    關注

    7

    文章

    3794

    瀏覽量

    64362
  • Gru
    Gru
    +關注

    關注

    0

    文章

    12

    瀏覽量

    7477
  • 數據結構
    +關注

    關注

    3

    文章

    573

    瀏覽量

    40123

原文標題:關系抽取一步到位!

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    請問AMC1203文檔中的OSC過采樣率和sinc3濾波器中的抽取率是不是同一個概念?

    ,濾波器的輸出結果(Dfilter) 又怎么和輸入電壓一一對應? 我個人理解是AMC1203輸出占空比=Dfilter/DC_Gain 占空比=>輸入電壓(線性關系?) 輸入電壓 => 采樣電流 不知道對不對,望解答!謝謝,十分感謝!
    發表于 12-16 06:42

    軌道交通行業 ICY DOCK硬盤抽取盒解決方案

    在當今的數據存儲領域,硬盤抽取盒已成為眾多應用中不可或缺的關鍵環節,尤其在軌道交通行業中,硬盤盒解決方案至關重要,它直接關系到數據存儲的安全性、穩定性和可靠性,以及系統維護的便利性。ICYDOCK
    的頭像 發表于 11-21 17:10 ?140次閱讀
    軌道交通行業 ICY DOCK硬盤<b class='flag-5'>抽取</b>盒解決方案

    ADS1299用ADS采集數據,ADS可以不抽取看原始得數據嗎?

    1.用ADS采集數據,將時域的數據進行FFT變換,得到頻譜里面看似有 Sinc Filter 抽取,不需要抽取是否可以?ADS可以不抽取看原始得數據嗎? 2.這個和手冊上的頻譜不一樣? 請問這個是什么問題呢?
    發表于 11-20 06:05

    求助,關于AMC1306M25抽取率OSR的疑問求解

    我客戶目前正在評估AMC1306M25,有以下疑問需要解答,可否幫忙確認一下: 圖為官方的例程,兩個都應該指的是抽取率OSR。但是當客戶在第一個函數中填的抽取率為64,到第二張圖中ratio的值
    發表于 11-14 07:09

    TLV320AIC3254內部中的ADC處理模塊和minidsp到底是什么關系

    我想請問一下幾個問題: 1.3254內部中的ADC處理模塊和minidsp到底是什么關系,是并列的還是串行關系?還是ADC處理模塊就是minidsp特殊情況下的部分? 2.minidsp的抽取因子該怎么理解,到底怎么使用?
    發表于 10-31 06:02

    有獎問卷:隨機抽取 30 名用戶送出快充數據線

    您好 , TI 致力于為中國客戶提供出色的在線技術支持,了解您的喜好是改善用戶體驗的重要環節。我們希望了解您目前訪問 TI 技術支持論壇的偏好,同時也希望知道在獲取技術支持的過程中哪些事情對您
    發表于 10-09 08:08

    貼片電容型號除了要知道參數規格外還有哪些要知道

    在選擇貼片電容型號時,除了要知道其參數規格(如尺寸、容量、電壓、精度等)外,還需要考慮以下幾個方面。
    的頭像 發表于 09-21 14:58 ?291次閱讀

    求助,AD7190關于Σ-Δ ADC其中的抽取濾波器的數據轉換問題求解

    AD7190可以通過模式寄存器的FS[0:9]設置輸出速率, 0-1023的范圍;此時設置的數據速率選擇位是否就是Σ-Δ ADC抽取濾波器的抽取比? 關于抽取濾波器,此時我設置的為1023,那我是否
    發表于 09-09 06:11

    防水和防振動功能2.5 英寸SAS/SATA硬盤抽取盒 非常適合車載數據存儲

    首創的防水和防振動功能 2.5 英寸 SAS/SATA 硬盤抽取盒 – 非常適合車載數據存儲
    的頭像 發表于 08-12 19:16 ?451次閱讀
    防水和防振動功能2.5 英寸SAS/SATA硬盤<b class='flag-5'>抽取</b>盒 非常適合車載數據存儲

    學習鴻蒙必須要知道的幾個名詞

    HarmonyOS提供了一套UI(UserInterface,用戶界面)開發框架,即方舟開發框架(ArkUI框架),用于快速搭建漂亮的用戶界面。它為開發者提供應用UI開發所必需的能力,比如多種組件、布局計算、動畫能力、UI交互、繪制等。
    的頭像 發表于 07-06 08:04 ?411次閱讀
    學習鴻蒙<b class='flag-5'>必須要知道</b>的幾個名詞

    ICY DOCK Expresscage MB038SP-B硬盤抽取盒評測

    ICYDOCK最近又推出了一款ExpressCage系列的有趣產品,適用于SoHo、服務器和工業應用。今天,我們將測試這臺ExpressCageMB038SP-B全金屬硬盤抽取盒,該硬盤抽取盒有8個
    的頭像 發表于 05-17 16:20 ?443次閱讀
    ICY DOCK Expresscage MB038SP-B硬盤<b class='flag-5'>抽取</b>盒評測

    用STM8做一個用于抽取頻譜的東西, 如何采樣128個點用于FFT數據計算?

    各位前輩和大俠們: 想用STM8做一個用于抽取頻譜的東西, 采用128點的FFT運算, 采樣率為16K, 這里就需要一次采樣128個點用于FFT數據計算. 該如何采樣這128個點的數據呢? 1.
    發表于 05-16 08:10

    企業級裝機必備推薦 不用拆機的4盤位U.2 硬盤抽取

    一代的4盤位NVMeU.2/U.3SSDPCIe4.0硬盤抽取盒,其創新性的免工具安裝和可抽取設計,針對企業級用戶的卓越兼容性和散熱性能設計,使其成為各種應用場景
    的頭像 發表于 04-26 14:43 ?488次閱讀
    企業級裝機必備推薦 不用拆機的4盤位U.2 硬盤<b class='flag-5'>抽取</b>盒

    【概念產品 CP133-1】2 盤位 EDSFF E1.S NVMe SSD 硬盤抽取

    產品介紹CP133-1EDSFFE1.SSSD硬盤抽取盒用于安裝標準的內置3.5英寸裝置空間,支持兩個高度為9.5mm或15mm的硬盤,CP133-1EDSFFE1.SSSD移動機架設計用于安裝標準
    的頭像 發表于 02-07 10:57 ?351次閱讀
    【概念產品 CP133-1】2 盤位 EDSFF E1.S NVMe SSD 硬盤<b class='flag-5'>抽取</b>盒

    定制變壓器必須要知道的關鍵點

    更加精準的電流、電壓等參數,保證設備的可靠性和高效性。 三、定制變壓器的流程和注意事項 1.需求交流:客戶需提供詳細的使用場景,包括使用環境、電路參數等信息,以確定變壓器的具體要求,同時與變壓器廠
    發表于 01-09 14:26
    主站蜘蛛池模板: 亚洲国产在线观看免费视频| 99久久免费精品国产| 俄罗斯19girl video9| 九九热这里只有精品视频免费| 全黄h全肉短篇禁乱np| 一一本之道高清视频在线观看中文字幕 | 国产在线高清视频无码不卡| 强奸日本美女小游戏| 一一本之道高清手机在线观看 | 久久精品国产只有精品| 翁止熄痒禁伦短文合集免费视频| 99er4久久视频精品首页| 久草在线草a免费线看| 午夜在线观看免费完整直播网| WWW国产色情在线观看APP| 两性午夜刺激爽爽视频| 亚洲高清视频一区| 国产99视频在线观看| 欧美午夜a级精美理论片| 最新亚洲一区二区三区四区| 好男人WWW免费高清视频在线| 丝袜美腿美女被狂躁在线观看| beeg xxx日本老师| 领导边摸边吃奶边做爽在线观看| 亚洲裸舞 hd| 国产午夜AV无码无片久久96 | 亚洲精品理论电影在线观看 | 国内久久久久影院精品| 无颜之月5集全免费看无删除| 大桥未久电影在线| 青娱乐视觉盛宴国产视频| 99re热视频这里只有精品| 老师好爽你下面水好多视频| 一抽一出BGM免费3分钟| 红番阁免费观看| 亚洲精品久久久久久偷窥| 国产亚洲精品黑人粗大精选| 午夜国产高清精品一区免费| 国产ZZJJZZJJ视频全免费| 射90黑b丝女| 父亲猜女儿在线观看|