色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

介紹一種通用匹配對齊框架MAF

深度學習自然語言處理 ? 來源:知識工場 ? 作者:黃世洲 ? 2022-09-06 16:16 ? 次閱讀

命名實體識別是NLP領域中的一項基礎任務,在文本搜索、文本推薦、知識圖譜構建等領域都起著至關重要的作用,一直是熱點研究方向之一。多模態命名實體識別在傳統的命名實體識別基礎上額外引入了圖像,可以為文本補充語義信息來進行消岐,近些年來受到人們廣泛的關注。

盡管當前的多模態命名實體識別方法取得了成功,但仍然存在著兩個問題:(1)當前大部分方法基于注意力機制來進行文本和圖像間的交互,但由于不同模態的表示來自于不同的編碼器,想要捕捉文本中token和圖像中區域之間的關系是困難的。如下圖所示,句子中的‘Rob’應該和圖像中存在貓的區域(V5,V6,V9等)有著較高的相似度,但由于文本和圖像的表示并不一致,在通過點積等形式計算相似度時,‘Rob’可能會和其它區域有著較高的相似度得分。因此,表示的不一致會導致模態之間難以建立起較好的關系。

7c7b002e-2d86-11ed-ba43-dac502259ad0.png

(2)當前的方法認為文本與其隨附的圖像是匹配的,并且可以幫助識別文本中的命名實體。然而,并不是所有的文本和圖像都是匹配的,模型考慮這種不匹配的圖像將會做出錯誤的預測。如下圖所示,圖片中沒有任何與命名實體“Siri”相關的信息,如果模型考慮這張不匹配的圖像,便會受圖中“人物”的影響將“Siri”預測為PER(人)。而在只有文本的情況下,預訓練模型(BERT等)通過預訓練任務中學到的知識可以將“Siri”的類型預測為MISC(雜項)。

為了解決上述存在的問題,本文提出了MAF,一種通用匹配對齊框架(General Matching and Alignment Framework),將文本和圖像的表示進行對齊并通過圖文匹配的概率過濾圖像信息 。由于該框架中的模塊是插件式的,其可以很容易地被拓展到其它多模態任務上。

本文研究成果已被WSDM2022接收,

7cc4ec16-2d86-11ed-ba43-dac502259ad0.png7ce6e5e6-2d86-11ed-ba43-dac502259ad0.png

整體框架

本文框架如下圖所示,由5個主要部分組成:

Input Representations

將原始的文本輸入轉為token序列的表示以及文本整體的表示,將原始的圖像輸入轉為圖像區域的表示以及圖像整體的表示。

Cross-Modal Alignment Module

接收文本整體的表示和圖像整體的表示作為輸入,通過對比學習將文本和圖像的表示變得更為一致。

Cross-Modal Interaction Module

接收token序列的表示以及圖像區域的表示作為輸入,使用注意力機制建立起文本token和圖像區域之間的聯系得到文本增強后的圖像的表示。

Cross-Modal Matching Module

接收文本序列的表示和文本增強后的圖像的表示作為輸入,用于判斷文本和圖像匹配的概率,并用輸出的概率對圖像信息進行過濾。

Cross-Modal Fusion Module

將文本token序列的表示和最終圖像的表示結合在一起輸入到CRF層進行預測。

7cf10116-2d86-11ed-ba43-dac502259ad0.png7ce6e5e6-2d86-11ed-ba43-dac502259ad0.png

主要部分

Input Representations

pYYBAGMXAjyAfd_9AAIrPNeQE1s850.jpg

7d0aae22-2d86-11ed-ba43-dac502259ad0.png

pYYBAGMXAmiAViCiAAF8GHZxccw723.jpg
poYBAGMXAm-AZaj2AALcEY_MaGs226.jpg

7d2afa56-2d86-11ed-ba43-dac502259ad0.png

poYBAGMXAoyAAY87AAGwW_qDavA106.jpg

實驗

主要結果

本文的方法在Twitter-2015和Twitter-2017數據集上效果均優于之前的方法。

7d4b855a-2d86-11ed-ba43-dac502259ad0.png

運行時間

本文的方法相比于之前的方法除了有著模態之間交互的模塊(本文中為CI),還添加了對齊模態表示的CA以及判斷圖文是否匹配的CM,這可能會導致訓練成本以及預測成本增加。但本文簡化了模態之間交互的過程,因此整體訓練和預測時間以及模型大小均由于之前的SOTA方法。

7d71210c-2d86-11ed-ba43-dac502259ad0.png

消融實驗

本文進行了消融實驗,驗證了CA和CM的有效性。

7d8a1194-2d86-11ed-ba43-dac502259ad0.png

樣例分析

本文還進行了樣例分析來更加直觀地展示CA和CM的有效性。

7da422a0-2d86-11ed-ba43-dac502259ad0.png



審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 編碼器
    +關注

    關注

    45

    文章

    3638

    瀏覽量

    134426
  • MLP
    MLP
    +關注

    關注

    0

    文章

    57

    瀏覽量

    4241

原文標題:用于多模態命名實體識別的通用匹配對齊框架

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    一種降低VIO/VSLAM系統漂移的新方法

    本文提出了一種新方法,通過使用點到平面匹配將VIO/VSLAM系統生成的稀疏3D點云與數字孿生體進行對齊,從而實現精確且全球致的定位,無需視覺數據關聯。所提方法為VIO/VSLAM系
    的頭像 發表于 12-13 11:18 ?126次閱讀
    <b class='flag-5'>一種</b>降低VIO/VSLAM系統漂移的新方法

    KiCad的對齊工具不好用?

    “ ?不存在的。唯的原因是您還沒有學會怎么用。 ? ” 對齊命令在哪里? KiCad的對齊命令(Align)藏得比較隱蔽,既不在菜單欄,也不在工具欄。右鍵的菜單中默認也不存在。只有當您 選中兩個或
    的頭像 發表于 12-04 18:15 ?135次閱讀
    KiCad的<b class='flag-5'>對齊</b>工具不好用?

    一種面向飛行試驗的數據融合框架

    天地氣動數據致性,針對某外形飛行試驗數據開展了典型對象的天地氣動數據融合方法研究。結合數據挖掘的隨機森林方法,本文提出了一種面向飛行試驗的數據融合框架,通過引入地面風洞試驗氣動數據,實現了對復雜輸入參數的特征
    的頭像 發表于 11-27 11:34 ?217次閱讀
    <b class='flag-5'>一種</b>面向飛行試驗的數據融合<b class='flag-5'>框架</b>

    I2S有左對齊,右對齊跟標準的I2S三格式,那么這三格式各有什么優點呢?

    大家好,關于I2S格式,有兩個疑問請教下 我們知道I2S有左對齊,右對齊跟標準的I2S三格式,那么這三格式各有什么優點呢? 而且對于
    發表于 10-21 08:23

    關于BlueNRG 355MC藍牙與其他藍牙模塊配對的問題求解

    觸發配對完成事件,沒有立即觸發disconnect事件,而是等待了相當于輸入密鑰超時時間(10秒左右)才觸發disconnect事件,disconnect的錯誤碼為0x13,另外還有一種情況,在配對
    發表于 03-28 07:59

    榮耀終端發布指紋匹配專利,聚焦電子設備領域

    此項技術研究揭示了一種指紋匹配方法及其對應的電子設備應用,具有增強指印解鎖圖像與指紋模板圖像配對成功率的優勢,從而提升用戶的使用體驗。其具體策略包括:在指印解鎖圖像無法與電子設備指紋模板圖像相
    的頭像 發表于 03-21 09:43 ?590次閱讀
    榮耀終端發布指紋<b class='flag-5'>匹配</b>專利,聚焦電子設備領域

    一種高效的KV緩存壓縮框架--GEAR

    GEAR框架通過結合三互補的技術來解決這挑戰:首先對大多數相似幅度的條目應用超低精度量化;然后使用低秩矩陣來近似量化誤差。
    發表于 03-19 10:12 ?332次閱讀
    <b class='flag-5'>一種</b>高效的KV緩存壓縮<b class='flag-5'>框架</b>--GEAR

    介紹一種OpenAtom OpenHarmony輕量系統適配方案

    本文在不改變原有系統基礎框架的基礎上, 介紹一種OpenAtom OpenHarmony(以下簡稱“OpenHarmony”)輕量系統適配方案。
    的頭像 發表于 03-05 09:24 ?1139次閱讀
    <b class='flag-5'>介紹</b><b class='flag-5'>一種</b>OpenAtom OpenHarmony輕量系統適配方案

    大語言模型中的語言與知識:一種神秘的分離現象

    自然語言處理領域存在著個非常有趣的現象:在多語言模型中,不同的語言之間似乎存在著一種隱含的對齊關系。
    發表于 02-20 14:53 ?522次閱讀
    大語言模型中的語言與知識:<b class='flag-5'>一種</b>神秘的分離現象

    無線遙控開關原理 無線遙控開關怎么配對

    。 第部分:無線遙控開關的原理 無線遙控開關是一種通過無線傳輸技術,將信號發送給控制繼電器的設備,實現對電器開關的遠程控制。其原理主要包括無線信號發射和接收。 無線信號發射:無線遙控開關通過無線發射模塊將控制信
    的頭像 發表于 01-22 16:27 ?7914次閱讀

    什么是匹配濾波器?如何理解匹配濾波器?

    [導讀]為增進大家對匹配濾波器的認識,本文將對匹配濾波器、匹配濾波器的詳細理解予以介紹。 匹配濾?波器作為濾波器的
    的頭像 發表于 01-12 08:39 ?1657次閱讀

    一種AT命令通信解析模塊介紹

    一種AT命令通信解析模塊,支持裸機(at_chat)和OS版本(at)。適用于modem、WIFI模塊、藍牙通信。
    的頭像 發表于 01-08 12:24 ?1152次閱讀
    <b class='flag-5'>一種</b>AT命令通信解析模塊<b class='flag-5'>介紹</b>

    OneLLM:對齊所有模態的框架!

    OneLLM 是第個在單個模型中集成八不同模態的MLLM。通過統框架和漸進式多模態對齊pipelines,可以很容易地擴展OneLL
    的頭像 發表于 01-04 11:27 ?971次閱讀
    OneLLM:<b class='flag-5'>對齊</b>所有模態的<b class='flag-5'>框架</b>!

    一種基于表征工程的生成式語言大模型人類偏好對齊策略

    最近復旦大學自然語言處理組鄭驍慶和黃萱菁團隊提出了基于表征工程(Representation Engineering)的生成式語言大模型人類偏好對齊方法RAHF(如圖1所示),作為基于人類反饋的強化
    的頭像 發表于 01-03 14:25 ?559次閱讀
    <b class='flag-5'>一種</b>基于表征工程的生成式語言大模型人類偏好<b class='flag-5'>對齊</b>策略

    框架與芯片粘接中兩涂膠

    工藝,基于一種框架,對比分析了手工涂膠和絲網印刷兩涂膠工藝對框架芯片粘接工藝效果的影響。結果表明,絲網印刷涂膠和手工涂膠工藝均能滿足膠粘劑正常固化、耐受100次溫度沖擊、電路片四周溢
    的頭像 發表于 01-03 08:40 ?520次閱讀
    <b class='flag-5'>框架</b>與芯片粘接中兩<b class='flag-5'>種</b>涂膠
    主站蜘蛛池模板: 亚洲m男在线中文字幕| 成人永久免费视频| 亚洲免费综合色视频| 色一伦一情一区二区三区| 快穿女主有名器的H纯肉黄暴拉文| 狠狠综合久久综合88亚洲| 国产亚洲精品久久久999无毒| 高清国产免费观看视频在线| 把英语老师强奷到舒服动态图 | 色偷偷男人| 日日夜夜天天操| 肉多荤文高h羞耻校园| 肉肉的各种姿势高H细文| 色欲AV亚洲情无码AV蜜桃| 色久久一个亚洲综合网| 伸进同桌奶罩里摸她胸作文| 色窝窝777欧美午夜精品影院| 婷婷亚洲AV色香蕉蜜桃| 亚洲粉嫩美白在线| 亚洲视频中文字幕在线观看| 一个人HD在线观看免费高清视频 | 曰本aaaaa毛片午夜网站| 中国老女人xxhd69| 91九色视频无限观看免费| 99精品视频在线观看免费播放| chinesevideoshd性舞| 阿v天堂2017在无码| 国产产一区二区三区久久毛片国语| 国产69精品久久久熟女| 国产在线精品视频二区| 久久re这里视频精品8| 曼谷av女郎| 日本漂亮妈妈7观整有限中| 熟女人妻久久精品AV天堂| 性色无码AV久久蜜臀| 亚洲中文字幕在线精品| 3d在线看小舞被躁视频| 成人网视频在线观看免费| 国产午夜精品久久久久婷婷| 久久久无码精品亚洲日韩按摩| 内射少妇36P九色|