色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

介紹一種通用匹配對齊框架MAF

深度學習自然語言處理 ? 來源:知識工場 ? 作者:黃世洲 ? 2022-09-06 16:16 ? 次閱讀

命名實體識別是NLP領(lǐng)域中的一項基礎(chǔ)任務(wù),在文本搜索、文本推薦、知識圖譜構(gòu)建等領(lǐng)域都起著至關(guān)重要的作用,一直是熱點研究方向之一。多模態(tài)命名實體識別在傳統(tǒng)的命名實體識別基礎(chǔ)上額外引入了圖像,可以為文本補充語義信息來進行消岐,近些年來受到人們廣泛的關(guān)注。

盡管當前的多模態(tài)命名實體識別方法取得了成功,但仍然存在著兩個問題:(1)當前大部分方法基于注意力機制來進行文本和圖像間的交互,但由于不同模態(tài)的表示來自于不同的編碼器,想要捕捉文本中token和圖像中區(qū)域之間的關(guān)系是困難的。如下圖所示,句子中的‘Rob’應(yīng)該和圖像中存在貓的區(qū)域(V5,V6,V9等)有著較高的相似度,但由于文本和圖像的表示并不一致,在通過點積等形式計算相似度時,‘Rob’可能會和其它區(qū)域有著較高的相似度得分。因此,表示的不一致會導(dǎo)致模態(tài)之間難以建立起較好的關(guān)系。

7c7b002e-2d86-11ed-ba43-dac502259ad0.png

(2)當前的方法認為文本與其隨附的圖像是匹配的,并且可以幫助識別文本中的命名實體。然而,并不是所有的文本和圖像都是匹配的,模型考慮這種不匹配的圖像將會做出錯誤的預(yù)測。如下圖所示,圖片中沒有任何與命名實體“Siri”相關(guān)的信息,如果模型考慮這張不匹配的圖像,便會受圖中“人物”的影響將“Siri”預(yù)測為PER(人)。而在只有文本的情況下,預(yù)訓(xùn)練模型(BERT等)通過預(yù)訓(xùn)練任務(wù)中學到的知識可以將“Siri”的類型預(yù)測為MISC(雜項)。

為了解決上述存在的問題,本文提出了MAF,一種通用匹配對齊框架(General Matching and Alignment Framework),將文本和圖像的表示進行對齊并通過圖文匹配的概率過濾圖像信息 。由于該框架中的模塊是插件式的,其可以很容易地被拓展到其它多模態(tài)任務(wù)上。

本文研究成果已被WSDM2022接收,

7cc4ec16-2d86-11ed-ba43-dac502259ad0.png7ce6e5e6-2d86-11ed-ba43-dac502259ad0.png

整體框架

本文框架如下圖所示,由5個主要部分組成:

Input Representations

將原始的文本輸入轉(zhuǎn)為token序列的表示以及文本整體的表示,將原始的圖像輸入轉(zhuǎn)為圖像區(qū)域的表示以及圖像整體的表示。

Cross-Modal Alignment Module

接收文本整體的表示和圖像整體的表示作為輸入,通過對比學習將文本和圖像的表示變得更為一致。

Cross-Modal Interaction Module

接收token序列的表示以及圖像區(qū)域的表示作為輸入,使用注意力機制建立起文本token和圖像區(qū)域之間的聯(lián)系得到文本增強后的圖像的表示。

Cross-Modal Matching Module

接收文本序列的表示和文本增強后的圖像的表示作為輸入,用于判斷文本和圖像匹配的概率,并用輸出的概率對圖像信息進行過濾。

Cross-Modal Fusion Module

將文本token序列的表示和最終圖像的表示結(jié)合在一起輸入到CRF層進行預(yù)測。

7cf10116-2d86-11ed-ba43-dac502259ad0.png7ce6e5e6-2d86-11ed-ba43-dac502259ad0.png

主要部分

Input Representations

pYYBAGMXAjyAfd_9AAIrPNeQE1s850.jpg

7d0aae22-2d86-11ed-ba43-dac502259ad0.png

pYYBAGMXAmiAViCiAAF8GHZxccw723.jpg
poYBAGMXAm-AZaj2AALcEY_MaGs226.jpg

7d2afa56-2d86-11ed-ba43-dac502259ad0.png

poYBAGMXAoyAAY87AAGwW_qDavA106.jpg

實驗

主要結(jié)果

本文的方法在Twitter-2015和Twitter-2017數(shù)據(jù)集上效果均優(yōu)于之前的方法。

7d4b855a-2d86-11ed-ba43-dac502259ad0.png

運行時間

本文的方法相比于之前的方法除了有著模態(tài)之間交互的模塊(本文中為CI),還添加了對齊模態(tài)表示的CA以及判斷圖文是否匹配的CM,這可能會導(dǎo)致訓(xùn)練成本以及預(yù)測成本增加。但本文簡化了模態(tài)之間交互的過程,因此整體訓(xùn)練和預(yù)測時間以及模型大小均由于之前的SOTA方法。

7d71210c-2d86-11ed-ba43-dac502259ad0.png

消融實驗

本文進行了消融實驗,驗證了CA和CM的有效性。

7d8a1194-2d86-11ed-ba43-dac502259ad0.png

樣例分析

本文還進行了樣例分析來更加直觀地展示CA和CM的有效性。

7da422a0-2d86-11ed-ba43-dac502259ad0.png



審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 編碼器
    +關(guān)注

    關(guān)注

    45

    文章

    3701

    瀏覽量

    135690
  • MLP
    MLP
    +關(guān)注

    關(guān)注

    0

    文章

    57

    瀏覽量

    4344

原文標題:用于多模態(tài)命名實體識別的通用匹配對齊框架

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    Orcad繪制原理圖的元器件對齊方法

    在使用Orcad軟件繪制原理圖的時候,為了使原理圖繪制的美觀些,有時候也希望像PCB設(shè)計樣,將所有的器件都進行對齊,這里我們給大家介紹下,原理圖器件
    的頭像 發(fā)表于 02-07 10:33 ?349次閱讀
    Orcad繪制原理圖的元器件<b class='flag-5'>對齊</b>方法

    AI開發(fā)框架集成介紹

    隨著AI應(yīng)用的廣泛深入,單框架往往難以滿足多樣化的需求,因此,AI開發(fā)框架的集成成為了提升開發(fā)效率、促進技術(shù)創(chuàng)新的關(guān)鍵路徑。以下,是對AI開發(fā)框架集成的
    的頭像 發(fā)表于 01-07 15:58 ?200次閱讀

    一種降低VIO/VSLAM系統(tǒng)漂移的新方法

    本文提出了一種新方法,通過使用點到平面匹配將VIO/VSLAM系統(tǒng)生成的稀疏3D點云與數(shù)字孿生體進行對齊,從而實現(xiàn)精確且全球致的定位,無需視覺數(shù)據(jù)關(guān)聯(lián)。所提方法為VIO/VSLAM系
    的頭像 發(fā)表于 12-13 11:18 ?319次閱讀
    <b class='flag-5'>一種</b>降低VIO/VSLAM系統(tǒng)漂移的新方法

    KiCad的對齊工具不好用?

    “ ?不存在的。唯的原因是您還沒有學會怎么用。 ? ” 對齊命令在哪里? KiCad的對齊命令(Align)藏得比較隱蔽,既不在菜單欄,也不在工具欄。右鍵的菜單中默認也不存在。只有當您 選中兩個或
    的頭像 發(fā)表于 12-04 18:15 ?388次閱讀
    KiCad的<b class='flag-5'>對齊</b>工具不好用?

    一種使用LDO簡單電源電路解決方案

    本期我們介紹一種使用LDO簡單電源電路解決方案,該方案可以處理12V/24V、多節(jié)鋰離子電池和4節(jié)干電池等相對較高的輸入電壓。
    的頭像 發(fā)表于 12-04 16:05 ?501次閱讀
    <b class='flag-5'>一種</b>使用LDO簡單電源電路解決方案

    一種面向飛行試驗的數(shù)據(jù)融合框架

    天地氣動數(shù)據(jù)致性,針對某外形飛行試驗數(shù)據(jù)開展了典型對象的天地氣動數(shù)據(jù)融合方法研究。結(jié)合數(shù)據(jù)挖掘的隨機森林方法,本文提出了一種面向飛行試驗的數(shù)據(jù)融合框架,通過引入地面風洞試驗氣動數(shù)據(jù),實現(xiàn)了對復(fù)雜輸入?yún)?shù)的特征
    的頭像 發(fā)表于 11-27 11:34 ?405次閱讀
    <b class='flag-5'>一種</b>面向飛行試驗的數(shù)據(jù)融合<b class='flag-5'>框架</b>

    基于視覺語言模型的導(dǎo)航框架VLMnav

    本文提出了一種將視覺語言模型(VLM)轉(zhuǎn)換為端到端導(dǎo)航策略的具體框架。不依賴于感知、規(guī)劃和控制之間的分離,而是使用VLM在步中直接選擇動作。驚訝的是,我們發(fā)現(xiàn)VLM可以作為一種無需任
    的頭像 發(fā)表于 11-22 09:42 ?372次閱讀

    I2S有左對齊,右對齊跟標準的I2S三格式,那么這三格式各有什么優(yōu)點呢?

    大家好,關(guān)于I2S格式,有兩個疑問請教下 我們知道I2S有左對齊,右對齊跟標準的I2S三格式,那么這三格式各有什么優(yōu)點呢? 而且對于
    發(fā)表于 10-21 08:23

    rup是一種什么模型

    RUP(Rational Unified Process,統(tǒng)建模語言)是一種軟件開發(fā)過程模型,它是一種迭代和增量的軟件開發(fā)方法。RUP是由Rational Software公司(現(xiàn)為IBM的
    的頭像 發(fā)表于 07-09 10:13 ?1526次閱讀

    plc是一種什么的電子裝置

    PLC(Programmable Logic Controller,可編程邏輯控制器)是一種廣泛應(yīng)用于工業(yè)自動化領(lǐng)域的電子裝置。它具有高度的靈活性和可靠性,能夠?qū)崿F(xiàn)各種復(fù)雜的控制任務(wù)。本文將詳細介紹
    的頭像 發(fā)表于 06-13 09:29 ?1234次閱讀

    介紹一種嵌入式Linux中的錄音降噪方案

    降噪不僅只能從硬件入手,本文為您介紹一種嵌入式Linux中的錄音降噪方案。該方案完全依靠軟件實現(xiàn),最大程度上降低投入。
    的頭像 發(fā)表于 05-21 11:52 ?693次閱讀

    HarmonyOS開發(fā)ArkUI案例:【常用布局容器對齊方式】

    基于ArkTS擴展的聲明式開發(fā)范式,實現(xiàn)Flex、Column、Row和Stack四常用布局容器對齊方式。
    的頭像 發(fā)表于 05-08 16:47 ?1809次閱讀
    HarmonyOS開發(fā)ArkUI案例:【常用布局容器<b class='flag-5'>對齊</b>方式】

    關(guān)于BlueNRG 355MC藍牙與其他藍牙模塊配對的問題求解

    觸發(fā)配對完成事件,沒有立即觸發(fā)disconnect事件,而是等待了相當于輸入密鑰超時時間(10秒左右)才觸發(fā)disconnect事件,disconnect的錯誤碼為0x13,另外還有一種情況,在配對
    發(fā)表于 03-28 07:59

    榮耀終端發(fā)布指紋匹配專利,聚焦電子設(shè)備領(lǐng)域

    此項技術(shù)研究揭示了一種指紋匹配方法及其對應(yīng)的電子設(shè)備應(yīng)用,具有增強指印解鎖圖像與指紋模板圖像配對成功率的優(yōu)勢,從而提升用戶的使用體驗。其具體策略包括:在指印解鎖圖像無法與電子設(shè)備指紋模板圖像相
    的頭像 發(fā)表于 03-21 09:43 ?722次閱讀
    榮耀終端發(fā)布指紋<b class='flag-5'>匹配</b>專利,聚焦電子設(shè)備領(lǐng)域

    一種高效的KV緩存壓縮框架--GEAR

    GEAR框架通過結(jié)合三互補的技術(shù)來解決這挑戰(zhàn):首先對大多數(shù)相似幅度的條目應(yīng)用超低精度量化;然后使用低秩矩陣來近似量化誤差。
    發(fā)表于 03-19 10:12 ?419次閱讀
    <b class='flag-5'>一種</b>高效的KV緩存壓縮<b class='flag-5'>框架</b>--GEAR
    主站蜘蛛池模板: 三级黄色在线观看 | 虫族bl文全肉高h | 无遮挡h肉3d动漫在线观看 | 国产精品久人妻精品 | 伊人影院亚洲 | 亚洲精品视频在线播放 | 18禁无遮挡羞羞污污污污免费 | 亚洲视频免费看 | 国产国拍亚洲精品av麻豆 | 妇少水多18P蜜泬17P亚洲乱 | 亚洲性爱城 | 邻家美姨在线观看全集免费 | 国产午夜精品美女免费大片 | 在线 | 果冻国产传媒61国产免费 | 九色PORNY真实丨国产免费 | 欧美最猛黑人XXXXWWW | 99国产精品免费视频 | sm主人调教揉花蒂H SM双性精跪趴灌憋尿调教H | 亚洲欭美日韩颜射在线二 | 内射人妻无码色AV麻豆去百度搜 | 日本久久久WWW成人免费毛片丨 | 成人中文字幕在线观看 | 国产精品 日韩精品 欧美 | 红桃视频国产AV | 亚洲最大在线视频 | 韩国无遮羞禁动漫在线观看96 | xxxxhdvideos动漫| 老师你奶真大下面水真多 | 小草高清视频免费直播 | 久久精品视在线观看2 | 91精品国产品国语在线不卡 | 亚洲精品成人无码区一在线观看 | 国产成人在线视频 | 国产在线高清视频无码不卡 | 日本美国群交P片内射捆绑 日本毛片久久国产精品 | 国产精品亚洲AV色欲在线观看 | 热久久视久久精品2015 | 挺进老师的紧窄小肉六电影完整版 | 国产精品爆乳尤物99精品 | 伊人国产精品 | 国产成人精品男人的天堂网站 |