色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何在Prompt Learning下引入外部知識達到好文本分類效果

深度學習自然語言處理 ? 來源:夕小瑤的賣萌屋 ? 作者:小偉 ? 2022-07-08 11:53 ? 次閱讀

背景

利用Prompt Learning(提示學習)進行文本分類任務是一種新興的利用預訓練語言模型的方式。在提示學習中,我們需要一個標簽詞映射(verbalizer),將[MASK]位置上對于詞表中詞匯的預測轉化成分類標簽。例如{POLITICS: "politics", SPORTS: "sports"} 這個映射下,預訓練模型在[MASK]位置對于politics/sports這個標簽詞的預測分數會被當成是對POLITICS/SPORTS這個標簽的預測分數。

手工定義或自動搜索得到的verbalizer有主觀性強覆蓋面小等缺點,我們使用了知識庫來進行標簽詞的擴展和改善,取得了更好的文本分類效果。同時也為如何在Prompt Learning下引入外部知識提供了參考。

方法

我們提出使用知識庫擴展標簽詞,通過例如相關詞詞表,情感詞典等工具,基于手工定義的初始標簽詞進行擴展。例如,可以將{POLITICS: "politics", SPORTS: "sports"} 擴展為以下的一些詞:

bd18025a-ed60-11ec-ba43-dac502259ad0.png

表1: 基于知識庫擴展出的標簽詞。

bd25f252-ed60-11ec-ba43-dac502259ad0.png

圖1: 以問題分類任務為例的KPT流程圖。

之后我們可以通過一個多對一映射將多個詞上的預測概率映射到某個標簽上。

但是由于知識庫不是為預訓練模型量身定做的,使用知識庫擴展出的標簽詞具有很大噪音。例如SPORTS擴展出的movement可能和POLITICS相關性很大,從而引起混淆;又或者POLITICS擴展出的machiavellian(為奪取權力而不擇手段的)則可能由于詞頻很低不容易被預測到,甚至被拆解成多個token而不具有詞語本身的意思。

因此我們提出了三種精調以及一種校準的方法。

01

頻率精調

我們利用預訓練模型M本身對于標簽詞v的輸出概率當成標簽詞的先驗概率,用來估計標簽詞的先驗出現頻率。我們把頻率較小的標簽詞去掉。

bd379138-ed60-11ec-ba43-dac502259ad0.png

公式1: 頻率精調。C代表語料庫。

02

相關性精調

有的標簽詞和標簽相關性不大,有些標簽詞會同時和不同標簽發生混淆。我們利用TF-IDF的思想來賦予每個標簽詞一個對于特定類別的重要性。

bd427238-ed60-11ec-ba43-dac502259ad0.png

公式2: 相關性精調,r(v,y)是一個標簽詞v和標簽y的相關性,類似于TF項。右邊一項則類似IDF項,我們要求這一項大也就是要求v和其非對應類相關性小。

03

可學習精調

在少樣本實驗中,我們可以為每個標簽詞賦予一個可學習的權重,因此每個標簽詞的重要性就變成:

bd4dc138-ed60-11ec-ba43-dac502259ad0.png

公式3:可學習的標簽詞權重。

04

基于上下文的校準

在零樣本實驗中不同標簽詞的先驗概率可能差得很多,例如預測 basketball可能天然比fencing大,會使得很多小眾標簽詞影響甚微。我們使用校準的方式來平衡這種影響。

bd5be0a6-ed60-11ec-ba43-dac502259ad0.png

公式4: 基于上下文的校準,分母是公式1中的先驗概率。

使用上以上這些精調方法,我們知識庫擴展的標簽詞就能有效使用了。

實驗

bd6714d0-ed60-11ec-ba43-dac502259ad0.png

表2:零樣本文本分類任務。

如表2所示,零樣本上相比于普通的Prompt模板,性能有15個點的大幅長進。相比于加上了標簽詞精調的也最多能有8個點的提高。我們提出的頻率精調,相關性精調等也各有用處。

bd73cfcc-ed60-11ec-ba43-dac502259ad0.png

表3:少樣本文本分類任務。

如表3所示,在少樣本上我們提出的可學習精調搭配上相關性精調也有較大提升。AUTO和SOFT都是自動的標簽詞優化方法,其中SOFT以人工定義的標簽詞做初始化,可以看到這兩種方法的效果都不如KPT。

bd83242c-ed60-11ec-ba43-dac502259ad0.png

圖2: SPORTS和BUSINESS類的知識庫擴展的標簽詞對于預測的貢獻。

標簽詞的可視化表明,每一條句子可能會依賴不同的標簽詞進行預測,完成了我們增加覆蓋面的預期。

總結

最近比較受關注的Prompt Learning方向,除了template的設計,verbalizer的設計也是彌補MLM和下游分類任務的重要環節。我們提出的基于知識庫的擴展,直觀有效。同時也為如何在預訓練模型的的利用中引入外部知識提供了一些參考。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 頻率
    +關注

    關注

    4

    文章

    1511

    瀏覽量

    59268
  • 知識庫
    +關注

    關注

    0

    文章

    10

    瀏覽量

    6726

原文標題:ACL2022 | KPT: 文本分類中融入知識的Prompt Verbalizer

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    如何使用自然語言處理分析文本數據

    媒體、新聞報道、用戶評論等)收集你感興趣的文本數據。 數據清洗 :去除無關字符(如HTML標簽、特殊符號等),確保文本數據干凈且一致。 2. 預處理 分詞 :將文本分割成有意義的單元(單詞、短語或句子),這取決于使用的語言和分析
    的頭像 發表于 12-05 15:27 ?305次閱讀

    何在文本字段中使用上標、下標及變量

    在KiCad的任何文本字段中,都可以通過以下的方式實現上標、下標、上劃線以及顯示變量及字段值的描述: 文本變量“文本變量”可以在 原理圖設置->工程->文本變量 中設置。下圖中設置了一
    的頭像 發表于 11-12 12:23 ?131次閱讀
    如<b class='flag-5'>何在</b><b class='flag-5'>文本</b>字段中使用上標、下標及變量

    AI對話魔法 Prompt Engineering 探索指南

    作者:京東物流 李雪婷 一、什么是 Prompt Engineering? 想象一,你在和一個智能助手聊天,你需要說出非常清晰和具體的要求,才能得到你想要的答案。Prompt
    的頭像 發表于 11-07 10:11 ?827次閱讀
    AI對話魔法 <b class='flag-5'>Prompt</b> Engineering 探索指南

    RK3588 技術分享 | 在Android系統中使用NPU實現Yolov5分類檢測

    : NPU幫助機器完成更高效的翻譯、文本分類和情感分析,推動了自然語言處理技術的發展。 實例分享:Yolov5分類檢測 在RK3588處理器上,不僅可以基于Linux系統使用NPU,也可以
    發表于 10-24 10:13

    何在TMS320C6727 DSP上創建基于延遲的音頻效果

    電子發燒友網站提供《如何在TMS320C6727 DSP上創建基于延遲的音頻效果.pdf》資料免費下載
    發表于 10-16 10:35 ?0次下載
    如<b class='flag-5'>何在</b>TMS320C6727 DSP上創建基于延遲的音頻<b class='flag-5'>效果</b>

    雷達的基本分類方法

    電子發燒友網站提供《雷達的基本分類方法.pdf》資料免費下載
    發表于 09-11 09:09 ?6次下載

    RK3588 技術分享 | 在Android系統中使用NPU實現Yolov5分類檢測

    : NPU幫助機器完成更高效的翻譯、文本分類和情感分析,推動了自然語言處理技術的發展。 實例分享:Yolov5分類檢測 在RK3588處理器上,不僅可以基于Linux系統使用NPU,也可以
    發表于 08-20 11:13

    利用TensorFlow實現基于深度神經網絡的文本分類模型

    要利用TensorFlow實現一個基于深度神經網絡(DNN)的文本分類模型,我們首先需要明確幾個關鍵步驟:數據預處理、模型構建、模型訓練、模型評估與調優,以及最終的模型部署(盡管在本文中,我們將重點放在前四個步驟上)。下面,我將詳細闡述這些步驟,并給出一個具體的示例。
    的頭像 發表于 07-12 16:39 ?896次閱讀

    卷積神經網絡在文本分類領域的應用

    顯著成就后,也逐漸被引入文本分類任務中。卷積神經網絡通過模擬人類視覺系統的信息處理方式,能夠有效地提取文本中的局部特征,進而實現高精度的文本分類。本文將對卷積神經網絡在
    的頭像 發表于 07-01 16:25 ?750次閱讀

    何在idf工程中引入mdf WiFi-Mesh函數?

    我原先在idf開發好的程序,如何引入mdf進行開發?需要用到WiFi-Mesh,看了mdf的例程是比較合適的,而idf的wifi-m
    發表于 06-28 14:59

    交換機的基本分類

      交換機作為網絡通訊中的核心設備之一,其在網絡架構中起著至關重要的作用。隨著信息技術的飛速發展,交換機也在不斷演進和革新,以滿足日益復雜的網絡需求。本文將對交換機的分類及其特點進行詳細介紹,以期為讀者提供清晰、深入的理解。
    的頭像 發表于 06-06 11:06 ?2129次閱讀

    有誰知道如何在熱敏打印機中實現圖片的灰階打印效果嗎?

    有誰知道如何在熱敏打印機中實現圖片的灰階打印效果。 現在基本上文字打印,圖片打印功能都已開發結束,圖片打印現在用的是點陣打印的方法。想增加灰階打印的效果。 有哪個大神做過相關方面開發,知道如何實現的嗎? 高價有償求指導!!!
    發表于 04-24 15:43

    了解如何使用PyTorch構建圖神經網絡

    圖神經網絡直接應用于圖數據集,您可以訓練它們以預測節點、邊緣和與圖相關的任務。它用于圖和節點分類、鏈路預測、圖聚類和生成,以及圖像和文本分類
    發表于 02-21 12:19 ?790次閱讀
    了解如何使用PyTorch構建圖神經網絡

    何在VDAC上使用外部頻閃功能?

    何在 VDAC 上使用外部頻閃功能? 它使用上升邊緣嗎? 我看不到具體說明。
    發表于 01-30 08:12

    如何從訓練集中生成候選prompt 三種生成候選prompt的方式

    預測正確的),讓LLM給出當前prompt預測錯誤的原因,這一原因即文本形式的“gradient”。使用的還是LLM!
    的頭像 發表于 01-12 11:29 ?1086次閱讀
    如何從訓練集中生成候選<b class='flag-5'>prompt</b> 三種生成候選<b class='flag-5'>prompt</b>的方式
    主站蜘蛛池模板: 国产高清超清在线播放| 91国在线产| 68日本xxxxxxxx79| 国产亚洲精品久久久久久白晶晶| 人人草影院| 成人高清网站| 热中文热国产热综合| 把腿张开再深点好爽宝贝| 牛牛在线视频| beeg日本老师| 日本二区三区欧美亚洲国| 扒开她的黑森林让我添动态图| 女的把腿张开男的往里面插| 9久爱午夜视频| 日本乱hd高清videos| 东京热一本无码av| 帅小伙和警官同性3p| 国产三级在线免费| 亚洲欧洲日本无在线码播放| 好男人WWW免费高清视频在线| 亚洲精品午睡沙发系列| 久久国产免费观看精品1| 综合精品欧美日韩国产在线| 免费一级毛片在线观看| 白丝萝莉喷水| 婷婷久久无码欧美人妻| 国产一区91| 综合色一色综合久久网vr| 欧美黑人巨大性极品hd欧| 东京热百度影音| 亚洲国产在线播放在线| 久久有码中文字幕| 成人免费一区二区无码视频 | 久久热在线视频精品1| 69ZXX少妇内射无码| 日本一区精品久久久久影院| 国产精品人妻无码久久久蜜桃臀| 亚洲欧美无码2017在线| 免费的黄直播| 国产高清亚洲| 中文在线无码高潮潮喷在线|