色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

重新審視Prompt優化問題,預測偏差讓語言模型上下文學習更強

智能感知與物聯網技術研究所 ? 來源:智能感知與物聯網技術研 ? 2023-04-03 14:16 ? 次閱讀

LLMs 在 In-context Learning 下取得了良好的表現,但是選取不同的示例會導致截然不同的表現。一項最新的研究工作從預測偏差 (predictive bias) 角度,提出了 prompt 搜索策略,近似找到了最優的示例組合。

0d7c165a-d159-11ed-bfe3-dac502259ad0.png

研究介紹

大型語言模型在上下文學習中表現出了驚人的能力,這些模型可以通過幾個輸入輸出示例構建的上下文進行學習,無需微調優化直接應用于許多下游任務。然而,先前的研究表明,由于訓練樣本 (training examples)、示例順序 (example order) 和提示格式 (prompt formats) 的變化,上下文學習可能會表現出高度的不穩定性。因此,構建適當的 prompt 對于提高上下文學習的表現至關重要。

以前的研究通常從兩個方向研究這個問題:1)編碼空間中的提示調整 (prompt tuning);2)在原始空間中進行搜索 (prompt searching)。

Prompt tuning 的關鍵思想是將任務特定的 embedding 注入隱藏層,然后使用基于梯度的優化來調整這些 embeddings。然而,這些方法需要修改模型的原始推理過程并且獲得模型梯度,這在像 GPT-3 和 ChatGPT 這樣的黑盒 LLM 服務中是不切實際的。此外,提示調整會引入額外的計算和存儲成本,這對于 LLM 通常是昂貴的。

更可行且高效的方法是通過在原始文本空間中搜索近似的演示樣本和順序來優化提示。一些工作從 “Global view” 或 “Local view” 構建提示。基于 Global view 的方法通常將提示的不同元素作為整體進行優化,以達到更優異的性能。例如,Diversity-guided [1] 的方法利用演示的整體多樣性的搜索,或者試圖優化整個示例組合順序 [2],以實現更好的性能。與 Global view 相反,基于 Local view 的方法通過設計不同的啟發式選擇標準,例如 KATE [3]。

但這些方法都有各自的局限性:1)目前的大多數研究主要集中在沿著單個因素搜索提示,例如示例選擇或順序。然而各個因素對性能的總體影響尚不清楚;2)這些方法通常基于啟發式標準,需要一個統一的視角來解釋這些方法是如何工作的;3)更重要的是,現有的方法會全局或局部地優化提示,這可能會導致性能不理想。

本文從 “預測偏差” 的角度重新審視了 NLP 領域中的 prompt 優化問題,發現了一個關鍵現象:一個給定的 prompt 的質量取決于它的內在偏差。基于這個現象,文章提出了一個基于預測偏差的替代標準來評估 prompt 的質量,該度量方法能夠在不需要額外開發集 (development set) 的情況下通過單個前向過程來評估 prompt。

具體來說,通過在一個給定的 prompt 下輸入一個 “無內容” 的測試,期望模型輸出一個均勻的預測分布(一個 “無內容” 的輸入不包含任何有用的信息)。因此,文中利用預測分布的均勻性來表示給定 prompt 的預測偏差。

這與先前的后校準方法 [4] 用的指標類似,但與后校準在固定的 prompt 情況下使用這個 metric 進行概率后校準不同的是,文中進一步探索了其在自動搜索近似 prompt 中的應用。并通過大量實驗證實了一個給定 prompt 的內在偏差和它在給定測試集上的平均任務表現之間的相關性。

0da50272-d159-11ed-bfe3-dac502259ad0.png

此外,這種基于偏差的度量使該方法能夠以 “局部到全局” 的方式搜索合適的 prompt。然而,一個現實的問題是無法通過遍歷所有組合的方式搜索最優解,因為它的復雜度將超過 O (N!)。

該工作提出了兩種新穎的策略以高效的方式搜索高質量的 prompt:(1) T-fair-Prompting (2) G-fair-Prompting。T-fair-Prompting 使用一種直觀的方式,首先計算每個示例單獨組成 prompt 的偏差,然后選擇 Top-k 個最公平示例組合成最終 prompt。

這個策略相當高效,復雜度為 O (N)。但需要注意的是,T-fair-Prompting 基于這樣的假設:最優的 prompt 通常是由偏差最小的示例構建的。然而,這在實際情況下可能并不成立,并且往往會導致局部最優解。

因此,文章中進一步介紹了 G-fair-Prompting 來改善搜索質量。G-fair-Prompting 遵循貪心搜索的常規過程,通過在每個步驟上進行局部最優選擇來找到最優解。在算法的每一步,所選擇的示例都能使更新的 prompt 獲得最佳的公平性,最壞情況時間復雜度為 O (N^2),搜索質量顯著提高。G-fair-Prompting 從局部到全局的角度進行工作,其中在早期階段考慮單個樣本的偏差,而在后期階段則側重于減少全局預測偏差。

實驗結果

該研究提出了一種有效和可解釋的方法來提高語言模型的上下文學習性能,這種方法可以應用于各種下游任務。文章驗證了這兩種策略在各種 LLMs(包括 GPT 系列模型和最近發布的 LMaMA 系列)上的有效性,G-fair-Prompting 與 SOTA 方法相比,在不同的下游任務上獲得了超過 10%的相對改進。

0df4d8f6-d159-11ed-bfe3-dac502259ad0.png

與該研究最相近的是 Calibration-before-use [4] 方法,兩者都使用 “無內容” 的輸入提高模型的表現。但是,Calibration-before-use 方法旨在使用該標準來校準輸出,而該輸出仍然容易受到所使用示例的質量的影響。與之相比,本文旨在搜索原始空間找到近似最優的 prompt,以提高模型的性能,而不需要對模型輸出進行任何后處理。此外,該文首次通過大量實驗驗證了預測偏差與最終任務性能之間的聯系,這在 Calibration-before-use 方法中尚未研究。

0e39a0a8-d159-11ed-bfe3-dac502259ad0.png

通過實驗還能發現,即使不進行校準,該文章所提方法選擇的 prompt 也可以優于經過校準的隨機選擇的 prompt。這表明該方法可以在實際應用中具有實用性和有效性,可以為未來的自然語言處理研究提供啟示。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 語言模型
    +關注

    關注

    0

    文章

    527

    瀏覽量

    10283

原文標題:重新審視Prompt優化問題,預測偏差讓語言模型上下文學習更強

文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯網技術研究所】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    為什么transformer性能這么好?Transformer的上下文學習能力是哪來的?

    為什么 transformer 性能這么好?它給眾多大語言模型帶來的上下文學習 (In-Context Learning) 能力是從何而來?在人工智能領域里,transformer 已成為深度
    的頭像 發表于 09-25 12:05 ?1374次閱讀
    為什么transformer性能這么好?Transformer的<b class='flag-5'>上下文學習</b>能力是哪來的?

    關于進程上下文、中斷上下文及原子上下文的一些概念理解

    。而中斷信號的發生是隨機的,中斷處理程序及軟中斷并不能事先預測發生中斷時當前運行的是哪個進程,所以在中斷上下文中引用current是可以的,但沒有意義。 事實上,對于A進程希望等待的中斷信號,可能在B
    發表于 09-06 09:58

    進程上下文與中斷上下文的理解

    來源 網絡一.什么是內核態和用戶態內核態:在內核空間執行,通常是驅動程序,中斷相關程序,內核調度程序,內存管理及其操作程序。用戶態:用戶程序運行空間。 二.什么是進程上下文與中斷上下文1.進程上下文
    發表于 12-11 19:45

    進程上下文/中斷上下文及原子上下文的概念

    為什么會有上下文這種概念進程上下文/中斷上下文及原子上下文的概念
    發表于 01-13 07:17

    基于多Agent的用戶上下文自適應站點構架

    自適應站點很少考慮對用戶環境的自適應。為此,提出用戶上下文自適應站點的概念,給出基于多Agent技術的用戶上下文自適應站點構架模型。闡述用戶上下文獲取、挖掘過程以及站
    發表于 04-11 08:49 ?13次下載

    基于交互上下文預測方法

    傳統的上下文預測是在單用戶的上下文基礎上進行的,忽視了實際普適計算環境中由于用戶交互活動導致的上下文變化因素。為了合理、有效地解決上述局限性問題,該文提出基
    發表于 10-04 14:08 ?7次下載

    終端業務上下文的定義方法及業務模型

    該文針對業務上下文僅關注業務質量較少考慮用戶終端環境的現狀,提出終端業務上下文的概念,為普適業務的開展提供必要的信息支撐。給出一種終端業務上下文的通用定義方法
    發表于 03-06 11:06 ?11次下載

    基于Pocket PC的上下文菜單實現

    介紹了基于 Pocket PC 中的點按操作概念, 論述了在Pocket PC 中上下文菜單的實現原理及方法, 并給出了基于MFC 下的Windows CE 應用程序實現上下文菜單的步驟和代碼實例。
    發表于 07-25 18:26 ?17次下載

    基于Pocket PC的上下文菜單實現

    本文介紹了基于 Pocket PC 中的“點按”操作概念 論述了在 Pocket PC 中上下文菜單的實現原理及方法 并給出了基于 MFC 下的 Windows CE 應用程序實現上下文菜單的步驟和代碼實例 。
    發表于 04-18 10:46 ?0次下載

    基于上下文相似度的分解推薦算法

    模型,再對目標用戶的K個鄰居用戶建立移動用戶一上下文一移動服務三維張量分解模型,獲得目標用戶的移動服務預測值,生成移動推薦。實驗結果顯示,與余弦相似性方法、Pearson相關系數方法和
    發表于 11-27 17:42 ?0次下載

    Web服務的上下文的訪問控制策略模型

    的訪問控制策略模型模型的核心思想是將各種與訪問控制有關的信息統一抽象表示為一個上下文概念,以上下文為中心來制定和執行訪問控制策略,上下文
    發表于 01-05 16:32 ?0次下載

    初學OpenGL:什么是繪制上下文

    初學OpenGL,打開紅寶書,會告訴你OpenGL是個狀態機,OpenGL采用了客戶端-服務器模式,那時覺得好抽象,直到后來了解了繪制上下文才把這些聯系起來。我們可以認為每一個硬件GPU是個服務器
    發表于 04-28 11:47 ?2463次閱讀

    如何分析Linux CPU上下文切換問題

    在我的上一篇文章:《探討 Linux CPU 的上下文切換》中,我談到了 CPU 上下文切換的工作原理。快速回顧一下,CPU 上下文切換是保證 Linux 系統正常運行的核心功能。可分為進程
    的頭像 發表于 05-05 20:11 ?1960次閱讀

    谷歌新作SPAE:GPT等大語言模型可以通過上下文學習解決視覺任務

    這篇論文揭示了 PaLM 或 GPT 在通過上下文學習解決視覺任務方面的能力,并提出了新方法 SPAE(Semantic Pyramid AutoEncoder)。這種新方法使得 LLM 能夠執行圖像生成任務,而無需進行任何參數更新。這也是使用上下文學習使得 LLM 生成
    的頭像 發表于 07-09 15:35 ?1260次閱讀
    谷歌新作SPAE:GPT等大<b class='flag-5'>語言</b><b class='flag-5'>模型</b>可以通過<b class='flag-5'>上下文學習</b>解決視覺任務

    首篇!Point-In-Context:探索用于3D點云理解的上下文學習

    隨著基于廣泛數據訓練的大模型興起,上下文學習(In-Context Learning)已成為一種新的學習范式,在自然語言處理(NLP)和計算機視覺(CV)任務中表現出了巨大的潛力。
    的頭像 發表于 07-13 14:41 ?779次閱讀
    首篇!Point-In-Context:探索用于3D點云理解的<b class='flag-5'>上下文學習</b>
    主站蜘蛛池模板: 韩国演艺圈qvod| 国产区在线不卡视频观看| 被cao的奶水直喷高H| 久久亚洲黄色| 伊人久久艹| 久久成人国产精品一区二区| 亚洲精品国产SUV| 国产亚洲美女在线视频视频 | 亚洲毛片网| 国产网红主播精品福利大秀专区| 特级毛片AAAAAA| 国产精品毛片在线视频| 新新电影理论中文字幕| 国产亚洲制服免视频| 亚洲AV无码影院在线播放| 国产免费变态视频网址网站| 午夜福利视频极品国产83| 国产精品一区二区AV交换| 亚洲AV综合99一二三四区| 国产午夜精品福利久久| 亚洲欧洲一级| 麻豆AV无码蜜臀AV色哟| beeg日本老师按摩| 少妇高潮惨叫久久久久久欧美| 国产传媒精品1区2区3区| 忘忧草高清| 九九久久精品| 91免费网站在线看入口黄| 欧美zzzoooxxx| 大屁股国产白浆一二区| 亚久久伊人精品青青草原2020| 精品欧美一区二区三区四区 | 亚洲国产成人99精品激情在线| 精品少妇高潮蜜臀涩涩AV| 7m凹凸国产刺激在线视频| 日本老妇一级特黄aa大片| 国产免费午夜| 91青青草原| 无码国产色欲XXXX视频| 久久天堂视频| 高H辣肉办公室|