色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

蒸餾也能Step-by-Step:新方法讓小模型也能媲美2000倍體量大模型

智能感知與物聯網技術研究所 ? 來源:智能感知與物聯網技術研 ? 2023-05-15 09:35 ? 次閱讀

大型語言模型能力驚人,但在部署過程中往往由于規模而消耗巨大的成本。華盛頓大學聯合谷歌云計算人工智能研究院、谷歌研究院針對該問題進行了進一步解決,提出了逐步蒸餾(Distilling Step-by-Step)范式幫助模型訓練。該方法在訓練用于特定任務的小型模型方面優于 LLM,訓練數據遠少于傳統的微調和蒸餾。他們的 770M T5 模型在一個基準任務上表現優于 540B PaLM 模型。令人印象深刻的是,他們的模型只使用了可用數據的 80%。

a6df2d78-f2b5-11ed-90ce-dac502259ad0.png

雖然大型語言模型(LLMs)展現了令人印象深刻的少樣本學習能力,但將這樣大規模的模型部署在現實應用中是很難的。為 1750 億參數規模的 LLM 提供服務的專門基礎設施,至少需要 350GB 的 GPU 內存。更甚者,現今最先進的 LLM 是由超過 5000 億的參數組成的,這意味著它需要更多的內存和計算資源。這樣的計算要求對于大多數生產商來說都是難以企及的,更何況是要求低延遲的應用了。

為了解決大型模型的這個問題,部署者往往采用小一些的特定模型來替代。這些小一點的模型用常見范式 —— 微調或是蒸餾來進行訓練。微調使用下游的人類注釋數據升級一個預訓練過的小模型。蒸餾用較大的 LLM 產生的標簽訓練同樣較小的模型。但是很遺憾,這些范式在縮小模型規模的同時也付出了代價:為了達到與 LLM 相當的性能,微調需要昂貴的人類標簽,而蒸餾需要大量很難獲得的無標簽數據。

在一篇題為「Distilling Step-by-Step! Outperforming Larger Language Models with Less Training Data and Smaller Model Sizes」的論文中,來自華盛頓大學、谷歌的研究者引入了一種新的簡單機制 —— 逐步蒸餾(Distilling step-bystep),用于使用更少的訓練數據來訓練更小的模型。這種機制減少了微調和蒸餾 LLM 所需的訓練數據量,使之有更小的模型規模。

a6fce71e-f2b5-11ed-90ce-dac502259ad0.png

論文鏈接:https://arxiv.org/pdf/2305.02301v1.pdf

該機制的核心是換一種角度,將 LLM 看作是可以推理的 agent,而不是噪聲標簽的來源。LLM 可以產生自然語言的理由(rationale),這些理由可以用來解釋和支持模型所預測的標簽。例如,當被問及「一位先生攜帶著打高爾夫球的設備,他可能有什么?(a) 球桿,(b) 禮堂,(c) 冥想中心,(d) 會議,(e) 教堂」,LLM 可以通過思維鏈(CoT)推理回答出「(a)球桿」,并通過說明「答案一定是用來打高爾夫球的東西」來合理化這個標簽。在上述選擇中,只有球桿是用來打高爾夫的。研究者使用這些理由作為額外更豐富的信息在多任務訓練設置中訓練較小的模型,并進行標簽預測和理由預測。

如圖 1 所示,逐步蒸餾可以學習特定任務的小模型,這些模型的參數量還不到 LLM 的 1/500。與傳統的微調或蒸餾相比,逐步蒸餾使用的訓練示例要也少得多。

a71e0d90-f2b5-11ed-90ce-dac502259ad0.png

實驗結果顯示,在 4 個 NLP 基準中,有三個有希望的實驗結論。

第一,相對于微調和蒸餾,逐步蒸餾模型在各數據集上實現了更好的性能,平均減少了 50% 以上的訓練實例(最多可減少 85% 以上)。

第二,我們的模型在模型尺寸更小的情況下表現優于 LLM(最多可以小到 2000 倍),極大地降低了模型部署所需的計算成本。

第三,該研究在縮減模型尺寸的同時,也減少了超越 LLM 所需要的數據量。研究者使用一個 770M 的 T5 模型超越了 540B 參數的 LLM 的性能。這個較小的模型只使用了現有微調方法 80% 的標記數據集。

當只有未標記的數據時,小模型的表現相比 LLM 而言仍然有過之而無不及 —— 只用一個 11B 的 T5 模型就超過了 540B 的 PaLM 的性能。

該研究進一步表明,當一個較小的模型表現比 LLM 差時,與標準的蒸餾方法相比,逐步蒸餾可以更有效地利用額外的無標簽數據來使較小的模型媲美 LLM 的性能。

逐步蒸餾

研究者提出了逐步蒸餾這個新范式,是利用 LLM 對其預測的推理能力,以數據高效率的方式訓練更小的模型。整體框架如圖 2 所示。

a74e0b9e-f2b5-11ed-90ce-dac502259ad0.png

該范式有兩個簡單的步驟:首先,給定一個 LLM 和一個無標簽的數據集,提示 LLM 生成輸出標簽以及證明該標簽成立的理由。理由用自然語言解釋,為模型預測的標簽提供支持(見圖 2)。理由是當前自監督 LLM 的一個涌現的行為屬性。

然后,除了任務標簽之外,利用這些理由來訓練更小的下游模型。說白了,理由能提供了更豐富、更詳細的信息,來說明一個輸入為什么被映射到一個特定的輸出標簽。

實驗結果

研究者在實驗中驗證了逐步蒸餾的有效性。首先,與標準的微調和任務蒸餾方法相比,逐步蒸餾有助于實現更好的性能,訓練實例的數量少得多,大幅提高了學習小型特定任務模型的數據效率。

a773cc4e-f2b5-11ed-90ce-dac502259ad0.png

a7930fa0-f2b5-11ed-90ce-dac502259ad0.png

其次,研究表明,逐步蒸餾方法以更小的模型大小超越了 LLM 的性能,與 llm 相比,大大降低了部署成本。

a7b7f388-f2b5-11ed-90ce-dac502259ad0.png

a7dc5872-f2b5-11ed-90ce-dac502259ad0.png

最后,研究者調查了逐步蒸餾方法在超過 LLM 的性能方面所需的最低資源,包括訓練示例數量和模型大小。他們展示了逐步蒸餾方法通過使用更少的數據和更小的模型,同時提高了數據效率和部署效率。

a8025f5e-f2b5-11ed-90ce-dac502259ad0.png

a82024b2-f2b5-11ed-90ce-dac502259ad0.png

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1791

    文章

    47206

    瀏覽量

    238274
  • 語言模型
    +關注

    關注

    0

    文章

    521

    瀏覽量

    10268
  • 自然語言
    +關注

    關注

    1

    文章

    288

    瀏覽量

    13347

原文標題:蒸餾也能Step-by-Step:新方法讓小模型也能媲美2000倍體量大模型

文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯網技術研究所】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    C語言step-by-step

    C語言step-by-step
    發表于 12-27 09:59

    Altium19 3D STEP模型的導出

    我們的3D模型一般是提供給專業的3D軟件進行一個結構核對,那么Altium Designer 提供導出3D STEP模型的這個功能,結構工程師可以直接導出進行結構核對。接下來以AD19進行講解。1. 首先,我們在AD19中,在F
    發表于 11-22 10:07

    Kicad6.0導出step模型遇到無法導出元件的問題

    RT,kicad6.0版本導出PCB的step文件中,只有pcb的板子模型,而沒有上面元件,有時想確認pcb是否與設計結構相干涉,望大家解答。
    發表于 12-16 15:39

    STEP與WRL 3D模型的區別

    “ KiCad 7支持兩種格式的3D模型STEP和WRL。本文簡述了STEP與WRL的區別,以及這兩種格式在哪些場合應用更合理。 ” 簡介 這兩種格式在本質上是不同的。wrl格式是一種細分的表面
    發表于 06-16 11:26

    keras順序模型與函數式模型

    Sequential,所以順序模型可看做是函數式模型的一種特殊情況。 還有另外一種Model子類的搭建方法,這是利用python call方法
    發表于 08-18 06:01

    提高軟件可靠性模型精度的新方法

    本內容介紹了提高軟件可靠性模型精度的新方法,希望對大家學習上有所幫助
    發表于 05-26 15:50 ?0次下載
    提高軟件可靠性<b class='flag-5'>模型</b>精度的<b class='flag-5'>新方法</b>

    如何使用STEP-BY-STEP在KEIL5中建立TM4C1294項目

    本文檔的主要內容詳細介紹的是如何使用STEP-BY-STEP在KEIL5中建立TM4C1294項目。
    發表于 05-20 17:37 ?23次下載
    如何使用<b class='flag-5'>STEP-BY-STEP</b>在KEIL5中建立TM4C1294項目

    ADL6012三維模型(*.step文件)

    ADL6012三維模型(*.step文件)
    發表于 03-22 22:51 ?5次下載
    ADL6012三維<b class='flag-5'>模型</b>(*.<b class='flag-5'>step</b>文件)

    ADIS16460 3-D模型(.step文件)

    ADIS16460 3-D模型(.step文件)
    發表于 06-01 11:16 ?6次下載
    ADIS16460 3-D<b class='flag-5'>模型</b>(.<b class='flag-5'>step</b>文件)

    STM32 Step-by-Step如何加快開發速度

    STM32 Step-by-Step 的另一個基本方面是我們的新社區。多年來,許多成員都表達了學習如何在我們的平臺上開始編程的愿望,而這一新舉措為他們提供了專業知識。
    的頭像 發表于 05-16 16:23 ?1348次閱讀

    Altium Designer導出3D STEP模型方法

    3D STEP 模型一般是提供給專業的3D軟件進行結構核對,如Pro/Engineer。Altium Designer 提供導出3D STEP模型的功能,結構工程師可以直接導出進行結構
    的頭像 發表于 10-12 09:22 ?4.3w次閱讀

    南開/南理工/曠視提出CTKD:動態溫度超參蒸餾新方法

    一直保持靜態固定的溫度超參對學生模型來說不是最優的。基于課程學習的思想,人類在學習過程中都是由簡單到困難的學習知識。那么在蒸餾的過程中,我們會希望模型一開始
    的頭像 發表于 01-04 14:49 ?822次閱讀

    基于一步步蒸餾(Distilling step-by-step)機制

    為優化LLM為“小模型/少數據/好效果”,提供了一種新思路:”一步步蒸餾”(Distilling step-by-step
    的頭像 發表于 05-16 10:24 ?1228次閱讀
    基于一步步<b class='flag-5'>蒸餾</b>(Distilling <b class='flag-5'>step-by-step</b>)機制

    任意模型都能蒸餾!華為諾亞提出異構模型的知識蒸餾方法

    相比于僅使用logits的蒸餾方法,同步使用模型中間層特征進行蒸餾方法通常能取得更好的性能。然而在異構
    的頭像 發表于 11-01 16:18 ?1005次閱讀
    任意<b class='flag-5'>模型</b>都能<b class='flag-5'>蒸餾</b>!華為諾亞提出異構<b class='flag-5'>模型</b>的知識<b class='flag-5'>蒸餾</b><b class='flag-5'>方法</b>

    模型應用Step-By-Step

    導讀: 本文主要介紹:智能聊天、PPT生成、與PDF文件智能對話、數字人創作、藝術創作。 作者:王禹展 部門:京東健康-技術產品部-供應鏈研發部-B2B研發組 一、大模型應用分享 1 Monica
    的頭像 發表于 07-01 18:03 ?331次閱讀
    大<b class='flag-5'>模型</b>應用<b class='flag-5'>Step-By-Step</b>
    主站蜘蛛池模板: 啦啦啦视频在线观看WWW| 亚洲国产在线2o20| 日本学生VIDEOVIDEOS更新| 兽交白浆喷水高潮| 一个色综合久久| no视频在线观看| 国内高清在线观看视频| 免费看黄色小说| 偷拍自偷拍亚洲精品| 在线不卡中文字幕| 国产 交换 丝雨 巅峰| 久久精品国产视频澳门| 日操夜操天天操| 淫品色影院| 丰满的女友1在线观看| 久久精品免费电影| 日日夜夜天天操| 永久adc视频年龄确认| 父亲猜女儿在线观看| 久久香蕉国产线看观看首页| 受被攻做到腿发颤高h文| 37pao成人国产永久免费视频| 国产高清视频a在线大全| 蜜芽国产在线精品欧美| 午夜在线观看免费完整直播网| 99精品福利视频| 国产做国产爱免费视频| 人人看人人看| 中国女人逼| 国产婷婷午夜精品无码A片| 欧式午夜理伦三级在线观看| 亚洲手机在线人成视频| 丰满的美女射精动态图| 免费xxx成年大片| 亚洲欧美成人综合| 国产不卡视频在线| 女人精69xxxxx舒心| 伊人久久网国产伊人| 国产精品自在在线午夜蜜芽tv在线| 欧美残忍xxxx极端| 伊在香蕉国产在线视频|