色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

ChatGPT從入門到深入

深度學習自然語言處理 ? 來源:無數據不智能 ? 2023-05-16 10:42 ? 次閱讀

ChatGPT從入門到深入(持續更新中)

循環記憶輸入

Recurrent Memory Transformer (RMT)

1d61838c-f35c-11ed-90ce-dac502259ad0.png

總體思想:將長文本分段之后得到嵌入向量與記憶向量拼接,得到新的記憶向量之后與下一段再循環輸入transformer。

注意:此論文實驗結果在bert-base-cased(encoder-only上進行實驗)

1d887064-f35c-11ed-90ce-dac502259ad0.png

CoLT5達到64K,GPT-4達到32K長度,而RMT在實驗結果中長度加到4096個分段2048000詞匯,效果依然強勁。

用提示詞

Self-Controlled Memory (SCM)

1db53306-f35c-11ed-90ce-dac502259ad0.png

如上圖所示,此方法號稱可以將輸入延申至無限長,具體流程為:

  1. 用戶輸入

  2. 判斷是否需要從歷史會話中獲得記憶,提示詞如下:

    給定一個用戶指令,判斷執行該指令是否需要歷史信
    息或者上文的信息,或者需要回憶對話內容,只需要
    回答是(A)或者否(B),不需要解釋信息:
    指令:[用戶輸入]
    
  3. 如果需要獲取記憶,通過相關性(余弦相似度)、近期性分數相加對歷史記憶進行排序

  4. 將記憶摘要

    以下是用戶和人工智能助手的一段對話,請分
    別用一句話寫出用戶摘要、助手摘要,分段列
    出,要求盡可能保留用戶問題和助手回答的關
    鍵信息。
    對話內容:
    用戶:[用戶輸入]
    助手:[系統回復]
    摘要:
    
  5. 將記憶和輸入拼接輸入模型

    以下是用戶和人工智能助手的對話,請根據歷史
    對話內容,回答用戶當前問題:
    相關歷史對話:
    [歷史輪對話內容]
    上一輪對話:
    [上一輪對話內容]
    ###
    用戶:[用戶問題]
    助手:
    
  6. 回復

注意:此論文中只進行了定性分析,沒有定量實驗。以下是效果圖:

1e0293bc-f35c-11ed-90ce-dac502259ad0.png

詞匯壓縮

VIP-token centric compression (Vcc)

1e5d10bc-f35c-11ed-90ce-dac502259ad0.png

該方法使得模型輸入延申至128K,并在Encoder-Only、Encoder-Decoder兩種模型架構上都進行了實驗。

一句話描述思想:使模型輸入長度獨立于文本長度。

具體一點:

  1. 將當前問句視為vip-token
  2. 利用當前問句與歷史記憶的關系,壓縮歷史記憶到模型輸入長度,無論歷史記憶有多長
  3. transformer層輸出之后再進行解壓縮

Encoder-Only架構表現:

1e9f5b66-f35c-11ed-90ce-dac502259ad0.png

Encoder-Decoder表現:

1ec22858-f35c-11ed-90ce-dac502259ad0.png

檢索+交叉注意力

Unlimited Length Input Transformers (Unlimiformer)

1f1d2a50-f35c-11ed-90ce-dac502259ad0.png

此方法只試用于Encoder-Decoder架構,其也稱可以將輸入長度延申至無限長。

思路如下:

  1. 將長文本分成多個部分,將每一段進行編碼
  2. 利用query KNN檢索長文本topN
  3. 解碼器對相關段落編碼后的隱藏狀態進行交叉注意力
  4. 得到輸出

可以看到此方法在長文本摘要任務上都取得了優異的結果

1f61dba0-f35c-11ed-90ce-dac502259ad0.png

累加

ALiBi(attention with linear biases),輸出累加

1f87801c-f35c-11ed-90ce-dac502259ad0.png

簡單介紹一下ALiBi:

  1. 不再輸入層保留位置向量
  2. 而在每層注入線性的偏移量,注意力分數從:

變成了:

可以看到ALiBi比Sinusoidal、Rotary、T5 Bias在長距離輸入上效果都要好得多。

1fa12fb2-f35c-11ed-90ce-dac502259ad0.png

mosaicml/mpt-7b模型利用ALiBi將輸入長度擴展至了84k,核心的思想為一下幾行代碼:

all_hidden_states=()ifoutput_hidden_stateselseNone
for(b_idx,block)inenumerate(self.blocks):
ifoutput_hidden_states:
assertall_hidden_statesisnotNone
all_hidden_states=all_hidden_states+(x,)
past_key_value=past_key_values[b_idx]ifpast_key_valuesisnotNoneelseNone
(x,past_key_value)=block(x,past_key_value=past_key_value,attn_bias=attn_bias,attention_mask=attention_mask,is_causal=self.is_causal)
ifpast_key_valuesisnotNone:
past_key_values[b_idx]=past_key_value

即MPT會對上次得到隱藏狀態與本次的輸入進行相加。


審核編輯 :李倩


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1792

    文章

    47442

    瀏覽量

    239006
  • ChatGPT
    +關注

    關注

    29

    文章

    1564

    瀏覽量

    7823

原文標題:引用

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    C嵌入式C編程語言_入門·實用·深入_10...

    C嵌入式C編程語言_入門·實用·深入_10...
    發表于 08-18 07:37

    stm32入門精通

    stm32入門精全部資料
    發表于 03-27 18:54

    科技大廠競逐AIGC,中國的ChatGPT在哪?

    產業版ChatGPT--ChatJD。 可見,大廠的態度十分鮮明:ChatGPT已經是既定的未來,這場新的科技競技賽哨聲響起,誰都不甘落于下風。科技巨頭,行業龍頭,中國企業競逐A
    發表于 03-03 14:28

    DSP入門精通全集

    DSP入門精通全集
    發表于 03-30 23:20 ?8487次下載

    nios入門精通

    nios入門精通
    發表于 07-08 16:55 ?0次下載

    Ubuntu入門精通

    《Ubuntu入門精通》Ubuntu一般是作為學習linux的入門操作系統,界面良好,現在已經非常流行,書中講的很多系統的使用技巧
    發表于 10-30 17:14 ?167次下載

    《HTML 5 入門精通》-中文學習教程

    《HTML 5 入門精通》-中文學習教程.pdf 《HTML 5 入門精通》-中文學習教
    發表于 11-02 17:45 ?0次下載

    Protel 99入門精通資料

    Protel 99入門篇 Protel 99入門
    發表于 12-09 16:30 ?0次下載

    單片機入門精通

    單片機入門的必備程序 通過練習 層層深入 穩步提高
    發表于 01-19 11:34 ?11次下載

    Unity5 入門精通

    Unity5 入門精通。
    發表于 04-18 14:26 ?6次下載

    開關電容電路入門精通

    圖靈 開關電容電路 入門精通
    發表于 12-29 20:39 ?58次下載

    C游戲編程入門精通

    C游戲編程入門精通
    發表于 03-31 15:56 ?0次下載

    電工基礎入門知識大全入門精通

    本文檔內容介紹了電工基礎入門知識大全,電工新手學什么電工入門
    發表于 09-23 11:59 ?538次下載
    電工基礎<b class='flag-5'>入門</b>知識大全<b class='flag-5'>從</b><b class='flag-5'>入門</b><b class='flag-5'>到</b>精通

    ChatGPT入門指南

      ChatGPT入門指南   什么是ChatGPT?   為什么ChatGPT意義重大?   如何使用ChatGPT
    發表于 02-10 11:19 ?7次下載
    <b class='flag-5'>ChatGPT</b><b class='flag-5'>入門</b>指南

    Android Studio入門精通

    Android Studio入門精通.pdf
    發表于 08-14 15:05 ?6次下載
    主站蜘蛛池模板: 1788福利视频在视频线| 最近高清日本免费| 青青伊人久久| 色久久久综合88一本道| 色www.亚洲免费视频| 小骚妇BBBXXX| 达达兔午夜一级毛片| 亚洲午夜久久影院| 日韩精品一区二区中文| 动漫美女禁区| 日本无卡无吗在线| 97在线精品视频| 攻把受做得合不拢腿play| 久久精品国产色蜜蜜麻豆国语版 | 成人区精品一区二区不卡AV免费| 91原创在线| 综合亚洲桃色第一影院| 国产黄片毛片| 尿了么app| 亚洲欧美韩国综合色| 99re热有精品国产| asian4you裸模| 国产久久热99视频| 久久蜜视频| 午夜免费小视频| 亚洲精品无码葡京AV天堂| 97成人免费视频| 国内精品七七久久影院| 人妻精品久久无码专区| 67194在线入口免费| 嫩草影院地址一二三| 亚洲人成伊人成综合网久久久| 久久999视频| 亚洲高清视频免费| 久久99国产精品自在自在| 亚洲国产在线精品国| 久久精品国产亚洲AV忘忧草蜜臀| 亚洲欧美自拍明星换脸| 国产午夜亚洲精品不卡电影| 四虎精品久久| 国产午夜精品不卡视频|