色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

自然語言處理或將迎來新的范式變遷

深度學習自然語言處理 ? 來源:李rumor ? 作者:車萬翔 ? 2022-12-08 16:59 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

最近幾天被OpenAI推出的ChatGPT[1]刷屏了,其影響已經不僅局限于自然語言處理(NLP)圈,就連投資圈也開始蠢蠢欲動了,短短幾天ChatGPT的用戶數就超過了一百萬。通過眾多網友以及我個人對其測試的結果看,ChatGPT的效果可以用驚艷來形容,具體結果我在此就不贅述了。不同于GPT-3剛推出時人們的反應,對ChatGPT大家發出更多的是贊嘆之詞。聊天、問答、寫作、編程等等,樣樣精通。因此也有人驚呼,“通用人工智能(AGI)即將到來”、“Google等傳統搜索引擎即將被取代”,所以也對傳說中即將發布的GPT-4更加期待。

從技術角度講,ChatGPT還是基于大規模預訓練語言模型(GPT-3.5)強大的語言理解和生成的能力,并通過在人工標注和反饋的大規模數據上進行學習,從而讓預訓練語言模型能夠更好地理解人類的問題并給出更好的回復。這一點上和OpenAI于今年3月份推出的InstructGPT[2]是一致的,即通過引入人工標注和反饋,解決了自然語言生成結果不易評價的問題,從而就可以像玩兒游戲一樣,利用強化學習技術,通過嘗試生成不同的結果并對結果進行評分,然后鼓勵評分高的策略、懲罰評分低的策略,最終獲得更好的模型。

不過說實話,我當時并不看好這一技術路線,因為這仍然需要大量的人工勞動,本質上還是一種“人工”智能。不過ChatGPT通過持續投入大量的人力,把這條路走通了,從而更進一步驗證了那句話,“有多少人工,就有多少智能”。

不過,需要注意的是,ChatGPT以及一系列超大規模預訓練語言模型的成功將為自然語言處理帶來新的范式變遷,即從以BERT為代表的預訓練+精調(Fine-tuning)范式,轉換為以GPT-3為代表的預訓練+提示(Prompting)的范式[3]。所謂提示,指的是通過構造自然語言提示符(Prompt),將下游任務轉化為預訓練階段的語言模型任務。例如,若想識別句子“我喜歡這部電影?!钡那楦袃A向性,可以在其后拼接提示符“它很 ”。如果預訓練模型預測空格處為“精彩”,則句子大概率為褒義。這樣做的好處是無需精調整個預訓練模型,就可以調動模型內部的知識,完成“任意”的自然語言處理任務。當然,在ChatGPT出現之前,這種范式轉變的趨勢并不明顯,主要有兩個原因:

第一,GPT-3級別的大模型基本都掌握在大公司手里,因此學術界在進行預訓練+提示的研究時基本都使用規模相對比較小的預訓練模型。由于規模規模不夠大,因此預訓練+提示的效果并不比預訓練+精調的效果好。而只有當模型的規模足夠大后,才會涌現(Emerge)出“智能”[4]。最終,導致之前很多在小規模模型上得出的結論,在大規模模型下都未必適用了。

第二,如果僅利用預訓練+提示的方法,由于預訓練的語言模型任務和下游任務之間差異較大,導致這種方法除了擅長續寫文本這種預訓練任務外,對其他任務完成得并不好。因此,為了應對更多的任務,需要在下游任務上繼續預訓練(也可以叫預精調),而且現在的趨勢是在眾多的下游任務上預精調大模型,以應對多種、甚至未曾見過的新任務[5]。所以更準確地說,預訓練+預精調+提示將成為自然語言處理的新范式。

不同于傳統預訓練+精調范式,預訓練+預精調+提示范式將過去一個自然語言處理模型擅長處理一個具體任務的方式,轉換為了用一個模型處理多個任務,甚至未曾見過的通用任務的方式。所以從這個角度來講,通用人工智能也許真的即將到來了。這似乎也和我幾年前的預測相吻合,我當時曾預測,“結合自然語言處理歷次范式變遷的規律(圖1),2018年預訓練+精調的范式出現之后5年,即2023年自然語言處理也許將迎來新的范式變遷”。

30d6543e-76c4-11ed-8abf-dac502259ad0.jpg

那么,接下來如何進一步提升預訓練+預精調+提示新范式的能力,并在實際應用中將其落地呢?

首先,顯式地利用人工標注和反饋仍然費時費力,我們應該設法更自然地獲取并利用人類的反饋。也就是在實際應用場景中,獲取真實用戶的自然反饋,如其回復的語句、所做的行為等,并利用這些反饋信息提升系統的性能,我們將這種方式稱為交互式自然語言處理。不過用戶的交互式反饋相對稀疏,并且有些用戶會做出惡意的反饋,如何克服稀疏性以及避免惡意性反饋都將是亟待解決的問題。

其次,目前該范式生成的自然語言文本具有非常好的流暢性,但是經常會出現事實性錯誤,也就是會一本正經地胡說八道。當然,使用上面的交互式自然語言處理方法可以一定程度上解決此類問題,不過對于用戶都不知道答案的問題,他們是無法對結果進行反饋的。此時又回到了可解釋性差,這一深度學習模型的老問題上。如果能夠像寫論文時插入參考文獻一樣,在生成的結果中插入相關信息的出處,則會大大提高結果的可解釋性。

最后,該范式依賴超大規模預訓練語言模型,然而這些模型目前只掌握在少數的大公司手中,即便有個別開源的大模型,由于其過于龐大,小型公司或研究組也無法下載并使用它們。所以,在線調用是目前使用這些模型最主要的模式。在該模式下,如何針對不同用戶面對的不同任務,使用用戶私有的數據對模型進行進一步預精調,并且不對公有的大模型造成影響,成為該范式實際應用落地所迫切需要解決的問題。此外,為了提高系統的運行速度,如何通過在線的大模型獲得離線的小模型,并且讓離線小模型保持大模型在某些任務上的能力,也成為模型能實際應用的一種解決方案。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1807

    文章

    49029

    瀏覽量

    249607
  • nlp
    nlp
    +關注

    關注

    1

    文章

    490

    瀏覽量

    22626

原文標題:哈工大車萬翔:自然語言處理范式正在變遷

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 0人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    如何優化自然語言處理模型的性能

    優化自然語言處理(NLP)模型的性能是一個多方面的任務,涉及數據預處理、特征工程、模型選擇、模型調參、模型集成與融合等多個環節。以下是一些具體的優化策略: 一、數據預處理優化 文本清洗
    的頭像 發表于 12-05 15:30 ?1708次閱讀

    如何使用自然語言處理分析文本數據

    使用自然語言處理(NLP)分析文本數據是一個復雜但系統的過程,涉及多個步驟和技術。以下是一個基本的流程,幫助你理解如何使用NLP來分析文本數據: 1. 數據收集 收集文本數據 :從各種來源(如社交
    的頭像 發表于 12-05 15:27 ?1586次閱讀

    自然語言處理與機器學習的關系 自然語言處理的基本概念及步驟

    Learning,簡稱ML)是人工智能的一個核心領域,它使計算機能夠從數據中學習并做出預測決策。自然語言處理與機器學習之間有著密切的關系,因為機器學習提供了一種強大的工具,用于從大量文本數據中提取模式和知識,從而提高NLP系
    的頭像 發表于 12-05 15:21 ?1988次閱讀

    語音識別與自然語言處理的關系

    在人工智能的快速發展中,語音識別和自然語言處理(NLP)成為了兩個重要的技術支柱。語音識別技術使得機器能夠理解人類的語音,而自然語言處理則讓機器能夠理解、解釋和生成人類
    的頭像 發表于 11-26 09:21 ?1507次閱讀

    什么是LLM?LLM在自然語言處理中的應用

    隨著人工智能技術的飛速發展,自然語言處理(NLP)領域迎來了革命性的進步。其中,大型語言模型(LLM)的出現,標志著我們對語言理解能力的一次
    的頭像 發表于 11-19 15:32 ?3665次閱讀

    ASR與自然語言處理的結合

    。以下是對ASR與自然語言處理結合的分析: 一、ASR與NLP的基本概念 ASR(自動語音識別) : 專注于人類的語音轉換為文字。 涉及從聲音信號中提取特征,并將這些特征映射到文本。 NLP(
    的頭像 發表于 11-18 15:19 ?1026次閱讀

    卷積神經網絡在自然語言處理中的應用

    。 卷積神經網絡的基本原理 卷積神經網絡是一種前饋神經網絡,它通過卷積層來提取輸入數據的特征。在圖像處理中,卷積層能夠捕捉局部特征,如邊緣和紋理。在自然語言處理中,我們可以文本視為一
    的頭像 發表于 11-15 14:58 ?807次閱讀

    循環神經網絡在自然語言處理中的應用

    自然語言處理(NLP)是人工智能領域的一個重要分支,它致力于使計算機能夠理解、解釋和生成人類語言。隨著深度學習技術的發展,循環神經網絡(RNN)因其在處理序列數據方面的優勢而在NLP中
    的頭像 發表于 11-15 09:41 ?820次閱讀

    使用LSTM神經網絡處理自然語言處理任務

    自然語言處理(NLP)是人工智能領域的一個重要分支,它旨在使計算機能夠理解、解釋和生成人類語言。隨著深度學習技術的發展,特別是循環神經網絡(RNN)及其變體——長短期記憶(LSTM)網絡的出現
    的頭像 發表于 11-13 09:56 ?1166次閱讀

    自然語言處理的未來發展趨勢

    隨著技術的進步,自然語言處理(NLP)已經成為人工智能領域的一個重要分支。NLP的目標是使計算機能夠理解、解釋和生成人類語言,這不僅涉及到語言的表層形式,還包括
    的頭像 發表于 11-11 10:37 ?1727次閱讀

    自然語言處理與機器學習的區別

    是計算機科學、人工智能和語言學領域的分支,它致力于使計算機能夠理解、解釋和生成人類語言。NLP的目標是縮小人類語言和計算機之間的差距,使計算機能夠處理和生成
    的頭像 發表于 11-11 10:35 ?1557次閱讀

    自然語言處理的應用實例

    在當今數字化時代,自然語言處理(NLP)技術已經成為我們日常生活的一部分。從智能手機的語音助手到在線客服機器人,NLP技術的應用無處不在。 1. 語音識別與虛擬助手 隨著Siri、Google
    的頭像 發表于 11-11 10:31 ?1618次閱讀

    使用LLM進行自然語言處理的優缺點

    自然語言處理(NLP)是人工智能和語言學領域的一個分支,它致力于使計算機能夠理解、解釋和生成人類語言。大型語言模型(LLM)是NLP領域的一
    的頭像 發表于 11-08 09:27 ?2461次閱讀

    Llama 3 在自然語言處理中的優勢

    自然語言處理(NLP)的快速發展中,我們見證了從基于規則的系統到基于機器學習的模型的轉變。隨著深度學習技術的興起,NLP領域迎來了新的突破。Llama 3,作為一個假設的先進NLP模型,代表了這一
    的頭像 發表于 10-27 14:22 ?733次閱讀

    AI智能化問答:自然語言處理技術的重要應用

    自然語言處理(NLP)是人工智能領域的一個重要分支,它致力于使計算機能夠理解、解釋和生成人類語言。問答系統作為NLP的一個重要應用,能夠精確地解析用戶以自然語言提出的問題,并從包含豐富
    的頭像 發表于 10-12 10:58 ?1097次閱讀
    AI智能化問答:<b class='flag-5'>自然語言</b><b class='flag-5'>處理</b>技術的重要應用
    主站蜘蛛池模板: 日本无码色哟哟婷婷最新网站 | 麻豆精品人妻一区二区三区蜜桃 | 视频在线免费观看 | 99久女女精品视频在线观看 | 伊人久久大香线蕉综合网站 | 簧片在线免费观看 | 亚洲精品无码成人AAA片 | a毛片基地免费全部视频 | 色中色入口2015 | 亚洲精品123区 | 手机在线免费看毛片 | 一道本无吗d d在线播放 | 国产成人久视频免费 | 蜜芽亚洲欧美一区二区电影 | 色噜噜狠狠色综合中文字幕 | 国产精品人妻无码久久久蜜桃臀 | 草民电影网午夜伦理电影网 | 亚洲欧美一区二区成人片 | 成人国产在线24小时播放视频 | 91chinesevideo| 亚洲 日本 天堂 国产 在线 | 久久re视频这里精品免费1 | 美女胸禁止18以下看 | 国产剧情在线精品视频不卡 | 人妻体体内射精一区二区 | 日韩久久影院 | 理论片87福利理论电影 | 色欲AV色欲AV久久麻豆 | 簧片在线观看 | 精品淑女少妇AV久久免费 | X8X8拨牐拨牐X8免费视频8午夜 | 忘忧草下载 | 99久久免费国产精精品 | 国产精品97久久久久久AV色戒 | adc影院欢迎您大驾光临入口 | 99热在线观看精品 | 久久精品国产亚洲AV麻豆欧美玲 | 亚洲AV久久无码精品热九九 | 男同志china免费视频 | np高h肉辣一女多男 no视频在线观看 | 亚洲AV美女成人网站P站 |

    電子發燒友

    中國電子工程師最喜歡的網站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品