色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

張俊林:ChatGPT會成為下一代搜索引擎嗎

深度學習自然語言處理 ? 來源:深度學習自然語言處理 ? 作者:深度學習自然語言 ? 2022-12-07 11:02 ? 次閱讀

本文將從以下幾個方面展開:

引言

ChatGPT的技術原理

ChatGPT能否取代Google、百度等傳統搜索引

點擊這里進群—>加入NLP交流群

引言

作為智能對話系統,ChatGPT最近兩天爆火,都火出技術圈了,網上到處都在轉ChatGPT相關的內容和測試例子,效果確實很震撼。我記得上一次能引起如此轟動的AI技術,NLP領域是GPT 3發布,那都是兩年半前的事了,當時人工智能如日中天如火如荼的紅火日子,今天看來恍如隔世;多模態領域則是以DaLL E2、Stable Diffusion為代表的Diffusion Model,這是最近大半年火起來的AIGC模型;而今天,AI的星火傳遞到了ChatGPT手上,它毫無疑問也屬于AIGC范疇。所以說,在AI泡沫破裂后處于低谷期的今天,AIGC確實是給AI續命的良藥,當然我們更期待估計很快會發布的GPT 4,愿OpenAI能繼續撐起局面,給行業帶來一絲暖意。

說回ChatGPT,例子就不舉了,在網上漫山遍野都是,我們主要從技術角度來聊聊。那么,ChatGPT到底是采用了怎樣的技術,才能做到如此超凡脫俗的效果?既然chatGPT功能如此強大,那么它可以取代Google、百度等現有搜索引擎嗎?如果能,那是為什么,如果不能,又是為什么?

本文試圖從我個人理解的角度,來嘗試回答上述問題,很多個人觀點,偏頗難免,還請謹慎參考。我們首先來看看ChatGPT到底做了什么才獲得如此好的效果。

ChatGPT的技術原理

整體技術路線上,ChatGPT在效果強大的GPT 3.5大規模語言模型(LLM,Large Language Model)基礎上,引入“人工標注數據+強化學習”(RLHF,Reinforcement Learning from Human Feedback ,這里的人工反饋其實就是人工標注數據)來不斷Fine-tune預訓練語言模型,主要目的是讓LLM模型學會理解人類的命令指令的含義(比如給我寫一段小作文生成類問題、知識回答類問題、頭腦風暴類問題等不同類型的命令),以及讓LLM學會判斷對于給定的prompt輸入指令(用戶的問題),什么樣的答案是優質的(富含信息、內容豐富、對用戶有幫助、無害、不包含歧視信息等多種標準)。

在“人工標注數據+強化學習”框架下,具體而言,ChatGPT的訓練過程分為以下三個階段:

3d8a04bc-75db-11ed-8abf-dac502259ad0.jpg

ChatGPT:第一階段

第一階段:冷啟動階段的監督策略模型。靠GPT 3.5本身,盡管它很強,但是它很難理解人類不同類型指令中蘊含的不同意圖,也很難判斷生成內容是否是高質量的結果。為了讓GPT 3.5初步具備理解指令中蘊含的意圖,首先會從測試用戶提交的prompt(就是指令或問題)中隨機抽取一批,靠專業的標注人員,給出指定prompt的高質量答案,然后用這些人工標注好的數據來Fine-tune GPT 3.5模型。經過這個過程,我們可以認為GPT 3.5初步具備了理解人類prompt中所包含意圖,并根據這個意圖給出相對高質量回答的能力,但是很明顯,僅僅這樣做是不夠的。

3da377a8-75db-11ed-8abf-dac502259ad0.jpg

ChatGPT:第二階段

第二階段:訓練回報模型(Reward Model,RM)。這個階段的主要目的是通過人工標注訓練數據,來訓練回報模型。具體而言,隨機抽樣一批用戶提交的prompt(大部分和第一階段的相同),使用第一階段Fine-tune好的冷啟動模型,對于每個prompt,由冷啟動模型生成K個不同的回答,于是模型產生出了,….數據。之后,標注人員對K個結果按照很多標準(上面提到的相關性、富含信息性、有害信息等諸多標準)綜合考慮進行排序,給出K個結果的排名順序,這就是此階段人工標注的數據。

接下來,我們準備利用這個排序結果數據來訓練回報模型,采取的訓練模式其實就是平常經常用到的pair-wise learning to rank。對于K個排序結果,兩兩組合,形成 inom{k}{2} 個訓練數據對,ChatGPT采取pair-wise loss來訓練Reward Model。RM模型接受一個輸入,給出評價回答質量高低的回報分數Score。對于一對訓練數據,我們假設人工排序中answer1排在answer2前面,那么Loss函數則鼓勵RM模型對的打分要比的打分要高。

歸納下:在這個階段里,首先由冷啟動后的監督策略模型為每個prompt產生K個結果,人工根據結果質量由高到低排序,以此作為訓練數據,通過pair-wise learning to rank模式來訓練回報模型。對于學好的RM模型來說,輸入,輸出結果的質量得分,得分越高說明產生的回答質量越高。

3dbbb098-75db-11ed-8abf-dac502259ad0.jpg

chatGPT:第三階段

第三階段:采用強化學習來增強預訓練模型的能力。本階段無需人工標注數據,而是利用上一階段學好的RM模型,靠RM打分結果來更新預訓練模型參數。具體而言,首先,從用戶提交的prompt里隨機采樣一批新的命令(指的是和第一第二階段不同的新的prompt,這個其實是很重要的,對于提升LLM模型理解instruct指令的泛化能力很有幫助),且由冷啟動模型來初始化PPO模型的參數。然后,對于隨機抽取的prompt,使用PPO模型生成回答answer, 并用上一階段訓練好的RM模型給出answer質量評估的回報分數score,這個回報分數就是RM賦予給整個回答(由單詞序列構成)的整體reward。有了單詞序列的最終回報,就可以把每個單詞看作一個時間步,把reward由后往前依次傳遞,由此產生的策略梯度可以更新PPO模型參數。這是標準的強化學習過程,目的是訓練LLM產生高reward的答案,也即是產生符合RM標準的高質量回答。

如果我們不斷重復第二和第三階段,很明顯,每一輪迭代都使得LLM模型能力越來越強。因為第二階段通過人工標注數據來增強RM模型的能力,而第三階段,經過增強的RM模型對新prompt產生的回答打分會更準,并利用強化學習來鼓勵LLM模型學習新的高質量內容,這起到了類似利用偽標簽擴充高質量訓練數據的作用,于是LLM模型進一步得到增強。顯然,第二階段和第三階段有相互促進的作用,這是為何不斷迭代會有持續增強效果的原因。

盡管如此,我覺得第三階段采用強化學習策略,未必是ChatGPT模型效果特別好的主要原因。假設第三階段不采用強化學習,換成如下方法:類似第二階段的做法,對于一個新的prompt,冷啟動模型可以產生k個回答,由RM模型分別打分,我們選擇得分最高的回答,構成新的訓練數據,去fine-tune LLM模型。假設換成這種模式,我相信起到的作用可能跟強化學習比,雖然沒那么精巧,但是效果也未必一定就差很多。第三階段無論采取哪種技術模式,本質上很可能都是利用第二階段學會的RM,起到了擴充LLM模型高質量訓練數據的作用。

以上是ChatGPT的訓練流程,主要參考自instructGPT的論文,ChatGPT是改進的instructGPT,改進點主要在收集標注數據方法上有些區別,在其它方面,包括在模型結構和訓練流程等方面基本遵循instructGPT。可以預見的是,這種Reinforcement Learning from Human Feedback技術會快速蔓延到其它內容生成方向,比如一個很容易想到的,類似“A machine translation model based on Reinforcement Learning from Human Feedback”這種,其它還有很多。但是,我個人認為,在NLP的某個具體的內容生成領域再采用這個技術意義應該已經不大了,因為chatGPT本身能處理的任務類型非常多樣化,基本涵蓋了NLP生成的很多子領域,所以某個NLP子領域如果再單獨采用這個技術其實已經不具備太大價值,因為它的可行性可以認為已經被chatGPT驗證了。如果把這個技術應用在比如圖片、音頻視頻等其它模態的生成領域,可能是更值得探索的方向,也許不久后我們就會看到類似“A XXX diffusion model based on Reinforcement Learning from Human Feedback”,諸如此類,這類工作應該還是很有意義的。

另外一個值得關注的采取類似技術的工作是DeepMind的sparrow,這個工作發表時間稍晚于instructGPT,如果你仔細分析的話,大的技術思路和框架與instructGPT的三階段基本類似,不過明顯sparrow在人工標注方面的質量和工作量是不如instructGPT的。反過來,我覺得sparrow里把回報模型分為兩個不同RM的思路,是優于instructGPT的,至于原因在下面小節里會講。

chatGPT能否取代Google、百度等傳統搜索引擎

既然看上去chatGPT幾乎無所不能地回答各種類型的prompt,那么一個很自然的問題就是:ChatGPT或者未來即將面世的GPT4,能否取代Google、百度這些傳統搜索引擎呢?我個人覺得目前應該還不行,但是如果從技術角度稍微改造一下,理論上是可以取代傳統搜索引擎的。

3dc7b910-75db-11ed-8abf-dac502259ad0.jpg

為什么說目前形態的chatGPT還不能取代搜索引擎呢?主要有三點原因:首先,對于不少知識類型的問題,chatGPT會給出看上去很有道理,但是事實上是錯誤答案的內容(參考上圖的例子(from @Gordon Lee),ChatGPT的回答看著胸有成竹,像我這么沒文化的基本看了就信了它,回頭查了下這首詞里竟然沒這兩句),考慮到對于很多問題它又能回答得很好,這將會給用戶造成困擾:如果我對我提的問題確實不知道正確答案,那我是該相信ChatGPT的結果還是不該相信呢?此時你是無法作出判斷的。這個問題可能是比較要命的。其次,ChatGPT目前這種基于GPT大模型基礎上進一步增加標注數據訓練的模式,對于LLM模型吸納新知識是非常不友好的。新知識總是在不斷出現,而出現一些新知識就去重新預訓練GPT模型是不現實的,無論是訓練時間成本還是金錢成本,都不可接受。如果對于新知識采取Fine-tune的模式,看上去可行且成本相對較低,但是很容易產生新數據的引入導致對原有知識的災難遺忘問題,尤其是短周期的頻繁fine-tune,會使這個問題更為嚴重。所以如何近乎實時地將新知識融入LLM是個非常有挑戰性的問題。其三,ChatGPT或GPT4的訓練成本以及在線推理成本太高,導致如果面向真實搜索引擎的以億記的用戶請求,假設繼續采取免費策略,OpenAI無法承受,但是如果采取收費策略,又會極大減少用戶基數,是否收費是個兩難決策,當然如果訓練成本能夠大幅下降,則兩難自解。以上這三個原因,導致目前ChatGPT應該還無法取代傳統搜索引擎。

那么這幾個問題,是否可以解決呢?其實,如果我們以ChatGPT的技術路線為主體框架,再吸納其它對話系統采用的一些現成的技術手段,來對ChatGPT進行改造,從技術角度來看,除了成本問題外的前兩個技術問題,目前看是可以得到很好地解決。我們只需要在ChatGPT的基礎上,引入sparrow系統以下能力:基于retrieval結果的生成結果證據展示,以及引入LaMDA系統的對于新知識采取retrieval模式,那么前面提到的新知識的及時引入,以及生成內容可信性驗證,基本就不是什么大問題。

3dd70c1c-75db-11ed-8abf-dac502259ad0.jpg

基于以上考慮,在上圖中展示出了我心目中下一代搜索引擎的整體結構:它其實是目前的傳統搜索引擎+ChatGPT的雙引擎結構,ChatGPT模型是主引擎,傳統搜索引擎是輔引擎。傳統搜索引擎的主要輔助功能有兩個:一個是對于ChatGPT產生的知識類問題的回答,進行結果可信性驗證與展示,就是說在ChatGPT給出答案的同時,從搜索引擎里找到相關內容片段及url鏈接,同時把這些內容展示給用戶,使得用戶可以從額外提供的內容里驗證答案是否真實可信,這樣就可以解決ChatGPT產生的回答可信與否的問題,避免用戶對于產生結果無所適從的局面。當然,只有知識類問題才有必要尋找可信信息進行驗證,很多其他自由生成類型的問題,比如讓ChatGPT寫一個滿足某個主題的小作文這種完全自由發揮的內容,則無此必要。所以這里還有一個什么情況下會調用傳統搜索引擎的問題,具體技術細節完全可仿照sparrow的做法,里面有詳細的技術方案。傳統搜索引擎的第二個輔助功能是及時補充新知識。既然我們不可能隨時把新知識快速引入LLM,那么可以把它存到搜索引擎的索引里,ChatGPT如果發現具備時效性的問題,它自己又回答不了,則可以轉向搜索引擎抽取對應的答案,或者根據返回相關片段再加上用戶輸入問題通過ChatGPT產生答案。關于這方面的具體技術手段,可以參考LaMDA,其中有關于新知識處理的具體方法。

除了上面的幾種技術手段,我覺得相對ChatGPT只有一個綜合的Reward Model,sparrow里把答案helpful相關的標準(比如是否富含信息量、是否合乎邏輯等)采用一個RM,其它類型toxic/harmful相關標準(比如是否有bias、是否有害信息等)另外單獨采用一個RM,各司其職,這種模式要更清晰合理一些。因為單一類型的標準,更便于標注人員進行判斷,而如果一個Reward Model融合多種判斷標準,相互打架在所難免,判斷起來就很復雜效率也低,所以感覺可以引入到ChatGPT里來,得到進一步的模型改進。

通過吸取各種現有技術所長,我相信大致可以解決ChatGPT目前所面臨的問題,技術都是現成的,從產生內容效果質量上取代現有搜索引擎問題不大。當然,至于模型訓練成本和推理成本問題,可能短時期內無法獲得快速大幅降低,這可能是決定LLM是否能夠取代現有搜索引擎的關鍵技術瓶頸。從形式上來看,未來的搜索引擎大概率是以用戶智能助手APP的形式存在的,但是,從短期可行性上來說,在走到最終形態之前,過渡階段大概率兩個引擎的作用是反過來的,就是傳統搜索引擎是主引擎,ChatGPT是輔引擎,形式上還是目前搜索引擎的形態,只是部分搜索內容Top 1的搜索結果是由ChatGPT產生的,大多數用戶請求,可能在用戶看到Top 1結果就能滿足需求,對于少數滿足不了的需求,用戶可以采用目前搜索引擎翻頁搜尋的模式。我猜搜索引擎未來大概率會以這種過渡階段以傳統搜索引擎為主,ChatGPT這種instruct-based生成模型為輔,慢慢切換到以ChatGPT生成內容為主,而這個切換節點,很可能取決于大模型訓練成本的大幅下降的時間,以此作為轉換節點。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 強化學習
    +關注

    關注

    4

    文章

    266

    瀏覽量

    11247
  • ai技術
    +關注

    關注

    1

    文章

    1266

    瀏覽量

    24288
  • nlp
    nlp
    +關注

    關注

    1

    文章

    488

    瀏覽量

    22033
  • ChatGPT
    +關注

    關注

    29

    文章

    1558

    瀏覽量

    7596

原文標題:張俊林:ChatGPT會成為下一代搜索引擎嗎

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    阿里國際推出全球首個B2B AI搜索引擎Accio

    近日,在歐洲科技峰會Web Summit上,阿里國際正式推出了全球首個B2B領域的AI搜索引擎——Accio。這創新產品面向全球商家開放,標志著阿里國際正式入局當前備受矚目的AI Search賽道。
    的頭像 發表于 11-15 16:53 ?692次閱讀

    OpenAI推出ChatGPT搜索功能

    查找網絡信息時,往往需要通過傳統的搜索引擎進行檢索,然后從中篩選出有價值的內容。而現在,有了ChatGPT搜索,用戶可以更加便捷地獲取所需信息。 OpenAI表示,ChatGPT
    的頭像 發表于 11-04 10:34 ?332次閱讀

    Meta開發新搜索引擎,減少對谷歌和必應的依賴

    近日,Meta正在積極進軍人工智能領域,并試圖跟上OpenAI的發展步伐。為實現這目標,Meta正在開發款全新的搜索引擎,該搜索引擎具備網絡爬蟲功能,能夠為用戶提供有關時事的對話答
    的頭像 發表于 10-29 11:49 ?376次閱讀

    月訪問量超2億,增速113%!360AI搜索成為全球增速最快的AI搜索引擎

    與傳統搜索引擎不同,作為AI原生搜索引擎的360AI搜索基于公開網絡、知識庫、大模型三大支柱。借助首創的 CoE 技術架構,360AI搜索整合了國內主流的16家廠商51款大模型,支持用
    的頭像 發表于 09-09 13:44 ?465次閱讀
    月訪問量超2億,增速113%!360AI<b class='flag-5'>搜索</b><b class='flag-5'>成為</b>全球增速最快的AI<b class='flag-5'>搜索引擎</b>

    OpenAI推出SearchGPT原型,正式向Google搜索引擎發起挑戰

    在人工智能領域的持續探索中,OpenAI 邁出了重大步,發布了其最新的 SearchGPT 原型,直接瞄準了 Google 的核心業務——搜索引擎。這舉動不僅標志著 OpenAI 在技術上的又
    的頭像 發表于 07-26 15:11 ?571次閱讀

    微軟計劃在搜索引擎Bing中引入AI摘要功能

    近期,科技界傳來新動向,微軟緊隨百度與谷歌的步伐,宣布計劃在其搜索引擎Bing中引入先進的AI摘要功能,旨在為用戶帶來更加智能、豐富的搜索體驗。
    的頭像 發表于 07-26 14:23 ?454次閱讀

    OpenAI否認將推出搜索產品或GPT-5

    此消息對致力于將ChatGPT嵌入必應搜索引擎的微軟或許有所積極影響。早期已有報導披露,該AI企業有意研發競品以抗衡谷歌搜索引擎
    的頭像 發表于 05-13 15:14 ?384次閱讀

    OpenAI注冊新域名,準備推出結合AI技術的搜索引擎挑戰谷歌

    OpenAI最近注冊了“search.chatgpt.com”域名,看起來是要推出款新的搜索引擎
    的頭像 發表于 05-08 10:41 ?460次閱讀

    OpenAI或將推出ChatGPT搜索引擎

    據可靠消息透露,OpenAI正秘密研發款以ChatGPT為基礎的大型產品,其核心功能將是款新型搜索引擎,旨在為用戶提供更便捷的上網體驗。
    的頭像 發表于 05-08 10:19 ?494次閱讀

    新火種AI|挑戰谷歌,OpenAI要推出搜索引擎

    新的搜索引擎,幫助用書輕松上網。 OpenAI的這動向引起了業界的廣泛關注。作為OpenAI開發的款強大的AI大語言模型,ChatGPT已經在自然語言處理的領域取得了顯著的成果,并
    的頭像 發表于 05-07 22:06 ?358次閱讀
    新火種AI|挑戰谷歌,OpenAI要推出<b class='flag-5'>搜索引擎</b>?

    OpenAI或將在5月9日發布ChatGPT搜索引擎

    OpenAI可能即將與谷歌展開正面競爭,推出基于ChatGPT搜索引擎。根據Reddit網友的最新爆料,OpenAI有望在5月9日公布其全新的搜索產品。據悉,與這新產品相對應的
    的頭像 發表于 05-07 09:28 ?621次閱讀

    潤和軟件與新財富聯合發布金融AI對話式搜索引擎“金融搜搜”產品

    3月29日,新財富投顧嘉年華活動中,江蘇潤和軟件股份有限公司(以下簡稱“潤和軟件”)與深圳市新財富數字科技有限責任公司(以下簡稱“新財富”)聯合發布了金融AI對話式搜索引擎——“金融搜搜”產品,助力金融投資場景智能化升級。
    的頭像 發表于 04-02 10:15 ?479次閱讀
    潤和軟件與新財富聯合發布金融AI對話式<b class='flag-5'>搜索引擎</b>“金融搜<b class='flag-5'>一</b>搜”產品

    微軟向Windows 10/11推送更新,建議將Bing設為Chrome默認搜索引擎

    微軟通過提示窗口表示,只要將Bing設為Chrome瀏覽器的默認搜索引擎,即可免費享用ChatGPT-4,且每天可與Bing人工智能進行數百次的對話交流。
    的頭像 發表于 03-15 14:32 ?1344次閱讀

    生成式AI恐使搜索引擎衰退,預計2026年搜索量將下滑25%

    據市場分析機構Gartner報道,生成式AI對傳統搜索引擎構成重大威脅,預計至2026年搜索量將降低25%。為此,企業需調整營銷策略。
    的頭像 發表于 02-20 10:04 ?697次閱讀

    谷歌搜索引擎優化的各個方面和步驟

    谷歌搜索引擎是最受歡迎和廣泛使用的搜索引擎,為了使你的網站在谷歌上更好地排名并提高曝光度,你可以采取些谷歌搜索引擎優化的步驟。 使用關
    的頭像 發表于 01-25 10:29 ?871次閱讀
    主站蜘蛛池模板: 芭乐视频网页版在线观看| 久久精选视频| asian4you裸模| 亚洲精品国产拍在线观看| 欧美四虎精品二区免费| 好男人在线观看免费视频WWW | 一本到高清视频在线观看三区| 免费一级特黄欧美大片久久网| 国产在线一卡二卡| 成人在无码AV在线观看一| 8090碰成年女人免费碰碰尤物| 性白俄罗斯高清xxxxx| 日日操日日射| 日本xxxxxxxxx老师59| 欧美巨大xxxx做受高清| 老男人粗大猛| 久久综合电影| 恋夜影院支持安卓视频美女| 久久人妻无码毛片A片麻豆| 黄色三级在线| 久久囯产精品777蜜桃传媒| 久久99视频免费| 久久电影午夜| 久久精品久久久久| 老司机午夜影院味味| 麻豆人妻无码性色AV| 免费看到湿的小黄文软件APP| 久久久久综合网| 免费果冻传媒2021在线看| 蜜桃成熟时2电影免费观看d| 久久一本岛在免费线观看2020| 久久久无码AV精品亚洲A片软件| 久久精品亚洲热综合一本奇米| 老头操美女| 色综合久久88一加勒比| 邪恶肉肉全彩色无遮盖| 伊人成综合网伊人222| 99热这里精品| 国产激情视频在线| 久久久久免费视频| 女张腿男人桶羞羞漫画|