色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

chatgpt下非端到端方案是否還有意義

深度學習自然語言處理 ? 來源:CS的陋室 ? 2023-02-14 09:23 ? 次閱讀

最近chatgpt逐漸變火,很多人也多少能夠發現,chatgpt能夠成為一個相對可靠的端到端解決方案,大有干掉很多智能對話助手、搜索引擎的趨勢,當然現在已經有不少用戶也在用這個來充當搜索引擎來用了。然而,從技術角度,我們是否可以考慮去這么做了,或者說現階段是否合適真的去這么嘗試了。來看我的看法吧。

先說結論吧,我自己的分析結論是,大家都應該去嘗試,但是不要指望短期內徹底替換。

什么是端到端

先說一下端到端和非端到端的意思,簡單地說,就是一個模型完成全流程的任務,而非端到端,就是通過多個模型或者模塊有機組合最終完成的任務。

舉個例子,對話系統,可以用一個比較完善的生成模型來完成,也可以用一個系統,里面有各種模型,例如意圖識別模塊、召回模塊、排序模塊等多個模塊協同合作來共同完成,前者就是端到端的方案,后者就是非端到端的方案。

端到端和非端到端的競爭

其實端到端和非端到端的競爭,早在前幾年就有了,DSTC對話系統的比賽,榜單上就已經分為了端到端和非端到端兩派進行,從比賽的數據來看,非端到端的模型基本都能在A榜有個不錯的成績,而B榜上,端到端模型則能夠一舉超越非端到端模型獲得勝利,從這點我們其實可以推斷,非端到端模型更容易在已知情況達到更高的水平,但是因為模型本身的特定,端到端的模式下,則更容易頂到更高的上限,泛化能力也能拉的比較高。

正因為端到端模型更容易能頂到更高的上線,所以在科研界,多半也是朝著端到端的方案去走的,配合預訓練模型這股東風,絕大部分復雜任務的SOTA方案都是端到端模型的身影。

然而,與之相反的是工業界,在工業界,各大廠所采用的方案,基本都是非端到端的方案,前沿重器系列中我聊了很多場景下大廠的架構:

前沿重器[1] | 微軟小冰-多輪和情感機器人的先行者

前沿重器[2] | 美團搜索理解和召回

前沿重器[3] | 平安智能問答系統

前沿重器[4] | 騰訊搜索的Quer理解如何直擊心靈

大家都可以看到,這里面大家不約而同地選擇了這些方案,而沒有選擇比較直接的端到端方案,甚至,在一些小任務下,大家也傾向于拆解成非端到端的任務來進行,例如糾錯(NLP.TM[37] | 深入討論糾錯系統),就拆解成3部分靈活處理。

為什么會選擇非端到端

我自己也經常會對一些需求做技術方案,也會比較傾向于非端到端的方案,主要是出于這幾個原因吧:

非端到端出效果穩定。拆解開的每個步驟都能監控到,什么位置出問題成為短板能快速定位修復,且不影響其他模塊。

資源和需求多樣性導致必須拆分。不同的資源來源導致我們必須在內部拆分,例如要出天氣要查天氣的庫,此時就要拆分各模塊做識別等任務。

可控性和可更新性。國內外其實都有很多不能發布的信息或者價值觀,這些是需要控制的,另一方面,有些內容是需要可更新的,此時需要可更新的模塊來處理,每次直接更新整個模型成本很高。

這應該也是大家會在現實落地情況選擇花時間拆分模塊,逐步完成的核心原因了,也側面映射出,非端到端的方案最終沒選擇的原因:

調優成本和風險大,除了問題后的效果調優可控性其實不是很高,很依賴訓練策略、資源等很多原因。

對現有資源的使用能力差,原來的端到端模型主要靠喂特定的樣本,現階段則是prompt,但是多種復雜的資源不見得能支持這樣的使用。

可控性和可更新性不足,一些風險問題,需要實時更新的問題(依舊舉天氣的例子),端到端模型的變化是不夠敏捷的,甚至在變化過程中可能引入新的不可控風險。

這些問題不解決,我們很難完全放心把整個大的任務交給一個模型的。

端到端模型是否有可能克服缺點

我的答案是,現階段是有可能但是還需要發展迭代。

隨著prompt的出現,大家會開始有一種錯覺,prompt的方式能讓模型快速學會一些比較好的知識,或者換個角度,prompt方案似乎能引導模型吐出我們想讓他吐出的東西,看起來非常有用,大家在體驗chatgpt時多少有點這個感覺,然而仔細看過chatgpt有關原理的朋友們應該會發現,他們在底層是花費了很大成本來構造很多prompt來讓模型學習的,標注看著很簡單,但chatgpt這里其實非常困難,總結而說是有兩點:

prompt的數量,prompt訓練是需要一定的數據支撐的,別給我說就幾條,那是一個類目下,但是類目層面就很多了,每個類幾條那也要很多條的對吧。

prompt的質量,只有泛化的,多樣的prompt才能更好地引導模型訓練,這種人工活動不同于標注,他是帶有一定創造性的,此時難度其實就很高了。

當然,有關靈活可控性,大家會有說adapter之類的結構,就是輕量化微調的方案,這點我在之前的輕量化微調文章里也有說過(前沿重器[27] | 從遺忘問題到預訓練輕量化微調),雖然這種方案能一定程度緩解,但是敏捷性其實還可以提升的,有些緊急的公關問題需要快速下線,類似天氣、新聞等需要快速更新的內容,如果還需要慢慢吞吞地訓adapter模塊,那速度大家肯定覺得會不太夠,還不如直接塞庫里,用dsl直接查的快對吧,當然了,如果是實時性要求沒那么高的,這種控制起來其實已經非常足夠了。

有關chatgpt的效果問題

現階段,chatgpt的口碑有目共睹,但是盛名之下是否能副,這里我是想打一個問號的。有幾個比較嚴謹的問題需要被拋出來:

開放域下的指標如何。大家你一個我一個的試,從個人層面看就是超小樣本,統計能力不足,而把大家的都算上,基本一定程度算高頻問題,可以說是帶點偏的,然而拋開這批嘗試的用戶,只看用戶日常真正的提問,例如像百度那樣用戶當做工具每天搜的情況,效果如何,這點還需要更為嚴格,數量更豐富的評測。

現階段大家的新鮮感還比較強,其實容忍度還是比較高的,很難避免一些錯誤可能會被我們縮小,如果對其他的一些軟件和產品,尤其是國產的,大家是否也能有這個容忍度呢,我自己看游戲領域、電影領域甚至一些奢飾品等領域的經驗來看,用戶多半對國產產品有著比同類外國產品更苛刻的要求的,例子就不舉了,相信大家都懂。

產品形態的問題。現階段的chatgpt的輸出形態其實還是比較局限的——文本和圖像,但是實際上我們需要的可能會更加復雜,例如智能家居的指令(幫我開燈),銷售場景的智能推薦(給我推薦一臺七千塊左右的電腦),天氣內容展示(告訴我未來一周的天氣)等。

怎么做

講到這里,其實我們可以有這幾個共識吧:

非端到端模型在目前的落地場景下,仍有不可撼動的地位,直接切換或者使用端到端模型應該是激進的。

端到端有自己獨特且突出的優勢,泛化能力強,這點也是毋庸置疑的,

在對這個東西有基本的共識后,我們可以繼續來聊怎么做,整體思路可以參考很多系統所常見的嵌入方式:新增召回路,參與篩選和把控。

之前我有文章聊過“召回-排序”這種在多個系統中被廣泛使用的一個架構(心法利器[79] | 對話系統中的多路召回和排序),我們可以考慮在內容的召回上,把這種端到端的方式作為其中一種召回鏈路放入到召回池子里,增加一種回復的可能性,最終的篩選則是在排序層,和其他路召回的內容進行綜合排序,并完成拒識判斷(嚴謹起見端到端方案在特定場景不合適,此時需要過濾拒絕),此時就可以相對安全地利用上這個好東西,算是“馴服”了。在后續階段,隨著逐漸優化,我們可以慢慢放開排序和拒識模塊,讓端到端方案的采納率逐步提升,在提升到一定階段后,就可以考慮下掉其他模塊,最終完成了從非端到端到端到端的切換了,中間階段也比較可控安全。

chatgpt是否會替代嗎

最后想夾帶點私貨,回應一下最近很多人后臺希望和我聊的問題,簡單地說就是chatgpt是否能完全替代別的東西,尤其是人,最近chatgpt逐漸變火,除了chatgpt很火之外,更多的聲音是“哀鴻遍野”,很多人覺得非常悲觀,很多工作都可能會被機器替代。不過從我自己的角度看,是兩個聲音:

chatgpt已經能幫忙做很多事,能替代不少人了。

簡單任務已經可以做了,所以基礎人力肯定會被壓縮,但是因為深耕行業的人更了解具體流程和chatgpt能做的事,所以明白終究是需要有指導機器干活的,需要搭建架構的人,因此讓自己成長起來,這塊壓力其實沒想象中的大,而且在這個趨勢下,資本進一步了解到AI的重要性,說不定對相應從業人員的需求更多。

而且這兩個聲音的具有非常鮮明的特征,前者像是一些對有關領域了解不深的人,后者則是深耕某個領域時間比較久的老鳥。很多時候,老鳥的這個東西的理解很深,往往能參透這里的本質。

說個很簡單的事吧,很多人發現了chatgpt會寫代碼,所以覺得程序員就要被淘汰了,其實這部分人只是單純的認為程序員只有一個任務就是寫代碼罷了,但其實并非如此,以算法工程師為例,大家可以看看我的日常(心法利器[31] | 我的算法工程師日常),大家會發現,真正寫代碼的時間可能就10%左右了,在這種情況下,chatgpt更多的是一個幫助我們工作的工具,而不是替代我們的對手。

我們不能說外行如何如何,畢竟術業有專攻,但是對我們這些專業領域的人還是需要體現出自己的專業水準的,冷靜思考,不能被不懂這個的人帶去了節奏,而是真正的深入了解某個東西的原理和優缺點,并且找到自己的優劣勢和機會,這個才是真正破局所需要的。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 搜索引擎
    +關注

    關注

    0

    文章

    119

    瀏覽量

    13364
  • 模型
    +關注

    關注

    1

    文章

    3268

    瀏覽量

    48927
  • ChatGPT
    +關注

    關注

    29

    文章

    1564

    瀏覽量

    7823

原文標題:chatgpt下非端到端方案是否還有意義

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    高通收購NXP真的有意義嗎?

    市場傳言,Qualcomm收購NXP Semiconductor的洽談已經接近成交;但是,這樁交易對Qualcomm來說真的有意義嗎?
    發表于 10-27 10:43 ?3208次閱讀

    芯片的datesheet直譯成中文對技術人員的參閱有沒有意義

    的習慣么?如果你們參閱的是一些機翻直譯的中文資料,如用谷歌翻譯的,每個型號的PDF都有個中文直譯版,你們覺得有沒有意義?能不能對生產研發起到幫助作用?
    發表于 03-29 17:15

    橫河測量測試 對于要求較高的測試應用,非常有意義

    增加儀器的開發難度和硬件成本,但卻能實現更精準的測量,對于要求較高的測試應用,非常有意義?! M河最新推出的新一代高精度功率分析儀WT5000就是采用了這樣的設計:除輸入的線路濾波器外,還分別為常規
    發表于 01-21 20:32

    請問stm32f103zet6搭配256Mbit SDRAM有意義嗎?

    stm32f103zet6搭配256Mbit SDRAM有意義么,看原子戰艦也才8M,是不是有點浪費,F1性能能消耗這么大內存么?
    發表于 05-07 02:35

    在51單片機上跑RTOS有沒有意義?精選資料分享

    最近看見我的一個技術交流群在討論一個問題:在51單片機上跑RTOS有沒有意義?今天就來圍繞51和RTOS展開講講。1關于51單片機及性能和資源51單片機可以說是我們這一代人的經典,因為它資...
    發表于 07-20 07:54

    請問同步電機使用矢量變頻器拖動有意義嗎?

    ,此時輸出電壓增加以求恢復轉速,同時內環限制電流不能過載。但是在同步電機的情況,除非負載達到失步,其轉速是與電壓無關的,是否可以認為此時外環是起不到作用的,只有內環有作用,這豈不是可以認為用矢量變頻器拖動同步電動機是沒有意義
    發表于 11-16 06:49

    應用LonWorks控制技術的端方案

    應用LonWorks控制技術的端方案 信息會聚正以末有的速度出現。因特網大大的加速多種形式的信息(數據、話音、視頻、聲頻、控制)的合并,從而為解決日
    發表于 03-18 10:02 ?16次下載

    智能與智能:何時為電源增加智能功能才有意義

    無論控制回路是模擬的還是數字的,只要其正常工作,用戶便不會了解其中的差別。如果應用優勢不存在,則使用數字控制回路或數字化控制器可能是沒有意義的。在這些情況,有許多模擬電源解決方案可以滿足電路更小
    的頭像 發表于 08-24 12:49 ?3565次閱讀

    Reddit熱議MIT新發現 對抗樣本是有意義的數據特征

    對抗樣本不是Bug, 它們實際上是有意義的數據分布特征。來自MIT的最新研究對神經網絡的對抗樣本問題給出了非常新穎的解釋和實驗論證。
    的頭像 發表于 05-13 16:01 ?1947次閱讀
    Reddit熱議MIT新發現 對抗樣本是<b class='flag-5'>有意義</b>的數據特征

    蘋果造車真的有意義

    本周有三個話題值得我們關注,首先,近兩天蘋果的造車的消息引起了大家熱烈的關注,眾多類似“看到裝了四個輪子的手機長什么樣”的評論也是鋪天蓋地的傳來,所以蘋果造車真的有意義嗎?其次,豐田掌門人豐田章男
    的頭像 發表于 12-28 10:23 ?1867次閱讀

    在51單片機上跑RTOS有沒有意義

    關注+星標公眾號,不錯過精彩內容作者 | strongerHuang微信公眾號|嵌入式專欄最近看見我的一個技術交流群在討論一個問題:在51單片機上跑RTOS有沒有意義?今天就來圍繞51...
    發表于 11-19 11:51 ?32次下載
    在51單片機上跑RTOS有沒<b class='flag-5'>有意義</b>?

    基于Arduino的矯枉過正但具有意義的COVID流行病展示

    電子發燒友網站提供《基于Arduino的矯枉過正但具有意義的COVID流行病展示.zip》資料免費下載
    發表于 11-01 09:38 ?0次下載
    基于Arduino的矯枉過正但具<b class='flag-5'>有意義</b>的COVID流行病展示

    ChatGPT是怎么實現的

    ChatGPT 能夠自動生成類似于人類寫作的文本,這一點非常引人注目,也令人意外。但它是如何實現的?為什么它能夠如此出色地生成我們認為有意義的文本?我的目的是在這里概述ChatGPT內部的運行
    的頭像 發表于 10-16 11:31 ?972次閱讀
    <b class='flag-5'>ChatGPT</b>是怎么實現的

    雙電源無擾動快切裝置的小型化設計是否有意義?

    快切裝置的小型化設計對于安裝空間有限的改造場景是非常有意義的,DCM635系列是目前業內體積最小的快切裝置,前面板長266mm,寬146mm,裝置深210.5mm,安裝與進線柜或母聯柜上層二次控制室面板上,小型化設計節省安裝空間,尤其適用于改造項目中,開關柜前面板開孔尺寸有限的場景。
    的頭像 發表于 07-19 11:30 ?401次閱讀
    雙電源無擾動快切裝置的小型化設計<b class='flag-5'>是否</b><b class='flag-5'>有意義</b>?

    安防監控NTP校時服務器:讓視頻數據更有意義

    安防監控NTP校時服務器:讓視頻數據更有意義
    的頭像 發表于 12-16 10:59 ?188次閱讀
    安防監控NTP校時服務器:讓視頻數據更<b class='flag-5'>有意義</b>
    主站蜘蛛池模板: 做a爱片的全过程| 亚洲国产成人99精品激情在线| 国产精品热久久高潮AV袁孑怡| 久久青草免费线观最新| 国产成人在线免费观看| 被室友C哭调教双性| bl高h肉文| 亚洲福利视频导航| 午夜影院和视费x看| 久久人人玩人妻潮喷内射人人| 国产最新进精品视频| 国产乱色伦影片在线观看 | 国产专区_爽死777| 国产人成高清在线视频99| 国产精品私人玩物在线观看 | 久久久久久极精品久久久| 加勒比一本之道高清视频在线观看| 国产亚洲人成网站在线观看播放 | 久热这里在线精品| 久久久无码精品无码国产人妻丝瓜| 久久99综合国产精品亚洲首页| 九九精品视频一区二区三区| 久久99免费视频| 久久亚洲AV无码精品午色夜麻豆 | 美女教师朝桐光在线播放| 蜜臀AV99无码精品国产专区| 欧美成人免费观看久久| 漂亮的av女演员| 视频一区国产精戏刘婷30| 午夜特级毛片| 亚洲综合网国产精品一区| 真人美女精美小穴| caoporn免费视频在线| 出轨的妻子在线观看| 973午夜伦伦电影论片| 99热久久久无码国产精品性麻豆| HEYZO无码中文字幕人妻| 各种肉黄浪荡故事集| 国产精品一区二区在线观看| 精品高潮呻吟99AV无码| 久久这里只有精品国产精品99|