色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

第二屆大會回顧第12期 | ClarifyGPT: 基于交互式需求澄清的大模型代碼生成框架

OpenHarmony TSC ? 來源:OpenHarmony TSC ? 作者:OpenHarmony TSC ? 2024-02-25 17:58 ? 次閱讀

演講嘉賓 | 石 琳

回顧整理 | 廖 濤

排版校對 | 李萍萍

嘉賓介紹

開發者工具分論壇

石琳,北京航空航天大學軟件學院教授,CCF高級會員,2022年度中國科學院軟件研究所杰出青年科技人才。研究方向為智能軟件工程,包括代碼智能、智能需求工程、經驗軟件工程、開源軟件、可信AI等。曾在軟件工程、人工智能領域的高水平國際會議發表論文50余篇,三次獲得杰出論文獎;主持參與多項國家自然科學基金項目、國家重點研發項目等;擔任多個國際知名會議期刊審稿人。

視頻回顧

打開嗶哩嗶哩APP,觀看更清晰視頻

正文內容

隨著AI大模型能力的大幅提升,軟件開發已經逐步走向新智能化時代。然而,目前代碼大模型在可靠性、隱私和合規以及用戶意圖識別等方面仍存在一定局限性。如何基于交互式需求澄清方法,讓大模型更好地理解用戶意圖,并給出更準確的答案?北京航空航天大學教授石琳在第二屆OpenHarmony技術大會上進行了精彩分享。

72dbb404-cf89-11ee-b759-92fbcf53809c.png

2022年11月,OpenAI發布ChatGPT,利用GitHub數據與RLFH強化學習技術,在輔助編程取得進展;2023年1月,微軟Copilot平臺用戶超過1億,CEO表示Copilot很快就會替代程序員完成80%的代碼開發。在GitHub的報告中,使用Copilot的開發者的開發效率幾乎提升了一倍,一個用Copilot的初學者就能夠像專業程序員一樣,從零開始開發出最小可行產品程序。此外,清華大學推出的ChatDev項目,支持多個智能體分工合作,能夠根據用戶指令生成休閑小游戲、效率管理工具、繪畫板、數學計算器、網絡爬蟲等軟件。

通過前文可知,代碼大模型在軟件開發方面“一鳴驚人”,給開發者們帶來了極大的便利。但是,代碼大模型的快速發展同時也帶來了新的問題,如:

模型問題:可靠性、幻覺、更新、形式重于內容

數據問題:數據演化、質量問題、安全問題、隱私和合規

應用問題:用戶意圖不明確、復雜問題抽象和分解、項目上下文、領域專業知識、遺留系統維護

7302e79a-cf89-11ee-b759-92fbcf53809c.png

其中,用戶的意圖表述不明確是代碼大模型在實踐中遇到的巨大阻礙。開發者想寫出一個清晰明確且全面的Prompt并不容易。既然開發者寫的Prompt不清晰,有沒有辦法讓大模型幫開發者改寫?目前,業界已經有一些嘗試,例如GPT Engineer。GPT Engineer是一個基于需求描述自動生成項目源碼的開源項目,主打輕量,靈活生成項目源碼,可以在AI生成與人工生成之間進行切換。在接收到Prompt時,GPT Engineer不會直接生成代碼,而是先梳理有哪些事項需要用戶進一步澄清,然后讓用戶把需要澄清的事項輸入后,再進一步生成代碼。然而,GPT Engineer經常會問一些在Prompt中已經提供了答案的問題,對用戶造成困擾。

如何找到Prompt中“不清楚”的地方,從而進行精準提問?石琳教授所在團隊提出了ClarifyGPT工具。ClarifyGPT會先識別是否應該提問,再利用大模型生成問題。

ClarifyGPT的模塊1:基于測試結果的代碼多樣性評價模塊

如何判斷是否應該向用戶做Prompt澄清呢?這里我們從代碼大模型的輸出結果出發,提出一個基本假設:如果Prompt清晰,大模型生成的代碼應該行為一致;如果Prompt模糊,大模型生成的代碼可能五花八門。因此,ClarifyGPT會先通過種子輸入進行代碼多樣性測試,并基于測試結果判斷是否要做向用戶做Prompt的澄清。

具體而言,(1)先進行種子測試輸入初始化。構建prompt用于生成種子輸入,Prompt包含三部分:Instruction,Demonstrations,Query。將Prompt輸入LLM中生成一些測試輸入,并用它們初始化一個種子池;(2)再進行類型感知的測試輸入變異(采用了標準的基于變異的模糊流程)。在每次迭代時,從種子池中隨機選擇一個輸入;對于選定的輸入,我們檢查其數據類型并執行與其類型一致的單個變異操作以創建新的測試用例;完成一輪突變后,我們將新生成的輸入添加到種子池中,并重復上述過程,直到獲得所需的生成輸入數量。

7318fa44-cf89-11ee-b759-92fbcf53809c.png

ClarifyGPT的模塊2:基于推理的LLM問題生成模塊

在確定了需要向用戶做Prompt澄清后,應該問什么內容呢?為了解決這個以問題,ClarifyGPT會進一步分析代碼的細節差異,區分不一致的代碼,比較solution的不同點,再基于推理進行LLM問題生成。

具體而言,首先生成中間推理步驟(分析導致歧義的因素),然后基于這些中間推理步驟產生最終結果(有針對性的澄清問題)。此外,ClarifyGPT鼓勵LLM進行“超前規劃”,使他們能夠更好地利用他們的推理和理解能力來提高生成問題的質量。

73279cca-cf89-11ee-b759-92fbcf53809c.png

經過評測,ClarifyGPT將GPT-4在MBPP-sanitized上的表現(Pass@1)從70.96%提高到80.8%;將MBPP-ET的性能從51.52%提高到60.19%。相對改善平均為15.35%,優于基線。且增加Prompt中示例的數量會帶來ClarifyGPT性能提升。

ClarifyGPT是一個交互式代碼生成框架,會引導用戶先澄清意圖,再利用大模型幫助用戶生成代碼。后續,ClarifyGPT也會在其他生成類任務上進行進一步的研究和探索。

大模型加速了研發人員的工作效率,但同時也提出了新的挑戰。我們必須大膽嘗試LLM在改進軟件開發方面的潛力,但同時也要謹慎行事,不要忘記工程思維、嚴謹性和經驗驗證的基本原則。 【材料分享】 [1] 論文原文下載 http://arxiv.org/abs/2310.10996 [2] 開源原型工具 https://github.com/ClarifyGPT/ClarifyGPT(點擊閱讀原文可跳轉)

E N D

關注我們,獲取更多精彩。

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    30996

    瀏覽量

    269297
  • 代碼
    +關注

    關注

    30

    文章

    4791

    瀏覽量

    68688
  • OpenHarmony
    +關注

    關注

    25

    文章

    3725

    瀏覽量

    16369
  • 大模型
    +關注

    關注

    2

    文章

    2476

    瀏覽量

    2795
收藏 人收藏

    評論

    相關推薦

    利爾達攜明星模組亮相第二屆移動物聯網大會(2024)

    //2024年12月20日,第二屆移動物聯網大會(2024)(以下簡稱“大會”)在安徽省合肥市舉行。作為一站5G應用解決方案供應商,利爾達
    的頭像 發表于 12-31 16:59 ?470次閱讀
    利爾達攜明星模組亮相<b class='flag-5'>第二屆</b>移動物聯網<b class='flag-5'>大會</b>(2024)

    第二屆開放原子大賽首批賽項頒獎儀式在武漢舉辦

    近日,在2024開放原子開發者大會暨首屆開源技術學術大會開幕上,第二屆開放原子大賽首批賽項頒獎儀式成功舉辦。
    的頭像 發表于 12-23 11:24 ?220次閱讀

    第二屆開放原子大賽首批創新成果集結武漢

    12月20日至21日,武漢將迎來一場開源技術的盛會——2024開放原子開發者大會暨首屆開源技術學術大會。屆時,第二屆開放原子大賽的首批獲獎團隊將閃耀亮相,展示他們的創新成果。
    的頭像 發表于 12-18 15:22 ?264次閱讀

    美光科技第二屆鏈博會精彩回顧

    此前,11月26-30日,歷時5天,第二屆中國國際供應鏈促進博覽會在北京圓滿落幕,一起來回顧美光科技在本次鏈博會的精彩時刻吧。
    的頭像 發表于 12-03 13:35 ?166次閱讀

    智芯公司亮相2024第二屆中國電氣工程大會

    近日,由智芯公司和北京郵電大學協同組織的2024第二屆中國電氣工程大會“先進通信技術賦能新型電力系統”專題分會場在安徽合肥成功舉辦。
    的頭像 發表于 12-02 14:18 ?245次閱讀

    帝奧微第二屆代理商大會圓滿召開

    近日,“帝奧微2024年第二屆全國代理商大會” 在上海研發中心圓滿召開。本次大會聚焦“智領芯程,合作共贏”主題,齊聚 80+代理商代表,共同探討未來發展趨勢。
    的頭像 發表于 11-29 13:45 ?315次閱讀

    知存科技邀您相約第二屆集成芯片和芯粒大會

    2024年11月8日-10日,以“集成芯片:邁進大芯片時代”為主題的第二屆集成芯片和芯粒大會將在北京嘉里大酒店舉行。本次大會由基金委集成芯片前沿科學基礎重大研究計劃指導專家組指導,由中
    的頭像 發表于 11-06 15:25 ?446次閱讀

    第二屆openEuler生態大會圓滿結束

    近日,第二屆openEuler生態大會(中國·湖南)成功舉辦。大會以“根植openEuler共建開源生態”為主題,旨在響應國家開源產業發展戰略,推動建設以openEuler為根技術的開源操作系統在湖南創新發展,構建openEul
    的頭像 發表于 10-31 16:02 ?281次閱讀

    第二屆開放原子大賽火熱進行中

    第二屆開放原子大賽(簡稱“大賽”)是由開放原子開源基金會組織舉辦的開源技術領域專業賽事,聚焦解決“真問題”,重點覆蓋基礎軟件、工業軟件、人工智能大模型等領域。
    的頭像 發表于 10-31 10:04 ?354次閱讀

    第二屆開放原子大賽火熱開啟

    第二屆開放原子大賽(簡稱“大賽”)是由開放原子開源基金會組織舉辦的開源技術領域專業賽事,聚焦解決“真問題”,重點覆蓋基礎軟件、工業軟件、人工智能大模型等領域。
    的頭像 發表于 10-18 11:39 ?447次閱讀

    第二屆大會回顧24 | 面向OpenHarmony的軟件工程研究:機遇與挑戰

    隨著萬物智聯時代的到來,OpenHarmony作為一個開源的智能終端設備操作系統的框架和平臺,將會遇到哪些機遇和挑戰?北京航空航天大學教授、OpenHarmony技術俱樂部主任黎立在第二屆OpenHarmony技術大會上帶來了精
    的頭像 發表于 08-07 18:14 ?1059次閱讀
    <b class='flag-5'>第二屆</b><b class='flag-5'>大會</b><b class='flag-5'>回顧</b><b class='flag-5'>第</b>24<b class='flag-5'>期</b> | 面向OpenHarmony的軟件工程研究:機遇與挑戰

    第二屆英飛凌汽車創新峰會IACE開幕在即

    第二屆英飛凌汽車創新峰會IACE開幕在即
    的頭像 發表于 05-20 11:42 ?548次閱讀
    <b class='flag-5'>第二屆</b>英飛凌汽車創新峰會IACE開幕在即

    報名開啟!第二屆OpenHarmony開發者大會2024重磅來襲!

    /jishu_2429449_1_1.html 預約直播: 第二屆OpenHarmony開發者大會主論壇 第二屆OpenHarmony開發者大會:設備開發分論壇
    發表于 05-14 15:23

    華工科技以智賦能,亮相第二屆船舶行業安全生產大會

    4月18-19日,第二屆船舶行業安全生產與應急管理技術交流大會在山東煙臺舉行。華工科技智能制造業務板塊應邀參加,并發表題為《船體結構部件智能制造助力安全生產》的主題演講。
    的頭像 發表于 04-19 17:44 ?643次閱讀
    華工科技以智賦能,亮相<b class='flag-5'>第二屆</b>船舶行業安全生產<b class='flag-5'>大會</b>

    同星智能攜最新版支持DoIP診斷功能TSMaster軟件亮相第二屆汽車人工智能大會

    同星展會預告TOSUN.EXHIBIT2024第二屆汽車人工智能大會2024第二屆汽車人工智能大會將于4月17-18日在上海舉辦,本次大會
    的頭像 發表于 04-13 08:21 ?675次閱讀
    同星智能攜最新版支持DoIP診斷功能TSMaster軟件亮相<b class='flag-5'>第二屆</b>汽車人工智能<b class='flag-5'>大會</b>
    主站蜘蛛池模板: 日韩a视频在线观看| 伦理片天堂eeuss影院| 4hu四虎免费影院www| 亚洲 欧美 中文 日韩 视频| 日本电影护士| 男女后进式猛烈xx00动态图片 | 国内精品视频久久久久免费| 草莓视频在线看免费高清观看| AV天堂午夜精品一区| 99免费精品| cctv官网| yellow高清免费观看日本| Chinesetube国产中文| G0GO人体大尺香蕉| 啊好大好厉害好爽真骚| xxxx免费观看| 福利片午夜| 国产精品久久久久秋霞影视| 国产人人为我我为人人澡| 国产亚洲精品在浅麻豆| 果冻传媒在线播放| 九九久久国产精品免费热6| 久久国产精品久久国产精品 | 受坐在攻腿上H道具PLAY| 色琪琪无码成人AV视频| 无码AV精品一区二区三区| 亚洲成av人影院| 亚洲综合网国产精品一区| 一级淫片bbbxxx| 51国产偷自视频在线视频播放| 99re久久这里只有精品| YELLOW日本动漫免费动漫| 国产99精品在线观看| 国产亚洲精品久久孕妇呦呦你懂| 精品国产乱码久久久久久免费流畅| 久久久高清国产999尤物| 美女内射少妇一区二区四区| 欧美牲交A欧美牲交| 婷婷精品国产亚洲AV在线观看| 亚洲第一国产| 影音先锋亚洲AV少妇熟女|