色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

<tfoot id="igakc"><delect id="igakc"></delect></tfoot>

<button id="igakc"></button>

<rt id="igakc"></rt>

<strike id="igakc"></strike>

<strike id="igakc"></strike>

<rt id="igakc"><delect id="igakc"></delect></rt>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統(tǒng)消息
評論與回復(fù)

查看更多

查看更多

查看更多

VIP于到期續(xù)費

登錄后你可以

下載海量資料
學(xué)習(xí)在線課程
觀看技術(shù)視頻
寫文章/發(fā)帖/加入社區(qū)

會員中心

电子发烧友

开通电子发烧友VIP会员尊享10大特权

海量资料免费下载

精品直播免费看

优质内容免费畅学

课程9折专享价

低至0.4元/天，开通VIP

創(chuàng)作中心

發(fā)布

創(chuàng)作活動

完善資料讓更多小伙伴認識你，還能領(lǐng)取20積分哦，立即完善>

3天內(nèi)不再提示

中文信息處理實驗室提出工具學(xué)習(xí)新框架ToolAlpaca

如何讓小規(guī)模語言模型像 GPT-4 一樣使用任意工具是一個非常有價值的研究課題。中國科學(xué)院軟件研究所中文信息處理實驗室提出了一種語言模型的工具學(xué)習(xí)新框架，該框架利用基于大模型的多智能體模擬交互策略，可以自動生成多樣化的工具使用數(shù)據(jù)集，并使用生成的數(shù)據(jù)集對小模型進行微調(diào)。論文的實驗驗證了僅需要使用三千多個多樣化的工具調(diào)用實例，就能夠使小型模型獲得與極大規(guī)模模型相媲美的通用工具使用能力。

具體來說，本文的核心工作包括：

1. 提出一種基于大模型的多智能體模擬交互策略，用于生成工具使用數(shù)據(jù)集。這種方法能在最小化人工干預(yù)的前提下，生成大量且多樣化的工具使用數(shù)據(jù)集；

2. 開源了一個涵蓋超過400個工具，三千多條實例的模擬工具使用數(shù)據(jù)集，為探索通用工具使用能力奠定了基礎(chǔ)；

3. 通過實驗，驗證了在多樣化工具使用數(shù)據(jù)集上進行微調(diào)，能夠使小型模型獲得與極大規(guī)模模型相媲美的通用工具使用能力。

論文：ToolAlpaca: Generalized Tool Learning for Language Models with 3000 Simulated Cases

數(shù)據(jù)：https://github.com/tangqiaoyu/ToolAlpaca

背景工具的使用在人類進化史上占據(jù)了重要的地位，對于語言模型來說，這一點同樣適用。當(dāng)語言模型能夠熟練運用各種工具，它們就能突破自身的局限，獲取最新的信息，幫助用戶利用各種服務(wù)，并提升回答的精確性。如今，OpenAI 的 GPT-4 已經(jīng)可以通過插件的形式接入和使用各種第三方工具，同時這類超大型的語言模型支持通過僅給定配置文件的情況下，以即插即用的方式使用之前模型訓(xùn)練過程中未見過的工具，這一泛化性的工具使用能力大大豐富了模型調(diào)動資源解決復(fù)雜問題的手段。然而，對于較小的語言模型，例如 Moss、ToolLLaMA 等，它們使用工具的能力仍然來源于在特定工具的數(shù)據(jù)集上進行監(jiān)督學(xué)習(xí)。這使得這些模型的工具使用能力受限于在訓(xùn)練過程中接觸過的工具，尚未真正獲得通用的工具使用能力。上述的對比引出了研究人員所關(guān)注的一個核心研究問題，即是否有可能讓較小規(guī)模的語言模型也具備有泛化地使用各種不同的、未見過的工具的能力，進而讓它們能夠更好地與更廣泛的工具進行交互，從而提升模型利用現(xiàn)實世界的資源解決問題的手段。

ToolAlpaca：通用工具使用能力學(xué)習(xí)新框架

受 Alpaca 通過微調(diào)讓小模型學(xué)會通用指令遵循啟發(fā)，中文信息處理實驗室的研究人員探索了通過在通用工具使用數(shù)據(jù)集上微調(diào)較小規(guī)模的語言模型，讓它們獲得通用工具使用能力。實現(xiàn)上述能力的一個核心難點在于需要構(gòu)建一個多樣化的工具使用數(shù)據(jù)集。然而，由于工具使用涉及復(fù)雜的多方交互，現(xiàn)今仍然缺乏公開可用的多樣化工具使用數(shù)據(jù)集。為了解決這個挑戰(zhàn)，研究人員提出通過多智能體模擬交互的方式生成工具使用數(shù)據(jù)集。這種方法充分利用大模型強大的文本生成能力，在幾乎不需要任何人工干預(yù)的情況下構(gòu)建一個多樣化且真實的數(shù)據(jù)集。我們從構(gòu)建多樣化工具集開始，之后利用多智能體模擬生成工具使用數(shù)據(jù)集，最后基于此訓(xùn)練出擁有通用工具使用能力的 ToolAlpaca 模型。

工具集構(gòu)建：我們首先從開源倉庫 public-apis 中獲取工具的名稱和簡短描述作為初始信息，之后利用大語言模型通過 prompt 的方式將其擴展成自然語言形式的文檔，描述工具提供的每一個函數(shù)及其對應(yīng)的輸入。為了讓信息更為精細和結(jié)構(gòu)化，我們進一步將這些自然語言文檔擴展為遵循 OpenAPI 規(guī)范的文檔，詳盡描繪了每個函數(shù)的細節(jié)。結(jié)構(gòu)化文檔的使用不僅使我們的工具集更為細致和完備，同時也方便了我們的工具集與其他工具（如 ChatGPT 現(xiàn)有的 Plugin 等）進行兼容。下圖為一個名為 Public Holidays 工具的示例。

工具使用實例生成：盡管我們已經(jīng)構(gòu)建了大規(guī)模且多樣化的工具集，但構(gòu)建工具使用數(shù)據(jù)集仍然是一項富有挑戰(zhàn)性的任務(wù)。首先，由于工具集是由大模型生成的，要根據(jù)工具集文檔構(gòu)造如此大量的真實工具，需要大量的編程和數(shù)據(jù)收集工作，幾乎不可能實現(xiàn)；其次，工具集本身包含了從通用到專用的各種領(lǐng)域的工具，使得構(gòu)造與工具相關(guān)的初始指令是困難的。為此，我們提出了一種多智能體模擬交互的策略來生成工具使用數(shù)據(jù)。我們利用大模型分別模擬用戶、AI 助手、工具執(zhí)行器這三個智能體，通過他們之間的交互來生成豐富且實用的工具使用數(shù)據(jù)。

如上圖所示，用戶發(fā)起最初的指令，并通過簡單的交互提供更多必要的信息。工具執(zhí)行器則利用結(jié)構(gòu)化文檔作為提示，借助大模型來模擬工具的執(zhí)行過程，從而產(chǎn)生相應(yīng)的反饋。而AI助手則充當(dāng)兩者之間的橋梁，它幫助用戶調(diào)用各種工具以解決問題，并最終對整個交互過程進行總結(jié)，返回給用戶最終的響應(yīng)結(jié)果。通過這三個智能體的交互，我們成功構(gòu)建了一套能貼近真實場景需求的工具使用數(shù)據(jù)集。

ToolAlpaca 模型訓(xùn)練與測試：我們使用生成的數(shù)據(jù)集對 Vicuna 模型進行微調(diào)，以此得到最終的 ToolAlpaca 模型。在測試階段，ToolAlpaca 將擔(dān)任 AI 助手的角色，同時用戶和工具執(zhí)行器的角色仍由大模型扮演。

實驗

最終，我們利用 ChatGPT 和 GPT-3.5 構(gòu)造了一個包含超過400個工具、3900多條工具使用實例的模擬數(shù)據(jù)集，數(shù)據(jù)集基本統(tǒng)計信息如下圖所示。

之后，我們在Vicuna 模型上進行微調(diào)，得到 ToolAlpaca 模型。為了評估模型的泛化性能，我們在10種未包含在訓(xùn)練集中的工具上構(gòu)造了含有100條數(shù)據(jù)的測試集，并通過人工評價對模型的工具調(diào)用過程和整體性能進行了評估。評測結(jié)果如下圖所示。

實驗結(jié)果表明，無論是7B還是13B的模型，經(jīng)過在 ToolAlpaca 數(shù)據(jù)集上的訓(xùn)練后，其性能都有了顯著的提升。值得注意的是，ToolAlpaca 在測試集上的整體性能已經(jīng)接近于 GPT-3.5 的表現(xiàn)。這些實驗結(jié)果驗證了我們構(gòu)建數(shù)據(jù)集的有效性，同時也回答了我們最開始提出的問題：通過在多樣化的工具使用數(shù)據(jù)集上微調(diào)，可以讓小模型獲得通用的工具使用能力。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

框架

框架

+關(guān)注

關(guān)注
0

文章
404

瀏覽量
17914
語言模型

語言模型

+關(guān)注

關(guān)注
0

文章
562

瀏覽量
10806
數(shù)據(jù)集

數(shù)據(jù)集

+關(guān)注

關(guān)注
4

文章
1224

瀏覽量
25483

原文標(biāo)題：3000多個實例教會小模型通用工具使用能力！中文信息處理實驗室提出工具學(xué)習(xí)新框架 ToolAlpaca

文章出處：【微信號：gh_e5b9d8c5c1d4，微信公眾號：中科院軟件所中文信息處理實驗室】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

評論

中科院軟件所中文信息處理實驗室
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關(guān)注個人主頁

Hot PPTAgent: 大模型驅(qū)動的PPT自動生成
Hot 中文信息處理實驗室提出工具學(xué)習(xí)新框架ToolAlpaca

发布文章

精選推薦
更多

文章

資料

帖子

解決方案?|?太陽能逆變器芯佰微【光能逆變“芯”引擎】

芯佰微電子
3小時前

160 閱讀

LDO穩(wěn)壓器的工作原理和重要參數(shù)

晶揚電子
2小時前

207 閱讀

用RK3568自制底板狂丟包？5分鐘教你用Delayline一鍵復(fù)活網(wǎng)口

飛凌嵌入式
4小時前

180 閱讀

如何在RK3576開發(fā)板上運行TinyMaix ：超輕量級推理框架--基于米爾MYD-LR3576開發(fā)板

米爾電子
4小時前

170 閱讀

一文分享電子工程師年度私藏清單！助你測試效率翻倍！

Aigtek安泰電子
18小時前

217 閱讀

uCOSII程序設(shè)計基礎(chǔ)

lanlanw
2.76 MB

免費

323下載

drv3205-q1_24V汽車系統(tǒng)中的應(yīng)用

jfzhangjin
40.8 KB

1積分

5下載

智能控制的基礎(chǔ)知識

zhaoqf
9.36 MB

3積分

0下載

SuperSeriousStats網(wǎng)頁統(tǒng)計日志分析

李鴻洋
0.07 MB

免費

0下載

三相車載充電器（OBC） PFC-LLC平臺SEC-3PH-11-OBC-EVB數(shù)據(jù)手冊

13.70 MB

免費

15下載

【HZ-RK3568開發(fā)板免費體驗】系統(tǒng)燒寫

ouxiaolong
12小時前

114 閱讀

【微五科技CF5010RBT60開發(fā)板試用體驗】+高級定時器輸出PWM測試

安安踢球球
12小時前

154 閱讀

【Sipeed MaixCAM Pro開發(fā)板試用體驗】 + 04 + 機器學(xué)習(xí)YOLO體驗

jf_05814630
1天前

156 閱讀

【RA-Eco-RA6M4開發(fā)板評測】uart+OLED

h1654155957.8180
1天前

176 閱讀

【微五科技CF5010RBT60開發(fā)板試用體驗】+環(huán)境搭建

jf_84146745
1天前

144 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

華秋（原“華強聚豐”）：

電子發(fā)燒友

華秋開發(fā)

華秋電路(原"華強PCB")

華秋商城(原"華強芯城")

華秋智造

My ElecFans

APP
網(wǎng)站地圖

設(shè)計技術(shù)

可編程邏輯

電源/新能源

MEMS/傳感技術(shù)

測量儀表

嵌入式技術(shù)

制造/封裝

模擬技術(shù)

RF/無線

接口/總線/驅(qū)動

處理器/DSP

EDA/IC設(shè)計

存儲技術(shù)

光電顯示

EMC/EMI設(shè)計

連接器

行業(yè)應(yīng)用

LEDs

汽車電子

音視頻及家電

通信網(wǎng)絡(luò)

醫(yī)療電子

人工智能

虛擬現(xiàn)實

可穿戴設(shè)備

機器人

安全設(shè)備/系統(tǒng)

軍用/航空電子

移動通信

工業(yè)控制

便攜設(shè)備

觸控感測

物聯(lián)網(wǎng)

智能電網(wǎng)

區(qū)塊鏈

新科技

特色內(nèi)容

專欄推薦

學(xué)院

設(shè)計資源

設(shè)計技術(shù)

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術(shù)文章

產(chǎn)品地圖

品牌地圖

社區(qū)

小組

論壇

問答

評測試用

企業(yè)服務(wù)

產(chǎn)品

資料

文章

方案

企業(yè)

供應(yīng)鏈服務(wù)

硬件開發(fā)

華秋電路

華秋商城

華秋智造

nextPCB

BOM配單

媒體服務(wù)

網(wǎng)站廣告

在線研討會

活動策劃

新聞發(fā)布

新品發(fā)布

小測驗

設(shè)計大賽

華秋

關(guān)于我們

投資關(guān)系

新聞動態(tài)

加入我們

聯(lián)系我們

舉報投訴

社交網(wǎng)絡(luò)

微博

移動端

發(fā)燒友APP

硬聲APP

WAP

聯(lián)系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內(nèi)容合作

黃晶晶：huangjingjing@elecfans.com

內(nèi)容合作（海外）

張迎輝：mikezhang@elecfans.com

供應(yīng)鏈服務(wù) PCB/IC/PCBA

江良華：lanhu@huaqiu.com

投資合作

曾海銀：zenghaiyin@huaqiu.com

社區(qū)合作

劉勇：liuyong@huaqiu.com

關(guān)注我們的微信

下載發(fā)燒友APP

電子發(fā)燒友觀察

電子工程師社區(qū)

1-32層PCB打樣·中小批量

元器件現(xiàn)貨·全球代購·SmartBOM

SMT貼片·PCBA加工

PCB Manufacturer

華秋簡介

企業(yè)動態(tài)

聯(lián)系我們

企業(yè)文化

企業(yè)宣傳片

加入我們

版權(quán)所有 ? 湖南華秋數(shù)字科技有限公司

長沙市望城經(jīng)濟技術(shù)開發(fā)區(qū)航空路6號手機智能終端產(chǎn)業(yè)園2號廠房3層（0731-88081133）
電子發(fā)燒友 （電路圖） 湘公網(wǎng)安備43011202000918 工商網(wǎng)監(jiān) 湘ICP備2023018690號-1

感谢您访问我们的网站，您可能还对以下资源感兴趣：
色哟哟视频在线观看|色哟哟视频在线|色哟哟欧美15最新在线|色哟哟免费在线观看|国产l精品国产亚洲区在线观看|国产l精品国产亚洲区久久
在线观看日韩www视频免费

主站蜘蛛池模板：国语自产偷成人精品视频 | 久久综合色一综合色88中文 | 草莓视频在线播放视频 | 天堂视频在线观看免费完整版 | 亚洲综合日韩中文字幕v在线 | 国产精品99久久久久久AV蜜臀 | 久久艹伊人 | 无码不卡中文字幕在线观看 | 暖暖视频免费高清日本8 | 久青草影院 | 女人一级毛片免费观看 | 久久爽狠狠添AV激情五月 | 大胸美女被吊起来解开胸罩 | 精品一区二区三区AV天堂 | 亚洲一区免费观看 | 小荡娃奶真大 | 夜夜骑夜夜欢 | 坠落的丝袜美人妻 | 暖暖视频中国在线观看免费韩国 | 蜜臀久久99精品久久久久久做爰 | 40岁东北老阿姨无码 | 一道精品视频一区二区 | 精品福利一区 | 国产免费阿v精品视频网址国产免费69成人精品视频 | 亚洲伊人久久大香线蕉综合图片 | 国产乱对白精彩在线播放 | 免费国产成人 | 久久青青草视频在线观 | 国产免费高清mv视频在线观看 | 精品亚洲大全 | 国产精品免费一区二区三区视频 | 最近中文字幕MV免费看 | 荡乳乱公小说 | 王晶经典三级 | 欧美乱妇狂野欧美在线视频 | 中文字幕精品无码一区二区 | 美女强奷到抽搐在线播放 | 一区二区中文字幕在线观看 | 男女一边摸一边做羞羞的事情免费 | 忘忧草在线影院WWW日本二 | 99久久精品免费看国产免费 |

電子發(fā)燒友

中國電子工程師最喜歡的網(wǎng)站

與2931785位工程師會員交流學(xué)習(xí)
獲取您個性化的科技前沿技術(shù)信息
參加活動獲取豐厚的禮品