色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

完善資料讓更多小伙伴認識你，還能領(lǐng)取20積分哦，立即完善>

3天內(nèi)不再提示

ToolLLM：促進大型語言模型掌握16000+真實世界的APIs

為了促進開源LLMs的工具使用能力，作者引入了 ToolLLM，這是一個數(shù)據(jù)構(gòu)建、模型訓練和評估的通用工具使用框架。

論文：ToolLLM: Facilitating Large Language Models to Master 16000+ Real-world APIs
地址：https://arxiv.org/abs/2307.16789
項目：https://github.com/OpenBMB/ToolBench
單位：清華、人大、耶魯、微信、騰訊、知乎

盡管開源大語言模型 (LLM) 及其變體（例如 LLaMA 和 Vicuna）取得了進步，但它們在執(zhí)行更高級別的任務方面仍然受到很大限制，例如遵循人類指令使用外部工具 (API)。

這是因為當前的指令調(diào)優(yōu)主要集中在基本語言任務而不是工具使用領(lǐng)域。

這與最先進 (SOTA) 的LLMs（例如 ChatGPT）形成鮮明對比，后者展示了出色的工具使用能力，但不幸的是閉源的。

為了促進開源LLMs的工具使用能力，我們引入了 ToolLLM，這是一個數(shù)據(jù)構(gòu)建、模型訓練和評估的通用工具使用框架。

我們首先介紹 ToolBench，這是一個供工具使用的指令調(diào)整數(shù)據(jù)集，它是使用 ChatGPT 自動創(chuàng)建的。

具體來說，我們從 RapidAPI Hub 收集了 16,464 個真實世界的 RESTful API，涵蓋 49 個類別，然后提示 ChatGPT 生成涉及這些 API 的各種人工指令，涵蓋單工具和多工具場景。

最后，我們使用 ChatGPT 為每條指令搜索有效的解決方案路徑（API 調(diào)用鏈）。

為了使搜索過程更加高效，我們開發(fā)了一種新穎的基于深度優(yōu)先搜索的決策樹（DFSDT），使LLMs能夠評估多個推理軌跡并擴展搜索空間。我們證明 DFSDT 顯著增強了LLMs的規(guī)劃和推理能力。

為了有效評估工具使用情況，我們開發(fā)了一個自動評估器：ToolEval。

我們在ToolBench上微調(diào)LLaMA并獲得ToolLLaMA。

我們的 ToolEval 表明 ToolLLaMA 表現(xiàn)出執(zhí)行復雜指令和泛化到未見過的 API 的卓越能力，并且表現(xiàn)出與 ChatGPT 相當?shù)男阅堋?/p>

為了使管道更加實用，我們設(shè)計了一個神經(jīng) API 檢索器來為每條指令推薦合適的 API，從而無需手動選擇 API。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

數(shù)據(jù)

數(shù)據(jù)

+關(guān)注

關(guān)注
8

文章
7067

瀏覽量
89107
開源

開源

+關(guān)注

關(guān)注
3

文章
3363

瀏覽量
42530
語言模型

語言模型

+關(guān)注

關(guān)注
0

文章
527

瀏覽量
10285

原文標題：劉知遠等眾多機構(gòu)提出ToolLLM：促進大型語言模型掌握16000+真實世界的APIs

文章出處：【微信號：zenRRan，微信公眾號：深度學習自然語言處理】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

大型語言模型在關(guān)鍵任務和實際應用中的挑戰(zhàn)

大型語言模型的出現(xiàn)極大地推動了自然語言處理領(lǐng)域的進步，但同時也存在一些局限性，比如模型可能會產(chǎn)生看似合理但實際上是錯誤或虛假的內(nèi)容，這一現(xiàn)象

發(fā)表于 08-15 09:33 ?1531次閱讀

<b class='flag-5'>大型</b><b class='flag-5'>語言</b><b class='flag-5'>模型</b>在關(guān)鍵任務和實際應用中的挑戰(zhàn)

探索高效的大型語言模型！大型語言模型的高效學習方法

在大型語言模型（LLMs）的應用中，提示工程（Prompt Engineering）是一種關(guān)鍵技術(shù)，用于引導模型生成特定輸出或執(zhí)行特定任務。通過精心設(shè)計的提示，可以顯著提高LLMs的性

發(fā)表于 12-13 14:21 ?605次閱讀

探索高效的<b class='flag-5'>大型</b><b class='flag-5'>語言</b><b class='flag-5'>模型</b>！<b class='flag-5'>大型</b><b class='flag-5'>語言</b><b class='flag-5'>模型</b>的高效學習方法

【大語言模型：原理與工程實踐】揭開大語言模型的面紗

。大語言模型的縮放定律對于深度學習研究和應用具有重要意義。它提供了更強大的泛化能力和適應性，使得模型能夠更好地處理現(xiàn)實世界中的復雜任務和不確定性問題。同時，縮放定律也

發(fā)表于 05-04 23:55

【大語言模型：原理與工程實踐】大語言模型的基礎(chǔ)技術(shù)

之后，成為文本建模領(lǐng)域的熱門架構(gòu)。不僅如此，它還對自然語言處理領(lǐng)域產(chǎn)生了深遠的影響。基于Transformer的預訓練模型，如GPT系列和BERT系列，已在多種任務上取得了卓越的成績。目前的大型

發(fā)表于 05-05 12:17

【大語言模型：原理與工程實踐】大語言模型的應用

和微調(diào)的積累，無需額外知識。然而，大模型所掌握的世界知識具有時效性，對于訓練后發(fā)生的事件或訓練集中未涵蓋的知識，大語言模型往往無法應對。當面

發(fā)表于 05-07 17:21

KT利用NVIDIA AI平臺訓練大型語言模型

韓國先進的移動運營商構(gòu)建包含數(shù)百億個參數(shù)的大型語言模型，并使用 NVIDIA DGX SuperPOD 平臺和 NeMo Megatron 框架訓練該模型。

發(fā)表于 09-27 09:24 ?1204次閱讀

NVIDIA AI平臺為大型語言模型帶來巨大收益

隨著大型語言模型（ LLM ）的規(guī)模和復雜性不斷增長， NVIDIA 今天宣布更新 NeMo Megatron 框架，提供高達 30% 的訓練速度。

發(fā)表于 10-10 15:39 ?900次閱讀

NVIDIA AI平臺為<b class='flag-5'>大型</b><b class='flag-5'>語言</b><b class='flag-5'>模型</b>帶來巨大收益

大型語言模型有哪些用途？

大型語言模型能識別、總結(jié)、翻譯、預測和生成文本及其他內(nèi)容。 AI 應用在大型語言模型的幫助下，可

發(fā)表于 02-23 19:50 ?5207次閱讀

大型語言模型有哪些用途？大型語言模型如何運作呢？

大型語言模型能識別、總結(jié)、翻譯、預測和生成文本及其他內(nèi)容。

發(fā)表于 03-08 13:57 ?8059次閱讀

淺析AI大型語言模型研究的發(fā)展歷程

大型語言模型研究的發(fā)展有三條技術(shù)路線：Bert 模式、GPT 模式、混合模式。其中國內(nèi)大多采用混合模式，多數(shù)主流大型語言

發(fā)表于 06-09 12:34 ?5245次閱讀

淺析AI<b class='flag-5'>大型</b><b class='flag-5'>語言</b><b class='flag-5'>模型</b>研究的發(fā)展歷程

基于Transformer的大型語言模型（LLM）的內(nèi)部機制

本文旨在更好地理解基于 Transformer 的大型語言模型（LLM）的內(nèi)部機制，以提高它們的可靠性和可解釋性。隨著大型語言

發(fā)表于 06-25 15:08 ?1489次閱讀

基于Transformer的<b class='flag-5'>大型</b><b class='flag-5'>語言</b><b class='flag-5'>模型</b>（LLM）的內(nèi)部機制

大型語言模型的應用

?? 大型語言模型（LLM）是一種深度學習算法，可以通過大規(guī)模數(shù)據(jù)集訓練來學習識別、總結(jié)、翻譯、預測和生成文本及其他內(nèi)容。大語言模型（LL

發(fā)表于 07-05 10:27 ?2104次閱讀

大規(guī)模語言模型的基本概念、發(fā)展歷程和構(gòu)建流程

使用自然語言與系統(tǒng)交互，從而實現(xiàn)包括問答、分類、摘要、翻譯、聊天等從理解到生成的各種任務。大型語言模型展現(xiàn)出了強大的對世界知識

發(fā)表于 12-07 11:40 ?4300次閱讀

大規(guī)模<b class='flag-5'>語言</b><b class='flag-5'>模型</b>的基本概念、發(fā)展歷程和構(gòu)建流程

如何利用大型語言模型驅(qū)動的搜索為公司創(chuàng)造價值

大型語言模型LLMs具有自動化內(nèi)容創(chuàng)建、提高內(nèi)容質(zhì)量及多樣化的潛力，可重塑企業(yè)與信息的交互方式。通過利用LLMs，企業(yè)能提升工作效率，降低運營成本，并獲得深入洞察。來自EgeGürdeniz

發(fā)表于 10-13 08:07 ?178次閱讀

如何利用<b class='flag-5'>大型</b><b class='flag-5'>語言</b><b class='flag-5'>模型</b>驅(qū)動的搜索為公司創(chuàng)造價值

大語言模型開發(fā)框架是什么

大語言模型開發(fā)框架是指用于訓練、推理和部署大型語言模型的軟件工具和庫。下面，AI部落小編為您介紹大語言

發(fā)表于 12-06 10:28 ?131次閱讀

深度學習自然語言處理
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關(guān)注個人主頁

Hot 一個給NLP領(lǐng)域帶來革新的預訓練語言大模型Bert
Hot 推薦一些翻譯英文文獻比較準確的軟件

New 高效大模型的推理綜述
New 什么是RAG，RAG學習和實踐經(jīng)驗

精選推薦
更多

文章

資料

帖子

羅德與施瓦茨助力探索WiFi8的無限可能

羅德與施瓦茨中國
3小時前

169 閱讀

信號源計量中的功率電平不確定度分析

羅德與施瓦茨中國
3小時前

138 閱讀

TSP工具包軟件的應用說明

泰克科技
3小時前

133 閱讀

LVGL開發(fā)入門教程

瑞薩MCU小百科
4小時前

189 閱讀

開關(guān)穩(wěn)壓器和線性穩(wěn)壓器的比較

RECOM
4小時前

223 閱讀

海信HDP2910L,HDP2919型彩色電路圖

chumowei
287 KB

10積分

494下載

光纖通信導論-光纖激光器

1053526151
898 KB

免費

0下載

DoChat用于Linux的Docker化微信

劉滿貴
0.94 MB

2積分

1下載

Flameshot基于C++的屏幕截圖軟件

賈虎世
12.45 MB

2積分

1下載

一種適用于中小型工件尺寸批量測量方法的一鍵式閃測儀

szzhongtu5
0.32 MB

免費

8下載

求大神告知加熱臺的加熱方式，是電阻絲加熱嗎？如果是請教一下具體的型號

jf_24845006
19小時前

86 閱讀

電子連接器上的接線端子保護蓋的的設(shè)計有什么講究嗎？

jf_68950762
19小時前

89 閱讀

基于RK3568國產(chǎn)處理器教學實驗箱操作案例分享：一元線性回歸實驗

創(chuàng)龍教儀
29天前

93 閱讀

關(guān)于串聯(lián)電容測短路

jf_19250324
19小時前

173 閱讀

開源大師兄怎么刷鴻蒙系統(tǒng)的，那些傳感器配件還能調(diào)用嗎

jf_37933157
19小時前

158 閱讀

推薦專欄
更多