色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA TensorRT-LLM Roadmap現(xiàn)已在GitHub上公開(kāi)發(fā)布

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2024-11-28 10:43 ? 次閱讀

感謝眾多用戶(hù)及合作伙伴一直以來(lái)對(duì)NVIDIA TensorRT-LLM的支持。TensorRT-LLM 的 Roadmap 現(xiàn)已在 GitHub 上公開(kāi)發(fā)布!

TensorRT-LLM

持續(xù)助力用戶(hù)優(yōu)化推理性能

TensorRT-LLM 可在 NVIDIA GPU 上加速和優(yōu)化最新的大語(yǔ)言模型(Large Language Models)的推理性能。該開(kāi)源程序庫(kù)在 /NVIDIA/TensorRT-LLM GitHub 資源庫(kù)中免費(fèi)提供。

近期,我們收到了許多用戶(hù)的積極反饋,并表示,TensorRT-LLM 不僅顯著提升了性能表現(xiàn),還成功地將其應(yīng)用集成到各自的業(yè)務(wù)中。TensorRT-LLM 強(qiáng)大的性能和與時(shí)俱進(jìn)的新特性,為客戶(hù)帶來(lái)了更多可能性。

Roadmap 現(xiàn)已公開(kāi)發(fā)布

過(guò)往,許多用戶(hù)在將 TensorRT-LLM 集成到自身軟件棧的過(guò)程中,總是希望能更好地了解 TensorRT-LLM 的 Roadmap。即日起,NVIDIA 正式對(duì)外公開(kāi) TensorRT-LLM 的 Roadmap ,旨在幫助用戶(hù)更好地規(guī)劃產(chǎn)品開(kāi)發(fā)方向。

我們非常高興地能與用戶(hù)分享,TensorRT-LLM 的 Roadmap 現(xiàn)已在 GitHub 上公開(kāi)發(fā)布。您可以通過(guò)以下鏈接隨時(shí)查閱:

https://github.com/NVIDIA/TensorRT-LLM

d88235d6-acaa-11ef-93f3-92fbcf53809c.png

圖 1. NVIDIA/TensorRT-LLM GitHub 網(wǎng)頁(yè)截屏

這份 Roadmap 將為您提供關(guān)于未來(lái)支持的功能、模型等重要信息,助力您提前部署和開(kāi)發(fā)。

同時(shí),在 Roadmap 頁(yè)面的底部,您可通過(guò)反饋鏈接提交問(wèn)題。無(wú)論是問(wèn)題報(bào)告還是新功能建議,我們都期待收到您的寶貴意見(jiàn)。

d8915bb0-acaa-11ef-93f3-92fbcf53809c.png

圖 2.Roadmap 整體框架介紹

利用 TensorRT-LLM

優(yōu)化大語(yǔ)言模型推理

TensorRT-LLM 是一個(gè)用于優(yōu)化大語(yǔ)言模型(LLM)推理的庫(kù)。它提供最先進(jìn)的優(yōu)化功能,包括自定義 Attention Kernel、Inflight Batching、Paged KV Caching、量化技術(shù)(FP8、INT4 AWQ、INT8 SmoothQuant 等)以及更多功能,以讓你手中的 NVIDIA GPU 能跑出極致推理性能。

TensorRT-LLM 已適配大量的流行模型。通過(guò)類(lèi)似 PyTorch 的 Python API,可以輕松修改和擴(kuò)展這些模型以滿足自定義需求。以下是已支持的模型列表。

d89b7758-acaa-11ef-93f3-92fbcf53809c.png

我們鼓勵(lì)所有用戶(hù)定期查閱 TensorRT-LLM Roadmap。這不僅有助于您及時(shí)了解 TensorRT-LLM 的最新動(dòng)態(tài),還能讓您的產(chǎn)品開(kāi)發(fā)與 NVIDIA 的技術(shù)創(chuàng)新保持同步。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5238

    瀏覽量

    105730
  • GitHub
    +關(guān)注

    關(guān)注

    3

    文章

    481

    瀏覽量

    17432
  • LLM
    LLM
    +關(guān)注

    關(guān)注

    1

    文章

    319

    瀏覽量

    677

原文標(biāo)題:NVIDIA TensorRT-LLM Roadmap 現(xiàn)已在 GitHub 上公開(kāi)發(fā)布!

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 0人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    小白學(xué)大模型:從零實(shí)現(xiàn) LLM語(yǔ)言模型

    在當(dāng)今人工智能領(lǐng)域,大型語(yǔ)言模型(LLM)的開(kāi)發(fā)已經(jīng)成為一個(gè)熱門(mén)話題。這些模型通過(guò)學(xué)習(xí)大量的文本數(shù)據(jù),能夠生成自然語(yǔ)言文本,完成各種復(fù)雜的任務(wù),如寫(xiě)作、翻譯、問(wèn)答等。https
    的頭像 發(fā)表于 04-30 18:34 ?293次閱讀
    小白學(xué)大模型:從零實(shí)現(xiàn) <b class='flag-5'>LLM</b>語(yǔ)言模型

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI開(kāi)發(fā)

    NVIDIA GTC 推出新一代專(zhuān)業(yè)級(jí) GPU 和 AI 賦能的開(kāi)發(fā)者工具—同時(shí),ChatRTX 更新現(xiàn)已支持 NVIDIA NIM,RTX Remix 正式結(jié)束測(cè)試階段,本月的
    的頭像 發(fā)表于 03-28 09:59 ?498次閱讀

    無(wú)法在OVMS運(yùn)行來(lái)自Meta的大型語(yǔ)言模型 (LLM),為什么?

    無(wú)法在 OVMS 運(yùn)行來(lái)自 Meta 的大型語(yǔ)言模型 (LLM),例如 LLaMa2。 從 OVMS GitHub* 存儲(chǔ)庫(kù)運(yùn)行 llama_chat Python* Demo 時(shí)遇到錯(cuò)誤。
    發(fā)表于 03-05 08:07

    京東廣告生成式召回基于 NVIDIA TensorRT-LLM 的推理加速實(shí)踐

    、個(gè)性化召回、深度召回等),以召回大量候選商品。隨后,系統(tǒng)通過(guò)相對(duì)簡(jiǎn)單的粗排模型對(duì)候選集進(jìn)行初步篩選,縮小候選范圍,最后通過(guò)精排和重排模型,確定最終返回給用戶(hù)的推薦結(jié)果。 隨著大語(yǔ)言模型(LLM)在推薦系統(tǒng)中的應(yīng)用,生成
    的頭像 發(fā)表于 01-14 15:17 ?448次閱讀

    NVIDIA TensorRT-LLM中啟用ReDrafter的一些變化

    Recurrent Drafting (簡(jiǎn)稱(chēng) ReDrafter) 是蘋(píng)果公司為大語(yǔ)言模型 (LLM) 推理開(kāi)發(fā)并開(kāi)源的一種新型推測(cè)解碼技術(shù),該技術(shù)現(xiàn)在可與 NVIDIA TensorRT-L
    的頭像 發(fā)表于 12-25 17:31 ?614次閱讀
    在<b class='flag-5'>NVIDIA</b> <b class='flag-5'>TensorRT-LLM</b>中啟用ReDrafter的一些變化

    解鎖NVIDIA TensorRT-LLM的卓越性能

    NVIDIA TensorRT-LLM 是一個(gè)專(zhuān)為優(yōu)化大語(yǔ)言模型 (LLM) 推理而設(shè)計(jì)的庫(kù)。它提供了多種先進(jìn)的優(yōu)化技術(shù),包括自定義 Attention Kernel、Inflight
    的頭像 發(fā)表于 12-17 17:47 ?689次閱讀

    如何在 OrangePi 5 Pro?的?NPU?運(yùn)行?LLM

    在OrangePi5Pro上訪問(wèn)NPU需要安裝最新版Ubuntu的定制版本,還需要安裝特殊軟件,讓你能在NPU而不是CPU運(yùn)行專(zhuān)門(mén)轉(zhuǎn)換的LLM。整個(gè)過(guò)程肯定要比運(yùn)行Ollama復(fù)雜得多,但如果你
    的頭像 發(fā)表于 11-28 14:55 ?1099次閱讀
    如何在 OrangePi 5 Pro?的?NPU?<b class='flag-5'>上</b>運(yùn)行?<b class='flag-5'>LLM</b>

    TensorRT-LLM低精度推理優(yōu)化

    本文將分享 TensorRT-LLM 中低精度量化內(nèi)容,并從精度和速度角度對(duì)比 FP8 與 INT8。首先介紹性能,包括速度和精度。其次,介紹量化工具 NVIDIA TensorRT Model
    的頭像 發(fā)表于 11-19 14:29 ?1039次閱讀
    <b class='flag-5'>TensorRT-LLM</b>低精度推理優(yōu)化

    Arm推出GitHub平臺(tái)AI工具,簡(jiǎn)化開(kāi)發(fā)者AI應(yīng)用開(kāi)發(fā)部署流程

    專(zhuān)為 GitHub Copilot 設(shè)計(jì)的 Arm 擴(kuò)展程序,可加速?gòu)脑频竭吘墏?cè)基于 Arm 平臺(tái)的開(kāi)發(fā)。 Arm 原生運(yùn)行器為部署云原生、Windows on Arm 以及云到邊緣側(cè)的 AI
    的頭像 發(fā)表于 10-31 18:51 ?3219次閱讀

    NVIDIA Nemotron-4 340B模型幫助開(kāi)發(fā)者生成合成訓(xùn)練數(shù)據(jù)

    Nemotron-4 340B 是針對(duì) NVIDIA NeMo 和 NVIDIA TensorRT-LLM 優(yōu)化的模型系列,該系列包含最先進(jìn)的指導(dǎo)和獎(jiǎng)勵(lì)模型,以及一個(gè)用于生成式 AI 訓(xùn)練的數(shù)據(jù)集。
    的頭像 發(fā)表于 09-06 14:59 ?604次閱讀
    <b class='flag-5'>NVIDIA</b> Nemotron-4 340B模型幫助<b class='flag-5'>開(kāi)發(fā)</b>者生成合成訓(xùn)練數(shù)據(jù)

    魔搭社區(qū)借助NVIDIA TensorRT-LLM提升LLM推理效率

    “魔搭社區(qū)是中國(guó)最具影響力的模型開(kāi)源社區(qū),致力給開(kāi)發(fā)者提供模型即服務(wù)的體驗(yàn)。魔搭社區(qū)利用NVIDIA TensorRT-LLM,大大提高了大語(yǔ)言模型的推理性能,方便了模型應(yīng)用部署,提高了大模型產(chǎn)業(yè)應(yīng)用效率,更大規(guī)模地釋放大模型的
    的頭像 發(fā)表于 08-23 15:48 ?949次閱讀

    新款Nvidia Titan GPU正在開(kāi)發(fā)中?或?qū)魯∥?b class='flag-5'>發(fā)布的RTX 5090

    ABSTRACT摘要最近有消息透露,NVIDIA正在開(kāi)發(fā)一款名為T(mén)ITANAI的新顯卡。該顯卡基于即將推出的BlackwellGPU。在Nvidia選擇不發(fā)布其RTX40系列
    的頭像 發(fā)表于 07-26 08:26 ?720次閱讀
    新款<b class='flag-5'>Nvidia</b> Titan GPU正在<b class='flag-5'>開(kāi)發(fā)</b>中?或?qū)魯∥?b class='flag-5'>發(fā)布</b>的RTX 5090

    Mistral Large 2現(xiàn)已在Amazon Bedrock中正式可用

    北京2024年7月25日 /美通社/ -- 亞馬遜云科技宣布,Mistral AI的Mistral Large 2(24.07)基礎(chǔ)模型(FM)現(xiàn)已在Amazon Bedrock中正式可用
    的頭像 發(fā)表于 07-26 08:07 ?473次閱讀

    NVIDIA 通過(guò) Holoscan 為 NVIDIA IGX 提供企業(yè)軟件支持

    Enterprise-IGX軟件現(xiàn)已在NVIDIA IGX平臺(tái)上正式可用,以滿足工業(yè)邊緣對(duì)實(shí)時(shí) AI 計(jì)算日益增長(zhǎng)的需求。它們將共同幫助醫(yī)療、工業(yè)和科學(xué)計(jì)算領(lǐng)域的解決方案提供商利用企業(yè)級(jí)軟件和支持來(lái)加快開(kāi)發(fā)
    的頭像 發(fā)表于 06-04 10:21 ?765次閱讀

    NVIDIA 通過(guò) Holoscan 為 NVIDIA IGX 提供企業(yè)軟件支持,實(shí)現(xiàn)邊緣實(shí)時(shí)醫(yī)療、工業(yè)和科學(xué) AI 應(yīng)用

    NVIDIA Holoscan 的 NVIDIA AI Enterprise-IGX 軟件現(xiàn)已在 NVIDIA IGX 平臺(tái)上正式可用,以滿足工業(yè)邊緣對(duì)實(shí)時(shí) AI 計(jì)算日益增長(zhǎng)的需求
    發(fā)表于 06-03 09:48 ?454次閱讀
      <b class='flag-5'>NVIDIA</b> 通過(guò) Holoscan 為 <b class='flag-5'>NVIDIA</b> IGX 提供企業(yè)軟件支持,實(shí)現(xiàn)邊緣實(shí)時(shí)醫(yī)療、工業(yè)和科學(xué) AI 應(yīng)用
    主站蜘蛛池模板: 一一本之道高清视频在线观看中文字幕 | 精品国产乱码久久久久久下载 | 交换:年轻夫妇-HD中文字幕 | 国产区在线不卡视频观看 | 向日葵视频app下载18岁以下勿看 | 小柔的性放荡羞辱日记 | 97人妻AV天天澡夜夜爽 | 最近中文字幕2019国语4 | 老师破女学生特级毛片 | 久久综合中文字幕无码 | 欧美乱子YELLOWVIDEO| 99爱免费视频 | 中文字幕欧美一区 | 日韩亚洲欧洲在线rrrr片 | 久久国产免费 | 美女夫妻内射潮视频 | 无码一区国产欧美在线资源 | 粗大分开挺进内射 | 国语自产偷成人精品视频 | 国产一区二区三区内射高清 | WWW国产亚洲精品久久久日本 | 伊久久| 久久精品热只有精品 | 国产免费久久爱久久啪 | 上课失禁丨vk | 亚洲视频在线观看 | 99re久久热在线播放8 | 狼人大香伊蕉国产WWW亚洲 | 亚洲综合免费视频 | 亚洲午夜精品AV无码少妇 | 99久久国产露脸国语对白 | 午夜伦4480yy妇女久久 | 收集最新中文国产中文字幕 | 国内精品人妻无码久久久影院蜜桃 | www.伊人| 区久久AAA片69亚洲 | 国产精品久久久久一区二区三区 | 嗯啊…嗯np男男双性总受 | 国产精品无码AV天天爽人妻蜜桃 | 中文字幕无码他人妻味 | 国产一区二区三区影院 |

    電子發(fā)燒友

    中國(guó)電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品