電子發燒友網>人工智能>NVIDIA發布Triton 推理服務器重大更新，全球超過25000余家公司部署NVIDIA AI推理平臺

NVIDIA發布Triton 推理服務器重大更新，全球超過25000余家公司部署NVIDIA AI推理平臺

Capital One、Microsoft、Samsung Medison、Siemens Energy、Snap等全球行業領導者都在使用該平臺。

加利福尼亞州圣克拉拉市 – 2021 年 11 月 9 日 – NVIDIA今日宣布其AI推理平臺的重大更新，目前Capital One、Microsoft、Samsung Medison、Siemens Energy、Snap等25000多家客戶都在使用該平臺。

這些更新包括開源NVIDIA Triton推理服務器軟件的新功能，該軟件為所有AI模型和框架提供跨平臺推理；同時也包含對NVIDIA TensorRT的更新，該軟件優化AI模型并為NVIDIA GPU上的高性能推理提供運行時優化。

NVIDIA還推出了NVIDIA A2 Tensor Core GPU，這是一款用于邊緣AI推理的低功耗、小尺寸的加速器，其推理性能比CPU高出20倍。

NVIDIA副總裁兼加速計算總經理Ian Buck表示：“NVIDIA AI推理平臺正在推動各行各業的突破，包括醫療健康、金融服務、零售、制造和超級計算。無論是提供更智能的建議，發揮對話式AI的力量，還是推進科學發現，NVIDIA推理平臺都能以簡單易用的方式提供低延遲、高吞吐及多種性能組合的服務，為全球關鍵的AI新應用賦能。”

關鍵的軟件優化

Triton 推理服務器的主要更新包括：

● Triton 模型分析器 – 這款新工具可以自動化地從數百種組合中為 AI 模型選擇最佳配置，以實現最優性能，同時確保應用程序所需的服務質量。

● 多 GPU 多節點功能 – 這一新功能支持基于Transformer的大規模語言模型，例如 Megatron 530B，在多個GPU和服務器節點上運行并提供實時推理性能，而不是在單個GPU上運行。

● RAPIDS FIL – 這一針對隨機森林和梯度提升決策樹模型 GPU 或 CPU 推理的新后端為開發者使用 Triton 進行深度學習和傳統機器學習提供了一個統一的部署引擎。

● Amazon SageMaker 集成 – 這種無縫集成讓客戶能夠在 SageMaker（AWS 完全托管的 AI 服務）中使用 Triton 輕松部署多框架的模型，并實現高推理性能。

● 支持 Arm CPU – 除了 NVIDIA GPU 和 x86 CPU 外，Triton 后端現在還支持在 Arm CPU 上優化 AI 推理工作負載。

Triton 支持在云、數據中心、企業邊緣和嵌入式設備等環境中對 GPU 和 CPU 進行 AI 推理，并與 AWS、Google Cloud、Microsoft Azure、阿里云PAI-EAS 等平臺集成。此外，NVIDIA AI Enterprise 也集成了 Triton。

NVIDIA AI Enterprise 是一款經 NVIDIA 優化、認證和支持的用于開發和部署 AI 的端到端軟件套件，客戶可利用它在本地數據中心和私有云的主流服務器上運行 AI 工作負載。

除了 Triton 外，TensorRT 現在還與TensorFlow和PyTorch集成，只需一行代碼就能提供比框架內推理快3倍的性能。這使得開發人員采用極為簡化的工作流程就可以體會TensorRT的強大功能。

NVIDIA TensorRT 8.2 是SDK的最新版本，可加速高性能的深度學習推理，在云端、本地或邊緣提供高吞吐和低延遲。有了最新的性能優化，數十億個參數的語言模型可實現實時運行。

行業領導者支持 NVIDIA AI 平臺推理

全球眾多行業領導者都正在使用 NVIDIA AI 推理平臺改進業務運營并為客戶提供新的AI賦能服務。

Microsoft Azure 認知服務為高品質 AI 模型提供基于云的 API，以創建智能應用程序。他們正在使用Triton 運行語音轉文本模型，為 Microsoft Teams 用戶提供準確的實時字幕和轉錄。

“Microsoft Teams 是全球溝通和協作的重要工具，每月有近 2.5 億活躍用戶，”Microsoft 團隊呼叫、會議和設備部首席 PM 經理 Shalendra Chhabra 表示。“這樣的 AI 模型極其復雜，需要數千萬個神經網絡參數才能在幾十種不同的語言中提供準確的結果。模型越大，就越難以經濟高效地實時運行。Microsoft Azure 認知服務上的 NVIDIA GPU 和 Triton 推理服務器使用 28 種語言和方言，通過 AI 近乎實時地幫助改進實時字幕和轉錄功能。”Microsoft Azure 認知服務上的 NVIDIA GPU 和 Triton 推理服務器，結合AI模型，幫助提升了涉及28 種語言和方言的實時字幕和轉錄功能的成本效益。

Samsung Medison 是三星電子旗下一家全球醫療設備公司。該公司正利用 NVIDIA TensorRT 通過智能輔助功能來為其超聲波系統提供增強的更優質的醫療影像。Samsung Medison 致力于通過提高患者的舒適度、減少掃描時間、簡化工作流程并最終提高系統吞吐量來改善患者和醫療健康領域專業人員的生活。

“在新款 V8 高端超聲波系統中應用 NVIDIA TensorRT 后，我們能夠在查看和診斷圖像時更好地為醫學專家提供支持，”Samsung Medison 副總裁、客戶體驗團隊主管 Won-Chul Bang 表示。“我們正在積極地將基于 AI 的技術引入我們的超聲波系統，以便為醫療專業人員提供更好的支持，使他們能夠專注于患者診斷和治療等更重要的領域。”

Siemens Energy是一家擁有領先能源技術解決方案的能源專營公司，該公司正利用 Triton 通過 AI 來幫助其發電廠客戶管理相關設施。

“高度復雜的發電廠通常會配備攝像頭和傳感器，但采用的卻是傳統軟件系統，NVIDIA Triton 推理服務器出色的靈活性能夠讓這些發電廠加入自主工業革命，” Siemens Energy自主運營部投資組合經理 Arik Ott 表示。

Snap是一家全球性攝影軟件和社交媒體公司，其主要產品和服務包括Snapchat、Spectacles和Bitmoji等。Snap正在使用NVIDIA技術來提高商業變現能力和降低成本。

“Snap使用NVIDIA GPU和TensorRT將機器學習推理的成本效率提高了50%，并將服務延遲降低了2倍，“Snap公司策劃與商業變現部門工程副總裁Nima Khajehnouri表示。”這為我們提供了計算資源，以實踐和部署更大型、更準確的廣告和內容排名模型。“

NVIDIA面向推理的 AI 平臺包括了新的 NVIDIA 認證系統，全新A2 GPU

NVIDIA 認證系統可以幫助客戶在高性能、經濟高效且可擴展的基礎設施上為各種現代 AI 應用識別、獲取和部署系統，該認證系統現在包含兩個新的邊緣AI類別。

擴展的類別允許 NVIDIA 系統的合作伙伴為客戶提供完整系列的由基于 NVIDIA Ampere 架構的 GPU 支持的 NVIDIA 認證系統，來處理各種實際工作負載。新的 NVIDIA A2 GPU 也包含在內，它是一個入門級、低功耗的緊湊型加速器，適用于邊緣服務器中的推理和邊緣 AI。 NVIDIA A2與適用于主流企業服務器的 NVIDIA A30 、適用高性能 AI 服務器的 NVIDIA A100 一起，為邊緣、數據中心和云端的 AI 推理提供了完整的方案。

Atos、戴爾科技、技嘉、慧與、浪潮、聯想和 Supermicro 等全球領先的企業系統供應商，其AI系統產品線均支持在 NVIDIA 認證系統上使用 NVIDIA AI Enterprise。

其他系統提供商，如研華科技、ASRock Rack、華碩、寧暢、新華三和 QCT 也為各種工作負載提供了 NVIDIA 認證系統。包括研華科技、技嘉和聯想在內的領先供應商將很快推出首款通過新邊緣類別認證的 NVIDIA 認證系統。

供貨情況

Triton 通過 NVIDIA NGC 目錄提供。NVIDIA NGC是針對 GPU 優化的 AI 軟件中心，包括框架、工具包、預訓練模型和 Jupyter Notebooks。Triton源代碼可從 Triton GitHub 資源庫獲取。

NVIDIA 開發者計劃成員可通過 TensorRT 頁面獲取 TensorRT。最新版本的插件、解析器和示例也以開源形式提供，可從 TensorRT GitHub 資源庫獲取。

客戶可以通過今日獨家發布的 NVIDIA LaunchPad中的全球精選實驗室，在 NVIDIA AI Enterprise 軟件套件中體驗 NVIDIA Triton。

NVIDIA AI Enterprise 軟件套件可通過全球 NVIDIA 渠道合作伙伴獲取，包括 Atea、Axians、Carahsoft Technology Corp.、Computacenter、Insight Enterprises、Presidio、Sirius、SoftServe、SVA System Vertrieb Alexander GmbH、TD SYNNEX、Trace3 和 WWT。

閱讀全文

cpu(206166) cpu(206166)
NVIDIA(101461) NVIDIA(101461)
gpu(126255) gpu(126255)
服務器(82172) 服務器(82172)
AI(263628) AI(263628)

NVIDIA擴大AI推理性能領先優勢，首次在Arm服務器上取得佳績

最新MLPerf基準測試表明，NVIDIA已將其在AI推理性能和能效方面的高標準擴展到Arm以及x86計算機。

2021-09-23 14:18:06

2518

MLPerf V2.0推理結果放榜，NVIDIA表現搶眼

不久前，AI性能基準評測平臺MLPerf公布了2022年首次推理（Inference v2.0）測試成績，NVIDIA的AI平臺表現依然搶眼。

2022-04-15 22:12:00

2738

NVIDIA 如何應對會話式AI帶來的推理挑戰？

NVIDIA Turing GPU和Xavier 芯片系統在首個獨立AI推理基準測試 ——MLPerf Inference 0.5中取得第一名。

2019-11-08 16:53:29

5054

NVIDIA打破AI推理性能記錄

　NVIDIA憑借A100進一步擴大了在MLPerf基準測試中的領先優勢，實現了比CPU快237倍的AI推理性能，助力企業將AI研究轉化為生產力。

2020-10-22 14:07:58

714

NVIDIA 借助超大規模 AI 語言模型為全球企業賦能

NVIDIA NeMo Megatron 框架; 可定制的大規模語言模型 Megatron 530B；多GPU、多節點 Triton推理服務器助力基于語言的AI開發和部署，推動行業和科學發展。

2021-11-10 14:22:52

752

40/5000 XenApp 7.14.1和NVIDIA M10許可

Windows Server 2016許可證服務器上獲取并安裝了環境的NVIDIA Virtual Applications許可證。選擇虛擬應用程序許可證的決定基于使用XenApp（已發布的應用程序/桌面

2018-09-25 17:32:49

Ai 部署的臨界考慮電子指南

雖然GPU解決方案對訓練，AI部署需要更多。預計到2020年代中期，人工智能行業將增長到200億美元，其中大部分增長是人工智能推理。英特爾Xeon可擴展處理器約占運行AI推理的處理器單元的70

2023-08-04 07:25:00

NVIDIA Jetson介紹

首發極術社區如對Arm相關技術感興趣，歡迎私信 aijishu20加入技術微信群。分享內容NVIDIA Jetson是嵌入式計算平臺，具有低功耗、高性能和小體積等特點，可加速各行業的AI應用落地

2021-12-14 08:05:01

NVIDIA 在首個AI推理基準測試中大放異彩

此次測試的十二家公司中，只有NVIDIA AI平臺提交了 MLPerf的全部五項推理測試成績（MLPerf是一個于2018年5月成立的行業基準測試小組）。這證明了NVIDIA CUDA-X AI

2019-11-08 19:44:51

Nvidia Tesla與Nvidia GRID vGPU購買SUMS服務是否正確理解了所有內容

我們計劃使用2臺Nvidia Tesla M60顯卡進行遠程管理，并可選擇進一步擴展，使用HP Apollo 2600服務器。據我了解，要部署遠程虛擬管理，我們需要Nvidia GRID程序

2018-09-13 17:08:32

nVidia許可服務器存在問題

客戶在其環境中擁有nVidia Licensing服務器（vSphere Enterprise Plus和Horizo??n 7）。許可證文件在nVidia企業門戶中生成，并且許可證服務器中安裝了2

2018-09-20 11:41:44

可以安裝NVIDIA許可證服務器嗎？

嗨，我想知道，如果可以安裝NVIDIA許可證服務器嗎？我沒有找到任何關于此的明確文件。 setup.exe也沒有我能夠使用的任何清晰的開關/參數。謝謝，延以上來自于谷歌翻譯以下為原文Hi, I

2018-09-18 16:18:10

基于SRAM的方法可以加速AI推理

基于SRAM的方法可加速AI推理

2020-12-30 07:28:28

如何在RK3399上搭建Tengine AI推理框架呢

Tengine是什么？如何在RK3399這一 Arm64 平臺上搭建 Tengine AI 推理框架，并運行圖像識別相關應用？

2022-03-07 07:53:43

如何在RK3399這一 Arm64平臺上搭建Tengine AI推理框架呢

Tengine是什么呢？如何在RK3399這一 Arm64平臺上搭建Tengine AI推理框架呢？

2022-03-04 12:31:35

深度剖析OpenHarmony AI調度管理與推理接口

1 簡介AI任務管理與統一的推理能力提供了接口的統一標準系統上CPU提供了AI任務調度管理的能力，對AI的能力進行了開放的推理和推理，同時，提供了一個不同的生命周期框架層級的應用程序。推理接口

2022-03-25 11:15:36

深度學習推理和計算-通用AI核心

商業發行之前就已經過時了。算法明天需要對架構、內存/數據進行徹底改革資源和能力。推理的夢幻建筑重新定義重寫在計算和交付突破性的人工智能加速和靈活的計算能力超越了服務器級CPU和比GPU/ASIC通用

2020-11-01 09:28:57

NVIDIA深度學習平臺

為幫助數據科學家和開發人員充分利用深度學習領域中的機遇，NVIDIA為其深度學習軟件平臺發布了三項重大更新，它們分別是NVIDIA DIGITS 4、CUDA深度神經網絡庫(cuDNN)5.1和全新的GPU推理引擎(GIE)。　　 NVIDIA深度學習軟件平臺推三項重大更新

2016-08-06 15:00:26

1806

NVIDIA在最新AI推理基準測試中大獲成功

MLPerf Inference 0.5是業內首個獨立AI推理基準套件，其測試結果證明了NVIDIA Turing數據中心GPU以及 NVIDIA Xavier 邊緣計算芯片系統的性能。

2019-11-29 14:45:02

2696

NVIDIA推出一款突破性的推理軟件可以實現會話式AI應用

2019年12月18日— — NVIDIA于今日發布一款突破性的推理軟件。借助于該軟件，全球各地的開發者都可以實現會話式AI應用，大幅減少推理延遲。而此前，巨大的推理延遲一直都是實現真正交互式互動的一大阻礙。

2019-12-19 10:06:51

1045

NVIDIA發布了首款基于NVIDIA Ampere架構的GPU ——NVIDIA A100 GPU

了全球超強大的AI和HPC服務器平臺HGX A100，最大可組成AI算力達10 PFLOPS的超大型服務器。

2020-06-02 17:11:45

3709

NVIDIA和多家全球領先的服務器制造商發布多款內置NVIDIA A100的系統

NVIDIA和多家全球領先的服務器制造商于今日發布多款內置NVIDIA A100的系統。這些系統具有多種不同的設計和配置，可應對AI、數據科學和科學計算領域最復雜的挑戰。

2020-06-24 16:04:33

2585

NVIDIA GPU加速AI推理洞察，推動跨行業創新

這些AI模型被運行在裝載了V100Tensor Core GPU的NVIDIADGX系統上的數據中心服務器上，以及裝載了JetsonAGX Xavier模塊的邊緣計算網絡中。該硬件運行NVIDIA

2020-07-02 15:00:54

1819

NVIDIA A100 GPU推理性能237倍碾壓CPU

）的12個提交者增加了近一倍。結果顯示，今年5月NVIDIA（Nvidia）發布的安培（Ampere）架構A100 Tensor Core GPU，在云端推理的基準測試性能是最先進Intel CPU

2020-10-23 17:40:02

3929

NVIDIA公布通過NVIDIA認證系統測試的全球首批加速服務器企業 AI 使用量倍增

芯東西1月27日報道，剛剛，NVIDIA公布通過NVIDIA認證系統測試的全球首批加速服務器，它們是目前業內唯一通過現代工作負載測試的服務器，可用于機器學習和分析。通過NVIDIA認證系統的產品

2021-01-27 16:25:59

1716

NVIDIA發布面向企業的即時AI基礎設施

領導者 Equinix 將首先加入 AI LaunchPad 程序，其將通過 Platform Equinix 平臺向全球提供由 NVIDIA 支持的混合云解決方案。Equinix 基礎設施在幾分鐘內就能部

2021-06-24 17:35:50

2095

NVIDIA在推理方面取得突破，從云端到邊緣實現更智能、更具互動性的對話式AI

NVIDIA于今日發布公司第八代AI軟件TensorRT? 8。該軟件將語言查詢推理時間縮短了一半，使開發者能夠從云端到邊緣構建全球最佳性能的搜索引擎、廣告推薦和聊天機器人。

2021-07-21 15:07:57

3208

NVIDIA技術助力線上大模型推理

自然語言理解、匹配排序等等，這些模型的訓練和推理都大量依賴于NVIDIA GPU，尤其在推理方面，NVIDIA GPU及相應的解決方案都滿足了業務所需的延遲和吞吐要求。微信搜索業務需要更高效平臺微信搜索業務由多個子模塊構成，包括查

2021-10-28 15:28:12

1551

NVIDIA為全球企業開發和部署大型語言模型打開一扇新的大門

NVIDIA NeMo Megatron 框架; 可定制的大規模語言模型Megatron 530B；多GPU、多節點 Triton推理服務器助力基于語言的AI開發和部署，推動行業和科學發展

2021-11-12 14:30:07

1327

NVIDIA宣布其AI推理平臺的重大更新

Capital One、Microsoft、Samsung Medison、Siemens Energy、Snap等25000多家客戶都在使用該平臺。這些更新包括開源NVIDIA Triton推理服務器

2021-11-12 14:42:53

1684

NVIDIA邊緣網絡技術加速企業AI發展

平臺），NVIDIA和Mavenir 正在實現智能邊緣網絡構建方式的創新。企業和電信公司能夠利用配備聚合加速器的邊緣服務器快速部署各種AI 技術，例如同時部署NVIDIA Metropolis智

2021-11-15 14:25:56

2108

NVIDIA宣布擴大NVIDIA LaunchPad計劃在全球的覆蓋區域

。符合條件的企業可以體驗用于AI開發的NVIDIA Base Command云服務、用于AI部署的NVIDIA F

2021-11-15 15:14:50

1546

NVIDIA Triton 推理服務器助力西門子提升工業效率

西門子能源公司正在發揮 NVIDIA Triton 推理服務器的強大力量，利用 AI 協助解決全球發電廠在預測性服務管理方面的擔憂。

2021-11-16 16:25:31

3490

NVIDIA Triton開源推理服務軟件三大功能推動效率提升

Microsoft Teams借助AI生成的實時字幕和轉錄功能，幫助全球學生和職場人士順利進行在線會議。用于訓練的NVIDIA AI計算技術和用于推理語音識別模型的NVIDIA Triton推理服務器進一步提升了這兩個功能。

2022-01-04 14:20:11

1407

NVIDIA Triton推理服務器幫助Teams使用認知服務優化語音識別模型

2022-01-04 17:45:12

1472

NVIDIA AI 大力推進語音、推薦系統和超大規模推理領域的發展

NVIDIA AI 可供開發者免費使用，包括用于語音 AI 的 NVIDIA Riva 和用于智能推薦系統的 NVIDIA Merlin?，這兩款軟件均已正式全面上線。而整個軟件套件也進行了更新，包括 NVIDIA Triton、NeMo、Maxine 和 TAO 工具包等工具。

2022-03-23 14:27:08

1058

GTC2022大會黃仁勛：NVIDIA Triton是AI部署的“中央車站”

GTC2022大會黃仁勛：NVIDIA Triton是AI部署的“中央車站”，支持在每一代NVIDIA GPU、x86和ARM CPU上部署模型。

2022-03-23 16:23:04

1259

NVIDIA助力微軟將AI Transformer模型投入生產用途

Microsoft 的目標是，通過結合使用 Azure 與 NVIDIA GPU 和 Triton 推理軟件，率先將一系列強大的 AI Transformer 模型投入生產用途。

2022-03-28 09:43:38

1029

NVIDIA加速VIVO推薦系統部署艾默生公布2022第一季度業績

推薦系統的大規模部署帶來了諸多工程化挑戰，借助NVIDIA TensorRT， Triton and MPS （Multi-Process Service）及單張T4 GPU推理卡，其性能優于約6臺以上的78核CPU服務器，成本方面也降低75%。

2022-03-29 15:25:05

1106

NVIDIA TensorRT 8.2將推理速度提高6倍

　　TensorRT 是一款高性能的深度學習推理優化器和運行時，為人工智能應用程序提供低延遲、高吞吐量推理。 TensorRT 用于醫療、汽車、制造、互聯網/電信服務、金融服務和能源等多個行業。

2022-03-31 17:10:29

1469

NVIDIA發布Riva語音AI和大型LLM軟件

　　它包括Megatron方面的進步，這是一個由 NVIDIA 研究人員領導的開源項目，旨在開發有效培訓法學碩士的技術。企業可以使用 NeMo Megatron 定制 LLM ，如 Megatron 530B ，并使用 NVIDIA Triton 推理服務器跨多個 GPU 和節點進行部署。

2022-04-01 16:27:36

10987

Microsoft使用NVIDIA Triton加速AI Transformer模型應用

Microsoft 的目標是，通過結合使用 Azure 與 NVIDIA GPU 和 Triton 推理軟件，率先將一系列強大的 AI Transformer 模型投入生產用途。

2022-04-02 13:04:21

1456

使用MIG和Kubernetes部署Triton推理服務器

　　NVIDIA Triton 推理服務器是一款開源人工智能模型服務軟件，可簡化在生產中大規模部署經過培訓的人工智能模型。對于服務器管理的任何模型，客戶端可以遠程向提供的 HTTP 或 gRPC 端點發送推斷請求。

2022-04-07 09:54:05

2902

使用Bottlerocket和Amazon EC2部署AI模型

　　對于 AWS 上的人工智能推理部署，您可以利用 NVIDIA Triton 推理服務器 。使用開源推理服務軟件在任何 CPU 或 CPU 基礎設施上部署來自多個框架的經過培訓的人工智能模型，包括 TensorFlow 、 TensorRT 、 PyTorch 、 ONNX 、 XGBoost 和 Python 。

2022-04-08 15:37:28

881

NVIDIA推理平臺和全棧方法提供最佳性能

現在，您和開發人員社區的其他成員都可以使用這些成果，主要是以開源軟件的形式。此外， TensorRT 和 Triton 推理服務器可從?NVIDIA NGC?免費獲得，以及預訓練模型、深度學習框架

2022-04-08 16:31:31

931

NVIDIA Triton推理服務器簡化人工智能推理

GKE 的 Triton 推理服務器應用程序是一個 helm chart 部署程序，可自動安裝和配置 Triton ，以便在具有 NVIDIA GPU 節點池的 GKE 集群上使用，包括

2022-04-08 16:43:03

1855

NVIDIA Triton助力騰訊構建高性能推理服務

通過將 Triton 編譯為動態鏈接庫，可以方便地鏈入公司內部框架，對接公司的平臺治理體系。符合 C 語言規范的 API 也極大降低了用戶的接入成本。

2022-04-10 10:08:31

1104

如何使用Triton進行高效的推理部署

一個完整的醫療影像推理流程一般包含數據的前處理、AI 推理以及數據后處理這幾部分。

2022-04-10 15:06:09

2396

用NVIDIA TSPP和Triton推理服務器加速模型推理

NVIDIA 時間序列預測平臺提供從訓練到時間序列模型的推斷的端到端 GPU 加速。平臺中包含的參考示例經過優化和認證，可在 NVIDIA DGX A100 和 NVIDIA 認證系統上運行。

2022-04-10 17:44:04

1762

如何使用FIL后端部署XGBOOST模型

　　使用 FIL 后端，NVIDIA Triton 推理服務器現在提供了一個高度優化的實時服務的森林模型，無論是在他們自己或旁邊的深度學習模型。

2022-04-11 14:35:54

1138

NVIDIA TensorRT助力打造AI計算機視覺算法推理平臺

“在使用 NVIDIA TensorRT和NVIDIA T4 GPU對平臺賦能后，“極星”推理平臺的算法推理效率得到了進一步的提升，更好地支持速接入各類算法、數據及智能設備，實現AI自閉環能力，并通過應用服務和標準化接口，幫助終端客戶低成本實現AI與業務的結合，快速構建智能應用。

2022-04-13 14:49:19

862

使用NVIDIA Triton推理服務器簡化邊緣AI模型部署

　　NVIDIA Triton 有助于在每個數據中心、云和嵌入式設備中實現標準化的可擴展生產 AI 。它支持多個框架，在 GPU 和 DLA 等多個計算引擎上運行模型，處理不同類型的推理查詢。通過與 NVIDIA JetPack 的集成， NVIDIA Triton 可用于嵌入式應用。

2022-04-18 15:40:02

2306

利用NVIDIA Triton推理服務器加速語音識別的速度

網易互娛 AI Lab 的研發人員，基于 Wenet 語音識別工具進行優化和創新，利用 NVIDIA Triton 推理服務器的 GPU Batch Inference 機制加速了語音識別的速度，并且降低了成本。

2022-05-13 10:40:19

1481

NVIDIA Triton助力騰訊PCG加速在線推理

　　借助NVIDIA Triton 推理框架，配合 DALI/FIL/Python 等Backend，以及 TensorRT，整體推理服務的吞吐能力最大提升 6 倍，延遲最大降低 40%。

2022-05-20 15:25:10

2131

使用NVIDIA Triton模型分析器確定最佳AI模型服務配置

在這篇文章中，我們使用預訓練 BERT Hugging Face 的大型模型，采用 PyTorch 格式。 NVIDIA Triton 推理服務器可以使用其LibTorch后端為TorchScript模型提供服務，也可以使用其 Python 后端為純 PyTorch 模型提供服務。

2022-05-30 09:38:08

2378

實現智能制造的工業推理管道

　　使用 NVIDIA Triton ?聲波風廓線儀，愛夏可在數據中心使用高性能 GPU 或在靠近數據的邊緣使用 Jetson 邊緣 AI 平臺部署預訓練模型的優化版本。

2022-05-30 09:46:57

609

基于NVIDIA Triton的AI模型高效部署實踐

NVIDIA Triton 推理服務器(以前稱為 TensorRT 推理服務器)是一款開源軟件，可簡化深度學習模型在生產環境中的部署。借助 Triton 推理服務器，Devops 和 MLops

2022-06-28 15:49:47

1293

NVIDIA助力阿里巴巴天貓精靈大幅提升服務運行效率

NVIDIA Triton 推理服務器在 NVIDIA T4 GPU 上進行高效部署，幫助阿里巴巴天貓精靈流式 TTS 服務將吞吐提升 50%，首包延時降低 35%，大幅提升服務運行效率，提升資源利用率。

2022-07-14 10:05:00

817

NVIDIA Triton的概念、特性及主要功能

NVIDIA Triton 推理服務器是 NVIDIA AI 平臺的一部分，它是一款開源推理服務軟件，可助力標準化模型的部署和執行，并在生產環境中提供快速且可擴展的 AI。

2022-07-18 10:11:26

2525

騰訊云與NVIDIA仍持續為AI推理加速進行合作

騰訊云計算加速套件 TACO Kit 包含 TACO Train 和 TACO Infer 兩個 AI 組件。基于 GPU 異構計算平臺針對業界 AI 訓練和推理任務進行了全方位的加速優化。TACO

2022-08-31 09:24:07

1235

騰訊云TI平臺利用NVIDIA Triton推理服務器構造不同AI應用場景需求

騰訊云 TI 平臺 TI-ONE 利用 NVIDIA Triton 推理服務器構造高性能推理服務部署平臺，使用戶能夠非常便捷地部署包括 TNN 模型在內的多種深度學習框架下獲得的 AI 模型，并且顯著提升推理服務的吞吐、提升 GPU 利用率。

2022-09-05 15:33:01

1419

螞蟻鏈AIoT團隊與NVIDIA合作加速AI推理

螞蟻鏈 AIoT 團隊與 NVIDIA 合作，將量化感知訓練(QAT)技術應用于深度學習模型性能優化中，并通過 NVIDIA TensorRT 高性能推理 SDK 進行高效率部署，通過 INT8 推理，吞吐量提升了 3 倍，助力螞蟻鏈版權 AI 平臺中的模型推理服務大幅降本增效。

2022-09-09 09:53:52

872

蔚來基于NVIDIA Triton搭建的推理服務平臺

在近日舉行的 GTC 大會上，蔚來 AI 平臺負責人白宇利帶來非常有價值的分享，他首次對外透露了蔚來自研的全棧式自動駕駛系統（NAD）的部署和開發情況，同時也將蔚來自動駕駛研發平臺（NADP）這個神秘的“Peta Factory”帶到了公眾視野中。

2022-10-09 10:18:20

661

使用推理服務器加速大型Transformer模型的推理

這是討論 NVIDIA FasterTransformer 庫的兩部分系列的第一部分，該庫是用于對任意大小（多達數萬億個參數）的Transformer進行分布式推理的最快庫之一。它提供了 FasterTransformer 的概述，包括使用該庫的好處。

2022-10-10 16:07:48

1067

使用NVIDIA Triton解決人工智能推斷挑戰

Triton 為高效的多模型推理帶來了一種新的模型編排服務。該軟件應用程序目前處于早期使用階段，有助于以資源高效的方式簡化 Kubernetes 中 Triton 實例的部署，其中包含許多模型。此服務的一些關鍵功能包括：

2022-10-11 14:24:32

972

NADP加Triton搭建穩定高效的推理平臺

蔚來自動駕駛研發平臺（NADP）是著力服務于自動駕駛核心業務方向的研發平臺。平臺化的推理能力作為常規機器學習平臺的重要組成部分，也是NADP所重點建設和支持的能力之一。 NADP所支持的推理業務，整體上有以下幾個特性：

2022-10-12 09:32:29

724

通過稀疏性支持和變壓器優化增強AI推理

　　NVIDIA 張量RT 是一個高性能推理平臺，對于利用 NVIDIA 張量核心 GPU 的強大功能至關重要。TensorRT 8 是一個具有增強功能的軟件開發工具包，旨在提高性能和準確性，以應對邊緣和嵌入式設備中發生的越來越多的 AI 推理。它允許對張量流和PyTorch神經網絡進行廣泛的計算推斷。

2022-10-18 09:32:46

390

NVIDIA GPU加速潞晨科技Colossal-AI大模型開發進程

通過 NVIDIA GPU 加速平臺，Colossal-AI 實現了通過高效多維并行、異構內存管理、大規模優化庫、自適應任務調度等方式，更高效快速部署 AI 大模型訓練與推理。

2022-10-19 09:39:39

1149

NVIDIA Triton推理服務器的基本特性及應用案例

推理識別是人工智能最重要的落地應用，其他與深度學習相關的數據收集、標注、模型訓練等工作，都是為了得到更好的最終推理性能與效果。

2022-10-26 09:43:57

1370

NVIDIA Triton推理服務器的功能與架構簡介

前面文章介紹微軟 Teams 會議系統、微信軟件與騰訊 PCG 服務三個 Triton 推理服務器的成功案例，讓大家對 Triton 有初步的認知，但別誤以為這個軟件只適合在大型的服務類應用中使用，事實上 Triton 能適用于更廣泛的推理環節中，并且在越復雜的應用環境中就越能展現其執行成效。

2022-11-02 10:44:41

1813

NVIDIA Triton系列文章：開發資源說明

與 Getting Started 屬于入門范疇，其余 User Guide、API Guide、Additional Resources 與 Customization Guide 等四個部分，都是 Triton 推理服務器非常重要的技術內容。

2022-11-09 16:17:46

506

NVIDIA Triton 系列文章（4）：創建模型倉

推理模型倉（inference model repository）是 Triton 推理服務器的最基礎元件，如同數據庫（database）服務器必須先創建一個數據庫是類似的道理。要使

2022-11-15 21:20:12

589

NVIDIA Triton 系列文章（5）：安裝服務器軟件

在前一篇文章已經帶著讀者創建一個 Triton 的推理模型倉，現在只要安裝好服務器端與用戶端軟件，就能進行基本的測試與體驗。為了簡化過程，我們使用 NVIDIA Jetson AGX Orin

2022-11-22 19:50:02

882

NVIDIA Triton 系列文章（6）：安裝用戶端軟件

在前面的文章中，已經帶著讀者創建好 Triton 的模型倉、安裝并執行 Triton 推理服務器軟件，接下來就是要安裝 Triton 用戶端軟件，對服務器提出推理請求（requests），才能觸發

2022-11-29 19:20:06

751

在 NGC 上玩轉新一代推理部署工具 FastDeploy，幾行代碼搞定 AI 部署

模型，并提供開箱即用的云邊端部署體驗，實現 AI 模型端到端的推理性能優化。歡迎廣大開發者使用 NVIDIA 與飛槳聯合深度適配的 NGC 飛槳容器，在 NVIDIA GPU 上進

2022-12-13 19:50:05

909

NVIDIA Triton 系列文章（9）：為服務器添加模型

的材料，處理起來是很容易的，比較復雜的部分是配置文件 config.pbtxt 的內容，里面提供 Triton 服務器用來管理模型執行特

2022-12-27 21:20:07

715

NVIDIA Triton 系列文章（10）：模型并發執行

前面已經做好了每個推理模型的基礎配置，基本上就能正常讓 Triton 服務器使用這些獨立模型進行推理。接下來的重點，就是要讓設備的計算資源盡可能地充分使用，首先第一件事情就是模型并發執行

2023-01-05 11:55:06

637

NVIDIA 助力 DeepRec 為 vivo 推薦業務實現高性能 GPU 推理優化

本案例中，vivo 人工智能推薦算法組自研的推薦服務平臺，使用阿里巴巴開源大規模稀疏模型訓練和預測引擎 DeepRec，在稀疏模型訓練（稀疏功能、I/O 優化）和高性能推理框架層面，實現其搜廣推各類

2023-01-18 00:55:01

548

如何最大化推理性能？Triton 社區技術交流活動與您暢聊

、NVIDIA 的技術專家將帶來 AI Infra 、推理引擎相關的專題分享，包括目前各企業面臨的模型推理挑戰、Triton 的應用及落地的具體方案等，現身說法，干貨十足。此外，還有來自

2023-02-15 16:10:05

207

寧暢率先支持NVIDIA L4 和 L40 GPU

從元宇宙到AIGC，全球AI熱潮迭起，拉動巨大算力需求。作為AI與元宇宙全球盛會，于3月20-23日舉行的NVIDIA GTC將展示這一輪新的全球技術變革。寧暢X620 G50全能型AI服務器率先

2023-03-22 14:27:49

525

NVIDIA推出用于大型語言模型和生成式AI工作負載的推理平臺

日 – NVIDIA于今日推出四款推理平臺。這些平臺針對各種快速興起的生成式AI應用進行了優化，能夠幫助開發人員快速構建用于提供新服務和洞察的AI驅動的專業應用。 ? 這些平臺將NVIDIA的全棧推理

2023-03-22 14:48:39

256

GTC23 | NVIDIA 推出用于大型語言模型和生成式 AI 工作負載的推理平臺

日 – NVIDIA 于今日推出四款推理平臺。這些平臺針對各種快速興起的生成式 AI 應用進行了優化，能夠幫助開發人員快速構建用于提供新服務和洞察的 AI 驅動的專業應用。這些平臺將 NVIDIA

2023-03-23 06:55:02

654

GTC23 | NVIDIA 攜手谷歌云提供強大的全新生成式 AI 平臺，基于新款 L4 GPU 和 Vertex AI 構建

NVIDIA 生成式 AI 推理平臺將集成至谷歌云 Vertex AI 中；谷歌云成為首家提供 NVIDIA L4 GPU 實例的云服務商加利福尼亞州圣克拉拉 – GTC – 太平洋時間 2023

2023-03-23 06:55:02

438

超過1000家公司正在使用NVIDIA Metropolis開發者工具視覺AI解決方案

NVIDIA在3月23日周四舉行的全球AI和元宇宙大會GTC上發布了多項引爆新一輪視覺AI熱潮的技術更新，包括用于創建自定義生產級AI模型的NVIDIA TAO工具套件5.0、用于開發視覺AI應用和服務的軟件開發工具套件NVIDIA DeepStream擴展...

2023-03-27 16:57:40

927

NVIDIA 在 MLPerf 測試中將推理帶到新高度

的第三方基準測試，MLPerf 仍是衡量 AI 性能的權威標準。自 MLPerf 誕生以來，NVIDIA 的 AI 平臺在訓練和推理這兩個方面一直展現出領先優勢，包括最新發布的 MLPerf

2023-04-08 00:30:08

389

NVIDIA GPU 加速 WPS Office AI 服務，助力打造優質的用戶體驗

案例介紹金山辦公與 NVIDIA 團隊合作，通過 NVIDIA Tensor Core GPU、TensorRT 提升圖像文檔識別與理解的推理效率；借助 NVIDIA Triton 推理服務器

2023-06-29 21:35:04

366

如何使用NVIDIA Triton 推理服務器來運行推理管道

使用集成模型在 NVIDIA Triton 推理服務器上為 ML 模型管道提供服務

2023-07-05 16:30:34

1082

SIGGRAPH 2023 | NVIDIA 與全球數據中心系統制造商大力推動 AI 與工業數字化的發展

OVX 服務器采用全新 NVIDIA GPU 以加速訓練和推理以及圖形密集型工作負載，將通過戴爾科技、慧與、聯想、超微等公司提供。洛杉磯 — SIGGRAPH — 太平洋時間 2023

2023-08-09 19:10:06

264

生成式AI時代要來了嗎 NVIDIA生成式AI獲新突破

這些性能強大的新系統將利用 NVIDIA Omniverse 平臺加速高計算密集度的復雜應用，包括 AI 訓練和推理、3D 設計和可視化、視頻處理、工業數字化等。

2023-08-23 14:20:18

224

全球領先系統制造商推出 NVIDIA AI 就緒型服務器，為企業大幅提升生成式 AI 性能

with NVIDIA 拉斯維加斯 — VMware Explore — 太平洋時間 2023 年 8 月 22 日 — NVIDIA 宣布，全球領先的系統制造商將推出 AI 就緒型服務器，其支持同發布的 VMware

2023-08-23 19:10:09

350

NVIDIA Grace Hopper 超級芯片橫掃 MLPerf 推理基準測試

超級芯片首次亮相 MLPerf 行業基準測試，其運行了所有數據中心推理測試，進一步擴大了 NVIDIA H100 Tensor Core GPU 的領先優勢。總體測試結果表明，NVIDIA AI

2023-09-12 20:40:04

249

NVIDIA Grace Hopper超級芯片橫掃MLPerf推理基準測試

Hopper超級芯片首次亮相 MLPerf 行業基準測試，其運行了所有數據中心推理測試，進一步擴大了NVIDIA H100 Tensor Core GPU的領先優勢。 ? 總體測試結果表明，NVIDIA AI

2023-09-13 09:45:40

139

周四研討會預告 | 注冊報名 NVIDIA AI Inference Day - 大模型推理線上研討會

，使用 NVIDIA Triton TM? 推理服務器進行端到端部署 LLM Serving，以及金融行業的 AI、NLP/LLM 應用場景、客戶案例。通過本次活動，您將了解基于上述產品的 LLM

2023-10-26 09:05:02

174

NVIDIA 為全球領先的 AI 計算平臺 Hopper 再添新動力

NVIDIA HGX? H200，為 Hopper 這一全球領先的 AI 計算平臺再添新動力。NVIDIA HGX H200 平臺基于 NVIDIA Hopper? 架構，搭載 NVIDIA H200

2023-11-14 14:30:01

NVIDIA 在 Microsoft Azure 上推出面向全球企業和初創公司的生成式 AI Foundry 服務

和初創公司在 Microsoft Azure 上開發、調優和部署其自定義生成式 AI 應用。 ? 這項 NVIDIA AI foundry 服務整合了 NVIDIA AI Foundation

2023-11-16 14:13:08

116

NVIDIA 在 Microsoft Azure 上推出面向全球企業和初創公司的生成式 AI Foundry 服務

AI Enterprise 軟件進行部署 NVIDIA 于今日推出一項 AI foundry 服務，助力企業和初創公司在 Microsoft Azure 上開發、調優和部署其自定義生成式 AI

2023-11-16 21:15:02

270

利用NVIDIA產品技術組合提升用戶體驗

本案例通過利用NVIDIA TensorRT-LLM加速指令識別深度學習模型，并借助NVIDIA Triton推理服務器在NVIDIA V100 GPU上進行高效部署，幫助必優科技的文檔智能

2024-01-17 09:30:35

335

使用NVIDIA Triton推理服務器來加速AI預測

這家云計算巨頭的計算機視覺和數據科學服務使用 NVIDIA Triton 推理服務器來加速 AI 預測。

2024-02-29 14:04:40

162

已全部加載完成

搜索歷史

NVIDIA發布Triton 推理服務器重大更新，全球超過25000余家公司部署NVIDIA AI推理平臺

評論