NVIDIA擴大AI推理性能領先優勢，首次在Arm服務器上取得佳績

最新MLPerf基準測試表明，NVIDIA已將其在AI推理性能和能效方面的高標準擴展到Arm以及x86計算機。

根據今日發布的基準測試結果，NVIDIA在使用x86及Arm CPU進行AI推理時取得了最佳成績。

這是NVIDIA連續第三次在MLCommons推理測試中創造性能和能效紀錄。MLCommons是一家成立于2018年5月的行業基準測試組織。

這場測試是第一次在Arm系統上進行數據中心類別的測試，這使用戶在部署AI這一目前最具變革性的技術時有了更多的選擇。

無與倫比的性能

在最新一輪測試中，由NVIDIA AI平臺驅動的系統在所有七項推理性能測試中都名列前茅，這些系統來自NVIDIA和其九家生態系統合作伙伴，包括阿里巴巴、戴爾科技、富士通、技嘉、慧與、浪潮、聯想、寧暢和超微。

NVIDIA是唯一一家在本輪和迄今為止每一輪測試中取得所有MLPerf測試結果的公司。

推理（Inference）指計算機通過運行AI軟件來識別對象或進行預測。在這個過程中，計算機使用深度學習模型來過濾數據，進而發現人類所無法捕捉的結果。

MLPerf推理基準測試基于當今最常用的AI工作負載和場景，涵蓋計算機視覺、醫學影像、自然語言處理、推薦系統、強化學習等。

因此，無論用戶部署何種AI應用，都可以通過NVIDIA創造自己的紀錄。

為什么性能十分重要

隨著AI用例從數據中心擴展到邊緣和其他領域，AI模型和數據集將不斷增加。就是為什么用戶需要既可靠又能靈活部署的性能。

MLPerf讓用戶有信心做出明智的購買決定。該組織得到了幾十家行業領導者的支持，包括阿里巴巴、Arm、百度、谷歌、英特爾和NVIDIA，因此這些測試是透明的和客觀的。

將Arm靈活應用于企業AI

憑借在能效性能上的不斷增長和不斷擴展的軟件生態系統，Arm架構正在向全球各地的數據中心進軍。

最新基準測試表明，作為GPU加速的平臺，在AI推理工作中，使用Ampere Altra CPU的Arm服務器與具有類似配置的X86服務器提供的性能幾乎相同。事實上，在其中的一項測試中，Arm服務器的性能甚至超過了類似配置的x86系統。

NVIDIA一直以來支持所有類型的CPU架構，十分高興地看到Arm在同行評審的行業基準測試中能夠證明其AI性能。

Arm高性能計算和工具高級總監David Lecomber表示：“作為MLCommons的創始成員，Arm致力于通過創建標準和基準來更好地應對挑戰并激發加速計算行業的創新。”

“最新推理結果表明，Arm CPU和NVIDIA GPU驅動的Arm系統已能夠應對數據中心中的各種AI工作負載。”

NVIDIA合作伙伴展示其AI性能

NVIDIA AI技術得到了廣大和日益擴展的生態系統的支持。

在最新基準測試中，七家OEM廠商共提交了22個GPU加速的平臺。

這些服務器中的大多數型號都是NVIDIA認證系統，經驗證可以運行多種加速工作負載，而且其中很多型號都支持上個月正式發布的NVIDIA AI Enterprise軟件。

參與本輪測試的合作伙伴包括戴爾科技、富士通、慧與、浪潮、聯想、寧暢、超微以及云服務提供商阿里巴巴。

軟件的力量

NVIDIA能夠在所有AI用例中取得成功的一個關鍵因素是其完整的軟件棧。

在推理方面，這包括針對各種用例的預訓練AI模型。NVIDIA TAO Toolkit運用遷移學習為特定應用定制這些模型。

NVIDIA TensorRT軟件對AI模型進行了優化，使其能夠最有效地運用內存并且實現更快的運行速度。NVIDIA經常使用該軟件進行MLPerf測試，該軟件可用于X86和Arm的系統。

在這些基準測試中，NVIDIA還采用了NVIDIA Triton 推理服務器軟件和多實例GPU（MIG）功能。它們為所有開發者提供了通常需要專家級程序員才能實現的性能。

隨著該軟件棧的不斷改進，與四個月前的MLPerf推理基準測試相比，NVIDIA提升了高達20%的性能和15%的能效。

NVIDIA在最新測試中所使用的所有軟件都可以從MLPerf資源庫中獲得，因此任何人都可以重現NVIDIA的基準測試結果。NVIDIA會陸續將這些代碼添加到NVIDIA的深度學習框架和容器中，用戶可在NVIDIA的GPU應用軟件中心NGC上獲得這些框架和容器。

其作為全棧式AI平臺的一部分，支持所有主要的處理器架構，已在最新行業基準測試中得到了驗證，并可通過多家合作伙伴獲取，助力客戶應對當今的實際AI工作任務。

閱讀全文

NVIDIA(101461) NVIDIA(101461)
AI(263628) AI(263628)
ARM服務器(5678) ARM服務器(5678)

借力Marvell ARM處理器百度實現ARM架構服務器全球首次商用

美滿電子科技（Marvell）今天宣布，中國搜索引擎巨頭百度在全球首次商用的ARM架構服務器中，采用了Marvell公司的 ARM芯片組。作為世界范圍內首家商用ARM服務器的公司，百度引領并開啟了具有更低能耗和更高性能的全新“綠色數據中心”的新時代。

2013-02-26 11:04:02

1372

英特爾FPGA 助力Microsoft Azure機器學習提供AI推理性能

Machine Learning SDK 相集成以供預覽。客戶可以使用 Azure 大規模部署的英特爾? FPGA（現場可編程邏輯門陣列）技術，為其模型提供行業領先的人工智能（AI） 推理性能。

2018-05-16 17:25:03

6184

英特爾談如何與Nvidia爭奪AI芯片市場

Nvidia不太可能很快放棄目前在AI培訓處理器市場上的領先優勢，特別是考慮到它也在該領域投入巨資。雖然服務器推理處理器市場競爭更加激烈，但英特爾可能會成為與Nvidia和Xilinx一樣強大的玩家。

2019-03-18 21:07:10

7659

MLPerf V2.0推理結果放榜，NVIDIA表現搶眼

不久前，AI性能基準評測平臺MLPerf公布了2022年首次推理（Inference v2.0）測試成績，NVIDIA的AI平臺表現依然搶眼。

2022-04-15 22:12:00

2738

NVIDIA 如何應對會話式AI帶來的推理挑戰？

NVIDIA Turing GPU和Xavier 芯片系統在首個獨立AI推理基準測試 ——MLPerf Inference 0.5中取得第一名。

2019-11-08 16:53:29

5054

NVIDIA GPU加速的ARM服務器，能否開創計算架構新紀元？

NVIDIA與Arm、Ampere、Cray、富士通、HPE、Marvell攜手構建GPU加速服務器，以滿足從超大規模云到邊緣、從模擬到AI、從高性能存儲到百萬兆級超級計算等多樣化需求。

2019-11-20 09:38:42

1384

NVIDIA打破AI推理性能記錄

　NVIDIA憑借A100進一步擴大了在MLPerf基準測試中的領先優勢，實現了比CPU快237倍的AI推理性能，助力企業將AI研究轉化為生產力。

2020-10-22 14:07:58

714

寧暢AI服務器X640 首登MLPerf 斬獲30項世界第一

寧暢工程師介紹，參加MLPerf Inference（推理）基準測試的X640 G30 AI服務器，最高可支持10張NVIDIA A100 PCIe卡或21張NVIDIA T4 PCIe卡，堪稱“性能猛獸”。

2020-10-23 10:48:37

644

ARM上實現不用接入互聯網的WEB服務器可以嗎

arm9linux系統平臺：最近查ARM9上可以用的輕型WEB服務器，有BOA， HTTPD ， THTTPD 等等，支持資源比較好的是BOA ，但這種實現方式需要接入互聯網，而且還可能集成

2022-10-28 10:53:39

Arm Neoverse NVIDIA Grace CPU 超級芯片：為人工智能的未來設定步伐

和數據吞吐量進行優化的服務器和數據中心人工智能和機器學習 (ML) 的需求。否則，人工智能所需的成本、電力和碳將開始超過收益。NVIDIA 率先使用 GPU 來提高數據中心中 HPC 和 AI 的性能

2022-03-29 14:40:21

Arm Neoverse V1的AWS Graviton3在深度學習推理工作負載方面的作用

：具有 AWS Graviton3 處理器的 c7g.4xlarge 實例集群和具有 AWS Graviton2 處理器的 c6g.4xlarge 實例集群實現的 Resnet-50 v1.5 實時推理性能

2022-08-31 15:03:46

Arm服務器助力解決CPU的設計問題

Cortex 三兄弟里最追求性能的了，但畢竟不是面向服務器平臺的產品，不能放寬功耗限制去飆性能。于是，在Graviton 公開之前一個月，Arm 發布了面向云計算和邊緣基礎設施的 Neoverse

2022-09-08 14:32:42

Arm芯片引領國產服務器逆襲？

的方式之一。作為通用的系統架構，Arm64服務器在多種數據中心應用場景都具有獨特優勢，如存儲，大數據分析，高性能計算，物聯網的邊緣計算，Android應用，容器微服務等等。Arm64服務器基于開放的芯片

2018-06-03 13:20:30

NVIDIA 在首個AI推理基準測試中大放異彩

首個獨立AI推理基準測試 ——MLPerf Inference 0.5中取得第一名。由于推理一直是AI市場中最大、同時也是最具競爭力的領域，業內此前一直希望能夠有一套客觀的推理性能測試指標。在參與

2019-11-08 19:44:51

Nvidia/ARM交易，能怎樣為下一個計算機時代創造主導的生態系統

擁有ARM而不僅僅是獲得ARM的許可，Nvidia可以添加特殊的指令來與其GPU建立更緊密的集成。為了獲得最高性能，需要將CPU和GPU集成在一個芯片上，并且由于英特爾正在開發其競爭的Xe系列加速器

2020-09-07 09:49:42

nVidia許可服務器存在問題

客戶在其環境中擁有nVidia Licensing服務器（vSphere Enterprise Plus和Horizo??n 7）。許可證文件在nVidia企業門戶中生成，并且許可證服務器中安裝了2

2018-09-20 11:41:44

在ARM9上用輕型WEB服務器可以不接入互聯網嗎

2022-07-22 14:10:59

在arm64和x86服務器上運行的耗時來發現Docker在arm64架構下的性能問題

現在的進展并不快，因為老測試集里面用例數量龐大。目前，老測試集中的用例數量還遠遠大于新測試集。問題大量的集成測試用例為性能研究提供了方便。筆者通過比較同一測試集在arm64和x86服務器上運行的耗時來

2022-07-12 15:48:13

在DragonBoard 410c上實現高并發處理TCP服務器

服務，讓傳感器和相關的控制設備接入，為此，本期blog將向大家介紹如何使用gevent高性能的并發處理庫在draognbaord 410c上來實現一個高性能的TCP服務器。gevent是基于協程

2018-09-25 15:53:03

在Linux上使用Arm NN分析和優化運行推理的機器學習應用程序的步驟

的示例是在 Arm 上運行 ML 推理的 Linux 應用程序。我們之前已經在MNIST 數據集上訓練了一個神經網絡來識別手寫數字。使用Arm NN和 Streamline，我們希望了解我們模型

2022-09-27 14:24:27

服務器特點

就不能勝任的話，一臺價值幾萬，甚至幾十萬的服務器在短時間內就要遭到淘汰，這是任何企業都無法承受的。為了保持可擴展性，通常需要在服務器上具備一定的可擴展空間和冗余件（如磁盤陣列架位、PCI和內存條插槽位

2014-08-02 10:42:26

ESP8266模塊在使用AT固件的情況下，如何通過域名取得服務器的IP地址和端口號的問題？

請問一下，關于 ESP8266 模塊在使用 AT 固件的情況下，如何通過域名取得服務器的IP地址和端口號的問題？

2023-03-08 06:36:51

ESP8266模塊在使用AT固件的情況下，如何通過域名取得服務器的IP地址和端口號的問題？

請問一下，關于 ESP8266 模塊在使用 AT 固件的情況下，如何通過域名取得服務器的IP地址和端口號的問題？

2023-03-09 06:21:51

OpenPPL Arm Server卷積實現及性能展示解析

Part 1 OpenPPL ARM Server 簡介OpenPPL Arm Server 定義? 針對高性能 ARM 架構服務器處理器優化的深度學習推理引擎? 目前支持 FP32 及 FP16

2022-03-31 11:51:33

RK3588與RK3588S在ARM陣列服務器上的應用

服務器。　　MARS3500系列，就是基于RK3588、RK3588S的高密度ARM陣列服務器，可廣泛應用于云手機、云手游、云VR、云電視、云渲染、邊緣計算、移動辦公、網絡輿情監測等領域

2022-07-18 17:54:32

linux服務器和windows服務器

，這在滿足個性化需求和增強服務器安全性上具有優勢。 Linux服務器還具有出色的性能和穩定性。相比之下，Windows服務器在性能和穩定性方面稍有不足。特別是在處理高負載和大數據量的情況下

2024-02-22 15:46:15

【產品活動】阿里云GPU云服務器年付5折！阿里云異構計算助推行業發展！

、穩定的異構計算云基礎設施資源。異構計算GN5規格族實例性能展現相信有了阿里云GPU云服務器的助力，人工智能企業和AI生態一定會取得更多更快的發展。

2017-12-26 11:22:09

云服務器安全嗎？云服務器有哪些優勢？

`現如今，隨著云計算技術的發展，現在很多企業都紛紛選擇云服務器，正是因為這種方式可以有效降低企業的成本，而且從性能上來說，也是遠遠超于傳統服務器的，使用也十分的方便。然而，還有一些朋友擔心云服務器

2021-03-27 14:31:18

云服務器有什么優勢？怎么選對云服務器？

自身的優勢，支持企業業務在彈性擴展能力上的高要求，具有高可用性，滿足企業對數據進行快速恢復需求。云服務器能夠滿足企業在電子商務、企業網站、OA系統、企業ERP/CRM管理軟件、論壇和SNS等等各種需求

2018-07-31 18:35:28

什么是服務器

、內存、系統總線等，和通用的計算機架構類似。由于服務器需要提供高可靠的服務，所以在處理能力、穩定性、可靠性、安全性、可擴展性、可管理性等方面要求較高。服務器和電腦功能都是一樣的，也可以將服務器稱之為電腦，只是服務器對穩定性與安全性以及處理器數據能力有更高要求。比如我們隨時瀏覽一個網站，發現這個網站

2021-07-16 07:35:04

充分利用Arm NN進行GPU推理

的是要知道它提供的選項來提高推理性能。作為開發人員，您會尋找可以壓縮的每一毫秒，尤其是在需要實現實時推理時。讓我們看一下Arm NN中可用的優化選項之一，并通過一些實際示例評估它可能產生

2022-04-11 17:33:06

全國領先的IDC服務商,擁有雄厚的服務器大帶寬租用資源

1.臭皮匠服務器機房分布：國內：福州，湖州，臺州，鎮江，貴州等地國外：美國，新加坡等國2.臭皮匠服務器優勢：我們具有國內技術與服務頂尖的I DC及互聯網云安全服務商！我司整合了國內領先的I DC運營

2018-04-21 15:42:54

利用設計網關的 IP 內核在 Xilinx VCK190 評估套件上加速人工智能應用

推理性能與當前服務器級 CPU 相比，VCK190 能夠提供超過 100 倍的計算性能。下面是基于 C32B6 DPU 內核的 AI 引擎實現的性能示例，批處理 = 6。有關 VCK190 上各種

2022-11-25 16:29:20

可以安裝NVIDIA許可證服務器嗎？

嗨，我想知道，如果可以安裝NVIDIA許可證服務器嗎？我沒有找到任何關于此的明確文件。 setup.exe也沒有我能夠使用的任何清晰的開關/參數。謝謝，延以上來自于谷歌翻譯以下為原文Hi, I

2018-09-18 16:18:10

基于SRAM的方法可以加速AI推理

基于SRAM的方法可加速AI推理

2020-12-30 07:28:28

如何在ARM上構建一個web服務器

本人現在在做ARM上構建一個web服務器，就是將網頁放在這個服務器上，然后接入internet可以通過PC機上網訪問即可。用的是C#編程，實際實現上還是有些模糊，希望有心人能教教俺，最好能給出服務器和客服端的程序做參考說明，先謝過了。。。

2022-10-28 10:55:15

如何在RK3399上搭建Tengine AI推理框架呢

Tengine是什么？如何在RK3399這一 Arm64 平臺上搭建 Tengine AI 推理框架，并運行圖像識別相關應用？

2022-03-07 07:53:43

如何在RK3399這一 Arm64平臺上搭建Tengine AI推理框架呢

Tengine是什么呢？如何在RK3399這一 Arm64平臺上搭建Tengine AI推理框架呢？

2022-03-04 12:31:35

如何提高YOLOv4模型的推理性能？

使用 PyTorch 對具有非方形圖像的 YOLOv4 模型進行了訓練。將權重轉換為 ONNX 文件，然后轉換為中間表示（IR）。無法確定如何獲得更好的推理性能。

2023-08-15 06:58:00

嵌入式Web服務器BOA怎么在ARM9上移植？

成本比較高，而且不方便工業現場的應用實施，嵌入式系統以及嵌入式小型Web服務器的出現使得Web服務運行在資源、性能有限的嵌入式設備上提供了條件。本文主要介紹嵌入式Web服務器BOA在ARM9嵌入式系統設備板上的移植，并對移植后的BOA服務器進行測試驗證。

2019-10-29 06:48:51

嵌入式邊緣AI應用開發指南

的參考。評估TI處理器模型性能的方式有兩種：TDA4VM入門套件評估模塊(EVM)或TI Edge AI Cloud，后者是一項免費在線服務，可支持遠程訪問TDA4VM EVM，以評估深度學習推理性能。借助

2022-11-03 06:53:28

求一種在Arm服務器上Robox安卓容器的構建與使用方案

1、在Arm服務器上Robox安卓容器方案的構建編譯過程和使用方法隨著云計算相關產業蓬勃發展，用戶對移動設備的彈性需求推動出云手機、云游戲等概念，云手機和云游戲就是將云計算技術運用于網絡終端服務

2022-06-17 14:34:24

求助，為什么將不同的權重應用于模型會影響推理性能？

生成兩個 IR文件（相同的 .xml 文件，但不同的 .bin 文件）具有不同重量的類似模型，以不同的 fps （27fps 和 6fps）運行更多樣化的權重是否會影響 Myriad X 上的推理性能？

2023-08-15 07:00:25

深度學習推理和計算-通用AI核心

商業發行之前就已經過時了。算法明天需要對架構、內存/數據進行徹底改革資源和能力。推理的夢幻建筑重新定義重寫在計算和交付突破性的人工智能加速和靈活的計算能力超越了服務器級CPU和比GPU/ASIC通用

2020-11-01 09:28:57

神經處理單元IP VIP9000怎么樣？

(NN)引擎和張量處理架構(Tensor Processing Fabric)技術提供卓越的神經網絡推理性能，具有業界領先的能耗效率（TOPS/W）和面積效率（平方毫米/瓦），可擴展的計算能力范圍從0.5TOPS（每秒萬億次運算）到幾百TOPS。

2019-09-11 11:52:13

站群服務器有哪些優勢？

網站權重提高多IP站群服務器，可以大大降低同一IP上的網站數量，如果網站數量在258以下，還可以每個網站分配一個獨立IP，從而可以減少網站之間的分權。4、多ip避免封殺網站受影響如果一個ip多個網站

2023-04-18 16:16:20

荷蘭服務器的優勢

荷蘭服務器的十大優勢 1、荷蘭機房眾多，例如荷蘭的阿姆斯特丹機房、萊茵河畔機房等，都是荷蘭乃至歐洲最優質的機房。有需要請聯系TG:@TW_001 2、荷蘭IP眾多，一臺服務器最高可以添加253個IP

2021-12-16 10:26:55

高價收購服務器內存條，服務器內存條優勢回收

內存也是內存(RAM)，具有一些特有的技術從而有著極高的穩定性和糾錯性能。最直觀的分辨服務器內存與普通內存的方法就是看條子上的字有沒有帶ECC模塊。◆◆現我司大量在服務器內存條，收購威剛服務器內存條

2021-09-22 19:20:15

高防服務器的優勢

、操作系統等，滿足不同的需求。綜上所述，高防服務器具有很多的優勢，能夠為客戶提供穩定可靠、安全高效、高品質帶寬的網絡服務。因此，在如今互聯網猖獗的環境中，選擇一個好的高防服務器，能夠在網站運營中起到關鍵

2023-03-21 12:40:07

聯發科技與ARM擴大合作關系取得ARM最新IP系列授權

27日消息 ARM與聯發科技（MediaTek）今日宣布擴大雙方長期合作關系，聯發科技取得大量市場領先的高性能ARM知識產權（IP）授權，包括可用于智能手機、智能電視與藍光播放器的ARMMali系列

2012-02-28 09:11:01

737

貝葉斯IP網絡擁塞鏈路推理

針對CLINK算法在路由改變時擁塞鏈路推理性能下降的問題，建立一種變結構離散動態貝葉斯網模型，通過引入馬爾可夫性及時齊性假設簡化該模型，并基于簡化模型提出一種IP網絡擁塞鏈路推理算法（VSDDB

2018-01-16 18:46:26

英特爾FPGA為人工智能(AI)提供推理性能

Azure Machine Learning SDK 相集成以供預覽。客戶可以使用 Azure 大規模部署的英特爾 FPGA（現場可編程邏輯門陣列）技術，為其模型提供行業領先的人工智能 (AI) 推理性能。 “作為一家整體技術提供商，我們通過與 Microsoft 密切合作為人工智能提供支持。

2018-05-20 00:10:00

2865

華為首款Arm架構服務器CPU鯤鵬920，業界最高性能Arm架構服務器CPU

TaiShan系列服務器主要面向大數據、分布式存儲和ARM原生應用等場景，發揮ARM架構在多核、高能效等方面的優勢，為企業構建高性能、低功耗的新計算平臺；例如大數據場景，實現了多核高并發和資源調度調優，計算性能提升20%。基于TaiShan服務器，華為云也將提供彈性云服務、裸金屬服務和云手機服務。

2019-01-09 09:39:05

10813

NVIDIA在最新AI推理基準測試中大獲成功

MLPerf Inference 0.5是業內首個獨立AI推理基準套件，其測試結果證明了NVIDIA Turing數據中心GPU以及 NVIDIA Xavier 邊緣計算芯片系統的性能。

2019-11-29 14:45:02

2696

NVIDIA和多家全球領先的服務器制造商發布多款內置NVIDIA A100的系統

NVIDIA和多家全球領先的服務器制造商于今日發布多款內置NVIDIA A100的系統。這些系統具有多種不同的設計和配置，可應對AI、數據科學和科學計算領域最復雜的挑戰。

2020-06-24 16:04:33

2585

NVIDIA收購Arm，打造全球首屈一指的AI計算公司

結合NVIDIA 領先的人工智能技術與 Arm 龐大的計算生態系統，讓創新成果惠及所有客戶 NVIDIA 將建立世界先進的 AI 研究和教育中心來擴大Arm在英國劍橋的研發業務，并打造采用 Arm

2020-09-21 13:44:17

1347

浪潮AI服務器NF5488A5一舉創造18項性能紀錄

美國東部時間10月21日，全球備受矚目的權威AI基準測試MLPerf公布今年的推理測試榜單，浪潮AI服務器NF5488A5一舉創造18項性能紀錄，在數據中心AI推理性能上遙遙領先其他廠商產品

2020-10-23 16:59:44

1615

NVIDIA A100 GPU推理性能237倍碾壓CPU

的237倍。 MLPerf Inference V0.7部分結果截圖最新的AI推理測試結果意味著，NVIDIA未來可能在AI推理和訓練市場都占據領導地位，給云端AI推理市場擁有優勢的Intel帶來更大壓力的

2020-10-23 17:40:02

3929

Nvidia擴大了在MLPerf Benchmark上進行AI推理的領先優勢

弗洛伊德說：“英偉達在競爭激烈的競爭者中表現出色。” 與（Nvidia）V100（GPU）相比，他們的A100效果驚人，證明了其增強的Tensor核心架構的價值。我贊揚MLPerf添加了新的基準，這些基準越來越代表快速增長的推理機會，例如推薦引擎。

2020-10-24 09:17:15

1995

浪潮AI服務器，屠榜刷新全球18項性能測試記錄

美國東部時間10月21日，全球倍受矚目的權威AI基準測試MLPerf公布今年的推理測試榜單，浪潮AI服務器NF5488A5一舉創造18項性能記錄，在數據中心AI推理性能上遙遙領先其他廠商產品。

2020-10-26 16:30:44

1709

浪潮AI服務器NF5488A5的實測數據分享，單機最大推理路數提升88%

近日，在GTC China元腦生態技術論壇上，中科極限元、趨動科技、睿沿科技等元腦生態伙伴分享了多個場景下浪潮AI服務器NF5488A5的實測數據，結果表明浪潮NF5488A5大幅提升了智能語音、圖像識別等AI模型的訓練和推理性能，促進了產業AI解決方案的開發與應用。

2020-12-24 15:25:01

2123

NVIDIA預訓練模型和遷移學習工具包3.0助力快速實現生產級AI

一個支持邊緣實時推理的姿態估計模型，其推理性能比OpenPose模型快9倍。

2021-06-25 11:55:52

1450

NVIDIA GPU助力提升模型訓練和推理性價比

，其中的模型數量達數千個，日均調用服務達到千億級別。無量推薦系統，在模型訓練和推理都能夠進行海量Embedding和DNN模型的GPU計算，是目前業界領先的體系結構設計。傳統推薦系統面臨挑戰傳統推薦系統具有以下特點：訓練是基于參數

2021-08-23 17:09:03

4486

NVIDIA宣布其AI推理平臺的重大更新

Capital One、Microsoft、Samsung Medison、Siemens Energy、Snap等25000多家客戶都在使用該平臺。這些更新包括開源NVIDIA Triton推理服務器

2021-11-12 14:42:53

1684

NVIDIA Triton 推理服務器助力西門子提升工業效率

西門子能源公司正在發揮 NVIDIA Triton 推理服務器的強大力量，利用 AI 協助解決全球發電廠在預測性服務管理方面的擔憂。

2021-11-16 16:25:31

3490

NVIDIA Triton開源推理服務軟件三大功能推動效率提升

Microsoft Teams借助AI生成的實時字幕和轉錄功能，幫助全球學生和職場人士順利進行在線會議。用于訓練的NVIDIA AI計算技術和用于推理語音識別模型的NVIDIA Triton推理服務器進一步提升了這兩個功能。

2022-01-04 14:20:11

1407

NVIDIA Triton推理服務器幫助Teams使用認知服務優化語音識別模型

2022-01-04 17:45:12

1472

GPU服務器處理性能和用例的說明

能力。一、GPU服務器處理性能和用例： 1、GPU 用例雖然投資 GPU 服務器的原因過于廣泛，無法在一篇文章中涵蓋，但我們已經概述了我們在過去幾年中看到的最喜歡的用例。 2、3D處理 GPU 服務器非常適合 2D 和 3D 計算以及渲染 3D 圖形和 GPU 技術，以至于

2022-02-22 16:44:04

1434

英偉達推出NVIDIA Grace CPU

NVIDIA Grace CPU是首款面向AI基礎設施和高性能計算的基于Arm Neoverse的數據中心專屬CPU，是當今領先服務器芯片內存帶寬和能效的兩倍。

2022-03-30 14:11:31

1489

NVIDIA發布最新Orin芯片提升邊緣AI標桿

在首次參加行業 MLPerf 基準測試時，基于 NVIDIA Ampere 架構的低功耗系統級芯片 NVIDIA Orin 就創造了新的AI推理性能紀錄，并在邊緣提升每個加速器的性能。

2022-04-08 10:14:44

4200

NVIDIA Triton推理服務器簡化人工智能推理

GKE 的 Triton 推理服務器應用程序是一個 helm chart 部署程序，可自動安裝和配置 Triton ，以便在具有 NVIDIA GPU 節點池的 GKE 集群上使用，包括

2022-04-08 16:43:03

1855

使用NVIDIA Triton推理服務器簡化邊緣AI模型部署

　　NVIDIA Triton 有助于在每個數據中心、云和嵌入式設備中實現標準化的可擴展生產 AI 。它支持多個框架，在 GPU 和 DLA 等多個計算引擎上運行模型，處理不同類型的推理查詢。通過與 NVIDIA JetPack 的集成， NVIDIA Triton 可用于嵌入式應用。

2022-04-18 15:40:02

2306

利用NVIDIA Triton推理服務器加速語音識別的速度

網易互娛 AI Lab 的研發人員，基于 Wenet 語音識別工具進行優化和創新，利用 NVIDIA Triton 推理服務器的 GPU Batch Inference 機制加速了語音識別的速度，并且降低了成本。

2022-05-13 10:40:19

1481

MLPerf是邊緣AI推理的新行業基準

　　最新的 AI 推理基準顯然具有重要意義，因為它是目前可用的最接近真實世界 AI 推理性能的衡量標準。但隨著它的成熟和吸引更多的提交，它也將成為成功部署技術堆棧的晴雨表和新實施的試驗場。

2022-07-08 15:37:55

1246

騰訊云TI平臺利用NVIDIA Triton推理服務器構造不同AI應用場景需求

騰訊云 TI 平臺 TI-ONE 利用 NVIDIA Triton 推理服務器構造高性能推理服務部署平臺，使用戶能夠非常便捷地部署包括 TNN 模型在內的多種深度學習框架下獲得的 AI 模型，并且顯著提升推理服務的吞吐、提升 GPU 利用率。

2022-09-05 15:33:01

1419

螞蟻鏈AIoT團隊與NVIDIA合作加速AI推理

螞蟻鏈 AIoT 團隊與 NVIDIA 合作，將量化感知訓練(QAT)技術應用于深度學習模型性能優化中，并通過 NVIDIA TensorRT 高性能推理 SDK 進行高效率部署，通過 INT8 推理，吞吐量提升了 3 倍，助力螞蟻鏈版權 AI 平臺中的模型推理服務大幅降本增效。

2022-09-09 09:53:52

872

NVIDIA Triton推理服務器的基本特性及應用案例

推理識別是人工智能最重要的落地應用，其他與深度學習相關的數據收集、標注、模型訓練等工作，都是為了得到更好的最終推理性能與效果。

2022-10-26 09:43:57

1370

如何最大化推理性能？Triton 社區技術交流活動與您暢聊

、NVIDIA 的技術專家將帶來 AI Infra 、推理引擎相關的專題分享，包括目前各企業面臨的模型推理挑戰、Triton 的應用及落地的具體方案等，現身說法，干貨十足。此外，還有來自

2023-02-15 16:10:05

207

192個自研核心，AmpereOne的絕對性能壓制

AI推理性能對比 / Ampere 從性能對比上，我們可以看出AmpereOne在AI推理負載上的領先，比如在生成式AI和推薦算法上，AmpereOne的單機架性能是AMD EYPC 9654 Genoa的兩倍或以上，但兩者卻有著近乎相同的系統功耗，AmpereOne的優勢在此展現得一覽無余。

2023-06-13 15:03:51

789

AI服務器與傳統服務器的區別是什么？

AI 服務器確實是整個服務器市場的一部分，但它們是專門為基于云的 AI 模型訓練或推理而設計的。在規格方面，廣義的AI服務器是指搭載AI芯片（如前面提到的GPU、FPGA、ASIC）的服務器，而狹義的定義則包括至少搭載一塊GPU的服務器。

2023-06-21 12:40:02

1208

如何使用NVIDIA Triton 推理服務器來運行推理管道

使用集成模型在 NVIDIA Triton 推理服務器上為 ML 模型管道提供服務

2023-07-05 16:30:34

1082

英特爾? AMX 加速AI推理性能，助阿里電商推薦系統成功應對峰值負載壓力

達沃斯論壇｜英特爾王銳：AI驅動工業元宇宙，釋放數實融合無窮潛力英特爾研究院發布全新AI擴散模型，可根據文本提示生成360度全景圖英特爾內部代工模式的最新進展原文標題：英特爾? AMX 加速AI推理性能，助阿里電商推薦系統成功應對峰值負載

2023-07-08 14:15:03

294

英特爾? AMX 助力百度ERNIE-Tiny AI推理性能提升2.66倍，盡釋AI加速潛能

科技賦能千行百業人民網攜手英特爾啟動“數智加速度”計劃 WAIC 2023：英特爾以技術之力推動邊緣人工智能發展，打造數字化未來“芯”時代英特爾 AMX 加速AI推理性能，助阿里電商推薦系統成功應對峰值負載壓力原文標題：英特爾? AMX 助力百度ERNIE-T

2023-07-14 20:10:05

245

全球領先系統制造商推出 NVIDIA AI 就緒型服務器，為企業大幅提升生成式 AI 性能

with NVIDIA 拉斯維加斯 — VMware Explore — 太平洋時間 2023 年 8 月 22 日 — NVIDIA 宣布，全球領先的系統制造商將推出 AI 就緒型服務器，其支持同發布的 VMware

2023-08-23 19:10:09

350

NVIDIA Grace Hopper 超級芯片橫掃 MLPerf 推理基準測試

超級芯片首次亮相 MLPerf 行業基準測試，其運行了所有數據中心推理測試，進一步擴大了 NVIDIA H100 Tensor Core GPU 的領先優勢。總體測試結果表明，NVIDIA AI

2023-09-12 20:40:04

249

NVIDIA Grace Hopper超級芯片橫掃MLPerf推理基準測試

Hopper超級芯片首次亮相 MLPerf 行業基準測試，其運行了所有數據中心推理測試，進一步擴大了NVIDIA H100 Tensor Core GPU的領先優勢。 ? 總體測試結果表明，NVIDIA AI

2023-09-13 09:45:40

139

Nvidia 通過開源庫提升 LLM 推理性能

加利福尼亞州圣克拉拉——Nvidia通過一個名為TensorRT LLM的新開源軟件庫，將其H100、A100和L4 GPU的大型語言模型(LLM)推理性能提高了一倍。正如對相同硬件一輪又一輪改進

2023-10-23 16:10:19

284

周四研討會預告 | 注冊報名 NVIDIA AI Inference Day - 大模型推理線上研討會

，使用 NVIDIA Triton TM? 推理服務器進行端到端部署 LLM Serving，以及金融行業的 AI、NLP/LLM 應用場景、客戶案例。通過本次活動，您將了解基于上述產品的 LLM

2023-10-26 09:05:02

174

利用 NVIDIA Jetson 實現生成式 AI

上以交互速率運行的 Llama-2-70B 模型。圖 1. 領先的生成式 AI 模型在? Jetson AGX Orin 上的推理性能 如要在 Jetson 上快速測試最新的模型和應用，請使用 Jetson 生成式 AI 實驗室提供的教程和資源。

2023-11-07 21:25:01

398

NVIDIA 為全球領先的 AI 計算平臺 Hopper 再添新動力

Tensor Core GPU 和領先的顯存配置，可處理生成式 AI 與高性能計算工作負載的海量數據。 ? NVIDIA H200 是首款采用 HBM3e 的 GPU，其運行更快、更大的顯存容量將進一步加速生成式 AI 與大語言模型，同時

2023-11-14 14:30:01

用上這個工具包，大模型推理性能加速達40倍

作者：英特爾公司沈海豪、羅嶼、孟恒宇、董波、林俊編者按：只需不到9行代碼，就能在CPU上實現出色的LLM推理性能。英特爾 ?Extension for Transformer 創新

2023-12-01 20:40:03

552

Torch TensorRT是一個優化PyTorch模型推理性能的工具

那么，什么是Torch TensorRT呢？Torch是我們大家聚在一起的原因，它是一個端到端的機器學習框架。而TensorRT則是NVIDIA的高性能深度學習推理軟件工具包。Torch TensorRT就是這兩者的結合。

2024-01-09 16:41:51

286

使用NVIDIA Triton推理服務器來加速AI預測

這家云計算巨頭的計算機視覺和數據科學服務使用 NVIDIA Triton 推理服務器來加速 AI 預測。

2024-02-29 14:04:40

162

已全部加載完成

搜索歷史

NVIDIA擴大AI推理性能領先優勢，首次在Arm服務器上取得佳績

評論