曰曰碰天天碰国产,一个人高清在线免费观看,又大又爽又粗免费视频

從云端到網絡邊緣，NVIDIA GH200、H100 和 L4 GPU 以及 Jetson Orin 模組在運行生產級 AI 時均展現出卓越性能。

NVIDIA GH200 Grace Hopper 超級芯片首次亮相 MLPerf 行業基準測試，其運行了所有數據中心推理測試，進一步擴大了 NVIDIA H100 Tensor Core GPU 的領先優勢。

總體測試結果表明，NVIDIA AI 平臺無論是在云端還是網絡邊緣均展現出卓越的性能和通用性。

此外，NVIDIA 宣布推出全新推理軟件，該軟件將為用戶帶來性能、能效和總體擁有成本的大幅提升。

GH200 超級芯片在 MLPerf 一騎絕塵

GH200 將一顆 Hopper GPU 和一顆 Grace CPU 連接到一個超級芯片中。這種組合提供了更大內存、更快帶寬，能夠在 CPU 和 GPU 之間自動切換計算所需要的資源，實現性能最優化。

具體而言，內置 8 顆 H100 GPU 的 NVIDIA HGX H100系統，在本輪每項 MLPerf 推理測試中均實現了最高吞吐量。

Grace Hopper 超級芯片和 H100 GPU 在所有 MLPerf 數據中心測試中均處于領先地位，包括針對計算機視覺、語音識別和醫學成像的推理，以及應用于生成式 AI 的推薦系統和大語言模型（LLM）等對性能要求更高的用例。

總體而言，此次測試結果延續了自 2018 年 MLPerf 基準測試推出以來，NVIDIA 在每一輪 AI 訓練和推理中都處于領先性能的紀錄。

最新一輪 MLPerf 測試包括一項更新的推薦系統測試，并新增首個 GPT-J 上的推理基準測試。GPT-J 是一個由 60 億個參數組成的大語言模型（LLM），而 AI 模型的大小通常根據它有多少參數來衡量。

TensorRT-LLM 大幅提升推理能力

為了應對各類復雜的工作負載，NVIDIA 開發了一款能夠優化推理的生成式 AI 軟件——TensorRT-LLM。該開源庫使客戶能夠在不增加成本的情況下將現有 H100 GPU 的推理性能提升兩倍以上。由于時間原因，TensorRT-LLM 沒有參加 8 月的 MLPerf 提交。

NVIDIA 的內部測試表明，在運行 GPT-J 6B 模型時，相較于沒有使用 TensorRT-LLM 的上一代 GPU，在 H100 GPU 上使用 TensorRT-LLM 能夠實現高達 8 倍的性能提升。

該軟件始于 NVIDIA 在對 Meta、AnyScale、Cohere、Deci、Grammarly、Mistral AI、MosaicML（現為 Databricks 的一部分）、OctoML、Tabnine 和Together AI 等領先公司進行加速和優化 LLM 推理時所做的工作。

MosaicML 在 TensorRT-LLM 的基礎上添加了所需的功能，并將這些功能集成到他們現有的服務堆棧中。Databricks 工程副總裁 Naveen Rao 表示：“這已成為相當輕而易舉的事情。”

Rao 補充說：“TensorRT-LLM 簡單易用、功能豐富且高效。它為正在使用 NVIDIA GPU 的 LLM 服務提供了最先進的性能，并使我們能夠將節省的成本回饋給我們的客戶。”

TensorRT-LLM 是 NVIDIA 全棧 AI 平臺持續創新的最新實例。這類持續的軟件進步為用戶帶來了無需額外成本即可實現隨著時間不斷提升的性能，并且廣泛適用于多樣化的 AI 工作負載。

L4 為主流服務器增強推理能力

在最新 MLPerf 基準測試中，NVIDIA L4 GPU 運行了所有工作負載，并全面展現了出色的性能。

例如，在緊湊型 72W PCIe 加速器中運行時，L4 GPU 的性能比功耗超出其近 5 倍的 CPU 提高了 6 倍。

此外，L4 GPU 具有專用媒體引擎，與 CUDA 軟件搭配使用，在 NVIDIA 的測試中為計算機視覺提供了高達 120 倍的加速。

谷歌云和許多系統制造商現已支持 L4 GPU，為從消費互聯網服務到藥物研發各行業的客戶提供服務。

大幅提升邊緣性能

此外，NVIDIA 采用了一種全新模型壓縮技術來展示在一個 L4 GPU 上運行 BERT LLM 的性能提升高達 4.7 倍。該結果體現在 MLPerf 的“開放分區”中，這個類別旨在展示新能力。

這項技術有望應用于所有 AI 工作負載。它尤其適用于在空間和功耗受限的邊緣設備上運行模型。

在另一個體現邊緣計算領導力的例證中，NVIDIA Jetson Orin 模塊化系統將邊緣 AI 和機器人應用場景中常見的計算機視覺用例——目標檢測的性能比上一輪測試提升高達 84%。

Jetson Orin 性能的提升得益于軟件可以充分利用該芯片的最新核心，如一個可編程視覺加速器、一顆 NVIDIA Ampere 架構 GPU 和一個專用深度學習加速器等。

靈活的性能與龐大的生態

MLPerf 基準測試是透明且客觀的，因此用戶可以根據其結果做出明智的購買決定。該測試還涵蓋了豐富的用例和場景，能夠讓用戶獲得可靠且可以靈活部署的性能。

本輪提交測試結果的合作伙伴包括微軟 Azure 和 Oracle Cloud Infrastructure 等云服務提供商以及華碩、Connect Tech、戴爾科技、富士通、技嘉、惠與、聯想、QCT、超微等系統制造商。

總體而言，MLPerf 已得到 70 多家機構的支持，包括阿里巴巴、Arm、思科、谷歌、哈佛大學、英特爾、Meta、微軟和多倫多大學等。

NVIDIA 在基準測試中使用的所有軟件均可從 MLPerf 軟件庫中獲得，因此每個人都能實現全球領先的結果。我們不斷將這些優化措施整合到 NVIDIA NGC 軟件中心的容器中供 GPU 應用使用。

點擊“閱讀原文”閱讀技術博客，詳細了解我們如何實現這些最新的成果。

GTC 2024 將于 2024 年 3 月 18 至 21 日在美國加州圣何塞會議中心舉行，線上大會也將同期開放。掃描下方海報二維碼，關注更多會議及活動信息。

原文標題：NVIDIA Grace Hopper 超級芯片橫掃 MLPerf 推理基準測試

文章出處：【微信公眾號：NVIDIA英偉達】歡迎添加關注！文章轉載請注明出處。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

英偉達

英偉達

+關注

關注
22

文章
3770

瀏覽量
90989

原文標題：NVIDIA Grace Hopper 超級芯片橫掃 MLPerf 推理基準測試

文章出處：【微信號：NVIDIA_China，微信公眾號：NVIDIA英偉達】歡迎添加關注！文章轉載請注明出處。

MLCommons推出AI基準測試0.5版

開放式機器學習工程聯盟 MLCommons 在美國加州當地時間公布推出適用于消費類 PC 的 AI 性能的 MLPerf Client 基準測試的 0.5 版，這是該測試的第一個公開版

發表于 12-12 16:47 ?288次閱讀

NVIDIA Colossus超級計算機集群突破10萬顆Hopper GPU

NVIDIA近日宣布，其位于田納西州孟菲斯市的xAI Colossus超級計算機集群規模已壯大至10萬顆NVIDIA Hopper GPU。這一里程碑式的成就，再次彰顯了

發表于 10-30 10:29 ?296次閱讀

NVIDIA 以太網加速 xAI 構建的全球最大 AI 超級計算機

市的 Colossus 超級計算機集群達到了 10 萬顆 NVIDIA? Hopper? GPU 的巨大規模。該集群使用了 NVIDIA Spectrum-X? 以太網網絡平臺，該平臺

發表于 10-30 09:33 ?142次閱讀

<b class='flag-5'>NVIDIA</b> 以太網加速 xAI 構建的全球最大 AI <b class='flag-5'>超級</b>計算機

浪潮信息AS13000G7榮獲MLPerf? AI存儲基準測試五項性能全球第一

北京2024年9月27日?/美通社/ -- 9月25日，MLCommons協會發布最新MLPerf? Storage v1.0 AI存儲基準測試成績。浪潮信息分布式存儲平臺AS13000G7表現出

發表于 09-28 16:46 ?204次閱讀

浪潮信息AS13000G7榮獲<b class='flag-5'>MLPerf</b>? AI存儲<b class='flag-5'>基準</b><b class='flag-5'>測試</b>五項性能全球第一

NVIDIA AI芯片Blackwell推遲發布引熱議,公司強調Hopper需求強勁

據8月5日最新消息，NVIDIA新款AI芯片Blackwell因被曝存在設計缺陷而推遲發布的消息，迅速在業界引發了廣泛討論與關注。面對這一市場傳聞，NVIDIA官方迅速作出回應，強調其旗艦產品

發表于 08-05 15:05 ?561次閱讀

NVIDIA AI Enterprise榮獲金獎

NVIDIA AI Enterprise、GH200 Grace Hopper 超級芯片和 Spectrum-X 在 COMPUTEX 20

發表于 05-29 09:27 ?444次閱讀

<b class='flag-5'>NVIDIA</b> AI Enterprise榮獲金獎

亞馬遜未中斷英偉達訂單，等待Grace Blackwell更強性能

英國《金融時報》昨日報道稱，亞馬遜AWS已暫停訂購英偉達最新款“超級芯片”Grace Hopper，等待性能更強的新品Grace Black

發表于 05-22 11:00 ?465次閱讀

NVIDIA Grace Hopper點亮AI超級計算新時代

瑞士 Alps、法國 EXA1-HE 等超級計算機將使用高能效的、基于 Grace 的系統為氣候和天氣、科學探索等領域提供 200 EFLOPS AI 算力，以支持突破性研究。

發表于 05-15 09:46 ?363次閱讀

NVIDIA通過CUDA-Q平臺為全球各地的量子計算中心提供加速

德國、日本和波蘭的超級計算機利用 Grace-Hopper 和量子-經典加速超算平臺推進量子計算研究。

發表于 05-14 09:15 ?347次閱讀

進一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片

NVLink 芯片到芯片（C2C）互連，顯著加快數據庫查詢過程。在查詢基準測試中，Grace Blackwell 的執行速度比 CPU （

發表于 05-13 17:16

美國首個Grace Hopper架構超算Venado落地：達10 exaFLOPS

該超級計算機是由惠普企業集團（Hewlett Packard Enterprise）打造，其運算能力高達 10 exaFLOPS，它是美國第一款采用英偉達Grace Hopper芯片架

發表于 04-18 14:37 ?406次閱讀

NVIDIA推出搭載GB200 Grace Blackwell超級芯片的NVIDIA DGX SuperPOD?

NVIDIA 于太平洋時間 3 月 18 日發布新一代 AI 超級計算機 —— 搭載 NVIDIA GB200 Grace Blackwell 超級

發表于 03-21 09:49 ?695次閱讀

NVIDIA 推出 Blackwell 架構 DGX SuperPOD，適用于萬億參數級的生成式 AI 超級計算

基于先進的 NVIDIA 網絡、NVIDIA 全棧 AI 軟件和存儲技術，可將集群中 Grace Blackwell 超級芯片的數量擴展至數

發表于 03-19 10:56 ?422次閱讀

Arm架構與Neoverse技術在基礎設施領域的應用與發展

Arm的Neoverse系列已有穩定的立足點。例如，英偉達的超級芯片Grace-Hopper就是由兩片獨立的芯片組成，其中 Hopper負責

發表于 02-22 15:36 ?575次閱讀

英偉達Grace-Hopper提供一個緊密集成的CPU + GPU解決方案

英偉達Grace-Hopper提供了一個緊密集成的CPU + GPU解決方案，針對生成式人工智能逐漸成為主導的市場環境。

發表于 01-02 15:52 ?912次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

NVIDIA Grace Hopper 超級芯片橫掃 MLPerf 推理基準測試

評論