亚洲精品另类,无限日本动漫资源大全,特黄一级大片

2022年3月，NVIDIA發布了首款數據中心 CPU Grace、新一代高性能計算GPU Hopper，同時利用它們打造了兩顆“超級芯片”(Super Chip)，一是Grace CPU二合一，二是Grace CPU＋Hopper GPU二合一，看起來都極為酷炫。

現在，足足14個月過去了，NVIDIA終于宣布，GH200 Grace Hopper超級芯片已經全面投產，將為復雜AI、HPC工作負載提供澎湃的動力。

再加上Grace CPU、Hopper GPU、Ada Lovelace GPU、BlueField DPU等全套系統方案，NVIDIA現在已經有400多種配置，可滿足市場對生成式AI的激增需求。

歐洲和美國的超大規模云服務商、超算中心，將會成為接入GH200系統的首批客戶。

同時，黃仁勛還公布了Grace Hopper的更多細節，尤其是它的CPU、GPU之間使用NVLink-C2C互連技術，總帶寬高達900GB/s，相比傳統的PCIe 5.0通道超出足足7倍，能夠滿足要求最苛刻的生成式AI和HPC應用，功耗也降低了超過80％。

Grace Hopper是一塊CPU+GPU合體的超級芯片，CPU是NVIDIA自研的72核處理器，Neoverse V2內核，擁有480GB LPDDR5內存，512GB/s帶寬。

GPU部分是H100，FP64性能34TFLOPS，但更強的是INT8性能，AI運算能力達到了3958TFLOPS，帶96GB HBM3內存。

同時，NVIDIA發布了針對AI推出的大內存DGX GH200超算系統，配備了256個Grace Hopper芯片，總計1.8萬CPU核心，144TB內存，相比之前漲了500倍。

AI運算對內存容量的要求更高，所以DGX GH200通過最新的NVLink、NVLink Switch等技術連接了256塊Grace Hooper超級芯片，實現了極為夸張的性能及內存。

GH200總計有256塊Grace Hooper芯片，因此總計18432個CPU核心，144TB HBM3內存，AI性能達到了1 exaFLOPS，也就是100億億次。

這是什么概念？當前最強的TOP500超算也就是百億億次性能，只不過這個性能是HPC計算的，NVIDIA的是百億億次AI性能。

為了讓256個超級芯片互聯，GH200還使用了256塊單口400Gb/s InfiniBand互聯芯片，256個雙口200Gb/s InfiniBand芯片，還有96組L1 NVLink、36組L2 NVLink開關等等，設計非常復雜。

NVIDIA表示，谷歌、Meta及微軟是首批獲得DGX H200系統的公司，后續他們還會開放給更多客戶，運行客戶定制。

不過DGX H200還不是最強的，NVIDIA今年晚些時候會推出名為NVIDIA Helios的AI超算系統，由4組GH200組成，總計1024個Grace Hooper超級芯片，576TB HBM內存。

黃仁勛還向傳統的CPU服務器集群發起“挑戰”，認為在人工智能和加速計算這一未來方向上，GPU服務器有著更為強大的優勢。

根據黃仁勛在演講上展示的范例，訓練一個LLM大語言模型，將需要960個CPU組成的服務器集群，這將耗費大約1000萬美元（約合人民幣7070萬元），并消耗11千兆瓦時的電力。

相比之下，同樣以1000萬美元的成本去組建GPU服務器集群，將以僅3.2千兆瓦時的電力消耗，訓練44個LLM大模型。

如果同樣消耗11千兆瓦時的電量，那么GPU服務器集群能夠實現150倍的加速，訓練150個LLM大模型，且占地面積更小。

而當用戶僅僅想訓練一個LLM大模型時，則只需要一個40萬美元左右，消耗0.13千兆瓦時電力的GPU服務器即可。

換言之，相比CPU服務器，GPU服務器能夠以4%的成本和1.2%的電力消耗來訓練一個LLM，這將帶來巨大的成本節省。

審核編輯：李倩

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

NVIDIA

NVIDIA

+關注

關注
14

文章
4981

瀏覽量
102997
gpu

gpu

+關注

關注
28

文章
4729

瀏覽量
128897
超級芯片

超級芯片

+關注

關注
0

文章
34

瀏覽量
8876

原文標題：領先幾光年！NVIDIA CPU+GPU超級芯片終于量產

文章出處：【微信號：hdworld16，微信公眾號：硬件世界】歡迎添加關注！文章轉載請注明出處。

NVIDIA 以太網加速 xAI 構建的全球最大 AI 超級計算機

市的 Colossus 超級計算機集群達到了 10 萬顆 NVIDIA? Hopper? GPU 的巨大規模。該集群使用了 NVIDIA Spectrum-X? 以太網網絡平臺，該平臺

發表于 10-30 09:33 ?142次閱讀

<b class='flag-5'>NVIDIA</b> 以太網加速 xAI 構建的全球最大 AI <b class='flag-5'>超級</b>計算機

【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】--全書概覽

本帖最后由 1653149838.791300 于 2024-10-16 22:19 編輯感謝平臺提供的書籍，厚厚的一本，很有分量，感謝作者的傾力付出成書。本書主要講算力芯片CPU

發表于 10-15 22:08

名單公布！【書籍評測活動NO.43】算力芯片 | 高性能 CPU/GPU/NPU 微架構分析

紙質媒體的高質量和專業網絡媒體的信息更新速度。算力芯片在最近15年有著巨大性能突破，這些年Intel的CPU芯片從雙核128位SIMD到眾核512位SIMD；NVIDIA的

發表于 09-02 10:09

NVIDIA GB200超級芯片引領液冷散熱新紀元

，特別是其單顆B200芯片功耗高達1000W，以及由一顆Grace CPU與兩顆Blackwell GPU組成的超級芯片GB200功耗驚人地

發表于 08-01 16:35 ?974次閱讀

NVIDIA GB200 CPU+GPU超級芯片功耗達2700W

7月31日，集邦咨詢發布的最新報告揭示了AI服務器領域的一個重要趨勢：隨著計算能力與功耗的同步攀升，特別是NVIDIA計劃在年底推出的下一代Blackwell平臺將帶來顯著的功耗增長，液冷散熱技術正逐步成為行業標配，預計今年底其市場滲透率將達到10%。

發表于 07-31 13:02 ?1018次閱讀

超級猛獸 GPU ?NVIDIA GeForce RTX 5090 基本頻率接近 2.9 GHz

ABSTRACT摘要根據最新傳言，旗艦級NVIDIAGeForceRTX5090GPU看起來將是一款超級猛獸。據稱，顯卡的基本時鐘速度將設定在2.9GHz左右，幾乎達到3GHz的門檻

發表于 07-12 08:26 ?435次閱讀

<b class='flag-5'>超級</b>猛獸 <b class='flag-5'>GPU</b> ?<b class='flag-5'>NVIDIA</b> GeForce RTX 5090 基本頻率接近 2.9 GHz

CPU渲染和GPU渲染優劣分析

GPU的出現，基于GPU的渲染獲得了很大的普及。這些GPU是特定用途的芯片，在某些情況下提供與CPU渲染相當的結果。從廣義上講，

發表于 05-23 08:27 ?591次閱讀

<b class='flag-5'>CPU</b>渲染和<b class='flag-5'>GPU</b>渲染優劣分析

進一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片

CPU和72個Blackwell GPU，并通過NVIDIA NVLink技術連接。DGX SuperPOD可以通過NVIDIA Quantum InfiniBand連接多個機架，實

發表于 05-13 17:16

利用NVIDIA組件提升GPU推理的吞吐

本實踐中，唯品會 AI 平臺與 NVIDIA 團隊合作，結合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV（HKV）將推理的稠密網絡和熱 Embedding 全置于

發表于 04-20 09:39 ?718次閱讀

AI服務器異構計算深度解讀

AI服務器按芯片類型可分為CPU+GPU、CPU+FPGA、CPU+ASIC等組合形式，CPU+GPU是目前國內的主要選擇（占比91.9%）

發表于 04-12 12:27 ?611次閱讀

NVIDIA推出搭載GB200 Grace Blackwell超級芯片的NVIDIA DGX SuperPOD?

NVIDIA 于太平洋時間 3 月 18 日發布新一代 AI 超級計算機 —— 搭載 NVIDIA GB200 Grace Blackwell 超級

發表于 03-21 09:49 ?698次閱讀

NVIDIA 推出 Blackwell 架構 DGX SuperPOD，適用于萬億參數級的生成式 AI 超級計算

基于先進的 NVIDIA 網絡、NVIDIA 全棧 AI 軟件和存儲技術，可將集群中 Grace Blackwell 超級芯片的數量擴展至數萬個，通過

發表于 03-19 10:56 ?422次閱讀

深度解讀Nvidia AI芯片路線圖

Nvidia是一個同時擁有 GPU、CPU和DPU的計算芯片和系統公司。Nvidia通過NVLink、NVSwitch和NVLink C2C

發表于 03-13 09:25 ?923次閱讀

Nvidia與AMD新芯片，突破PCIe瓶頸

AMD 和 Nvidia 的 GPU 都依賴 PCI 總線與 CPU 進行通信。CPU 和 GPU 有兩個不同的內存域，數據必須通過 PCI

發表于 03-08 14:15 ?667次閱讀

為什么GPU比CPU更快？

GPU比CPU更快的原因并行處理能力：GPU可以同時處理多個任務和數據，而CPU通常只能一次處理一項任務。這是因為GPU的架構使得它可以同時

發表于 01-26 08:30 ?2398次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

NVIDIA CPU+GPU超級芯片終于量產

評論