英偉達(dá)最強(qiáng)芯片性能公布，比H100 GPU高出17%

Nvidia 今天宣布，已向最新版本的 MLPerf 提交了其 Grace Hopper CPU+GPU Superchip 及其 L4 GPU 加速器的首個(gè)基準(zhǔn)測試結(jié)果，MLPerf 是一項(xiàng)行業(yè)標(biāo)準(zhǔn) AI 基準(zhǔn)測試，旨在為衡量人工智能性能提供一個(gè)公平的競爭環(huán)境。不同的工作負(fù)載。今天的基準(zhǔn)測試結(jié)果標(biāo)志著 MLPerf 基準(zhǔn)測試的兩個(gè)值得注意的新第一：添加了新的大型語言模型 (LLM) GPT-J 推理基準(zhǔn)測試和改進(jìn)的推薦模型。Nvidia 聲稱，在 GPT-J 基準(zhǔn)測試中，Grace Hopper Superchip 的推理性能比其市場領(lǐng)先的 H100 GPU 之一高出 17%，并且其 L4 GPU 的性能高達(dá)英特爾 Xeon CPU 的 6 倍。

隨著該行業(yè)迅速發(fā)展到更新的人工智能模型和更強(qiáng)大的實(shí)施，該行業(yè)正在以驚人的速度發(fā)展。同樣，由 MLCommons 機(jī)構(gòu)管理的 MLPerf 基準(zhǔn)也在不斷發(fā)展，以通過新的 v3.1 修訂版更好地反映人工智能領(lǐng)域不斷變化的性質(zhì)。

GPT-J 6B 是自 2021 年以來在現(xiàn)實(shí)工作負(fù)載中使用的文本摘要模型，現(xiàn)已在 MLPerf 套件中用作衡量推理性能的基準(zhǔn)。與一些更先進(jìn)的人工智能模型（例如 1750 億參數(shù)的 GPT-3）相比，GPT-J 60 億參數(shù)的 LLM 相當(dāng)輕量，但它非常適合推理基準(zhǔn)的角色。該模型總結(jié)了文本塊，并在對延遲敏感的在線模式和吞吐量密集型的離線模式下運(yùn)行。MLPerf 套件現(xiàn)在還采用了更大的 DLRM-DCNv2 推薦模型（參數(shù)數(shù)量增加了一倍）、更大的多熱點(diǎn)數(shù)據(jù)集以及能夠更好地表示真實(shí)環(huán)境的跨層算法。

有了這個(gè)背景，我們可以在這里看到 Nvidia 的一些性能聲明。請注意，Nvidia 本身將這些基準(zhǔn)提交給 MLCommons，因此它們可能代表高度調(diào)整的最佳情況。

Nvidia 還喜歡指出，它是唯一一家為 MLPerf 套件中使用的每個(gè) AI 模型提交基準(zhǔn)的公司，這是一個(gè)客觀真實(shí)的聲明。有些公司完全缺席，比如 AMD，或者只提交了一些選定的基準(zhǔn)測試，比如英特爾的 Habana 和谷歌的 TPU。缺乏提交的原因因公司而異，但看到更多競爭對手加入 MLPerf 圈就太好了。

Nvidia 提交了第一個(gè) GH200 Grace Hopper Superchip MLPerf 結(jié)果，強(qiáng)調(diào) CPU+GPU 組合的性能比單個(gè) H100 GPU 高出 17%。從表面上看，這令人驚訝，因?yàn)?GH200 使用與 H100 CPU 相同的芯片，但我們將在下面解釋原因。自然，配備 8 個(gè) H100 的 Nvidia 系統(tǒng)的性能優(yōu)于 Grace Hopper Superchip，在每項(xiàng)推理測試中都處于領(lǐng)先地位。

提醒一下，Grace Hopper Superchip 在同一塊板上結(jié)合了 Hopper GPU 和 Grace CPU，在兩個(gè)單元之間提供了具有 900GB/s 吞吐量的C2C 鏈路，從而提供了典型 PCIe 帶寬的 7 倍CPU 到 GPU 數(shù)據(jù)傳輸?shù)倪B接，提高了 GH200 的可訪問內(nèi)存帶寬，并通過包含 96GB HBM3 內(nèi)存和 4TB/s GPU 內(nèi)存帶寬的連貫內(nèi)存池進(jìn)行了增強(qiáng)。相比之下，在 HGX 中測試的對比 H100 僅具有 80GB 的 HBM3 （下一代 Grace Hopper 型號將在 2024 年第二季度擁有 144GB 的 HBM3e，速度快 1.7 倍）。

Nvidia 還推出了一種名為“ Automatic Power Steering”的動(dòng)態(tài)動(dòng)力轉(zhuǎn)移技術(shù)，該技術(shù)可以動(dòng)態(tài)平衡 CPU 和 GPU 之間的功率預(yù)算，將溢出預(yù)算轉(zhuǎn)向負(fù)載最大的單元。這項(xiàng)技術(shù)被用于許多競爭性的現(xiàn)代 CPU+GPU 組合中，因此它并不新鮮，但它確實(shí)允許 Grace Hopper Superchip 上的 GPU 享受比 HGX 更高的電力傳輸預(yù)算，因?yàn)殡娏腉race CPU——這在標(biāo)準(zhǔn)服務(wù)器中是不可能的。完整的 CPU+GPU 系統(tǒng)以 1000W TDP 運(yùn)行。

大多數(shù)推理繼續(xù)在 CPU 上執(zhí)行，隨著更大的模型變得越來越普遍，這種情況在未來可能會(huì)發(fā)生變化；對于 Nvidia 來說，用 L4 等小型低功耗 GPU 取代用于這些工作負(fù)載的 CPU 至關(guān)重要，因?yàn)檫@將推動(dòng)大批量銷售。本輪 MLPerf 提交還包括 Nvidia L4 GPU 的第一批結(jié)果，該推理優(yōu)化卡在 GPT-J 推理基準(zhǔn)測試中的性能是單個(gè) Xeon 9480 的 6 倍，盡管在超薄外形卡中功耗僅為 72W，不需要輔助電源連接。

Nvidia 還聲稱，通過測量 8 個(gè) L4 GPU 與兩個(gè)上一代 Xeon 8380s CPU 的性能，視頻+AI 解碼-推理-編碼工作負(fù)載的 CPU 性能提高了 120 倍，這有點(diǎn)不平衡。這可能是為了直接比較單個(gè)機(jī)箱中可以容納的計(jì)算能力。盡管如此，值得注意的是，盡管四路服務(wù)器不是最適合這項(xiàng)工作，但仍然可以使用，而且較新的至強(qiáng)芯片在本次測試中可能會(huì)表現(xiàn)得更好一些。測試配置位于幻燈片底部的小字中，因此請務(wù)必注意這些細(xì)節(jié)。

最后，Nvidia 還提交了 Jetson Orin 機(jī)器人芯片的基準(zhǔn)測試，顯示推理吞吐量提高了 84%，這主要是由軟件改進(jìn)推動(dòng)的。

重要的是要記住，在現(xiàn)實(shí)世界中，每個(gè)人工智能模型都作為較長系列模型的一部分運(yùn)行，這些模型在人工智能管道中執(zhí)行以完成特定的工作或任務(wù)。Nvidia 的上面的插圖很好地體現(xiàn)了這一點(diǎn)，在完成之前對一個(gè)查詢執(zhí)行八種不同的 AI 模型 - 并且這些類型的 AI 管道擴(kuò)展至 15 個(gè)網(wǎng)絡(luò)來滿足單個(gè)查詢并不是聞所未聞的。這是重要的背景，因?yàn)樯厦娴拿嫦蛲掏铝康幕鶞?zhǔn)往往側(cè)重于以高利用率運(yùn)行單個(gè) AI 模型，而不是現(xiàn)實(shí)世界的管道，需要更多的多功能性，多個(gè) AI 模型串行運(yùn)行才能完成給定的任務(wù)任務(wù)。

Nvidia 上周還宣布，其用于生成 AI 工作負(fù)載的 TensorRT-LLM 軟件可在推理工作負(fù)載中提供優(yōu)化的性能，在 H100 GPU 上使用時(shí)總體性能提高一倍以上，且無需增加成本。Nvidia 最近提供了有關(guān)該軟件的詳細(xì)信息，并指出它還沒有為這一輪結(jié)果準(zhǔn)備好這種推理增強(qiáng)軟件；MLCommons 要求 MLPerf 提交需要 30 天的準(zhǔn)備時(shí)間，而 TensorRT-LLM 當(dāng)時(shí)不可用。這意味著 Nvidia 的首輪 MLPerf 基準(zhǔn)測試應(yīng)該會(huì)在下一輪提交中看到巨大的改進(jìn)。

Nvidia Grace Hopper CPU的設(shè)計(jì)詳解

正如我們在之前的報(bào)道中指出，Nvidia 的 Grace CPU 是該公司第一款專為數(shù)據(jù)中心設(shè)計(jì)的純 CPU Arm 芯片，一塊主板上有兩個(gè)芯片，總共 144 個(gè)核心，而 Grace Hopper Superchip 則在主板上結(jié)合了 Hopper GPU 和 Grace CPU。

根據(jù)Nvidia之前透露，Grace CPU采用臺(tái)積電4N工藝。臺(tái)積電將“N4”4nm工藝列入其5nm節(jié)點(diǎn)家族之下，將其描述為5nm節(jié)點(diǎn)的增強(qiáng)版。Nvidia 使用該節(jié)點(diǎn)的一種特殊變體，稱為“4N”，專門針對其 GPU 和 CPU 進(jìn)行了優(yōu)化。

隨著摩爾定律的衰落，這些類型的專用節(jié)點(diǎn)變得越來越普遍，并且隨著每個(gè)新節(jié)點(diǎn)的出現(xiàn)，縮小晶體管變得更加困難和昂貴。為了實(shí)現(xiàn) Nvidia 4N 等定制工藝節(jié)點(diǎn)，芯片設(shè)計(jì)人員和代工廠攜手合作，使用設(shè)計(jì)技術(shù)協(xié)同優(yōu)化 (DTCO) 為其特定產(chǎn)品調(diào)整定制功耗、性能和面積 (PPA) 特性。

Nvidia 此前曾透露，其 Grace CPU 使用現(xiàn)成的 Arm Neoverse 內(nèi)核，但該公司仍未具體說明使用哪個(gè)具體版本。不過，Nvidia透露Grace采用Arm v9內(nèi)核，支持SVE2、Neoverse N2平臺(tái)是 Arm 第一個(gè)支持 Arm v9 和 SVE2 等擴(kuò)展的 IP。N2 Perseus 平臺(tái)采用 5nm 設(shè)計(jì)（請記住，N4 屬于臺(tái)積電的 5nm 系列），支持 PCIe Gen 5.0、DDR5、HBM3、CCIX 2.0 和 CXL 2.0。Perseus 設(shè)計(jì)針對每功率（瓦特）性能和每面積性能進(jìn)行了優(yōu)化。Arm 表示，其下一代核心 Poseidon 直到 2024 年才會(huì)上市，考慮到 Grace 的發(fā)布日期為 2023 年初，這些核心的可能性較小。

Nvidia 的新 Nvidia 可擴(kuò)展一致性結(jié)構(gòu) (SCF：Nvidia Scalable Coherency Fabric ) 是一種網(wǎng)狀互連，看起來與與 Arm Neoverse 核心一起使用的標(biāo)準(zhǔn)CMN-700 相干網(wǎng)狀網(wǎng)絡(luò)非常相似。

Nvidia SCF 在各種 Grace 芯片單元（如 CPU 內(nèi)核、內(nèi)存和 I/O）之間提供 3.2 TB/s 的對分帶寬，更不用說將芯片與其他單元連接起來的 NVLink-C2C 接口了。無論是另一個(gè) Grace CPU 還是 Hopper GPU。

該網(wǎng)格支持 72 個(gè)以上核心，每個(gè) CPU 總 L3 緩存為 117MB。Nvidia 表示，上面專輯中的第一個(gè)框圖是“用于說明目的的可能拓?fù)洹保鋵R方式與第二個(gè)圖并不完全一致。

該圖顯示了具有八個(gè) SCF 緩存分區(qū) (SCC：SCF Cache partitions ) 的芯片，這些分區(qū)似乎是 L3 緩存片（我們將在演示中了解更多詳細(xì)信息）以及八個(gè) CPU 單元（這些似乎是核心集群）。SCC 和內(nèi)核以兩個(gè)為一組連接到緩存交換節(jié)點(diǎn) (CSN)，然后 CSN 駐留在 SCF 網(wǎng)狀結(jié)構(gòu)上，以提供 CPU 內(nèi)核和內(nèi)存與芯片其余部分之間的接口。SCF 還通過 Coherent NVLink 支持最多四個(gè)插槽的一致性。

Nvidia 還分享了這張圖，顯示每個(gè) Grace CPU 支持最多 68 個(gè) PCIe 通道和最多 4 個(gè) PCIe 5.0 x16 連接。每個(gè) x16 連接支持高達(dá) 128 GB/s 的雙向吞吐量（x16 鏈路可以分為兩個(gè) x8 鏈路）。我們還看到了 16 個(gè)雙通道 LPDDR5X 內(nèi)存控制器 (MC)。

然而，此圖與第一個(gè)圖不同，它將 L3 緩存顯示為連接到四核 CPU 集群的兩個(gè)連續(xù)塊，這比之前的圖更有意義，并且芯片中總共有 72 個(gè)核心。但是，我們在第一個(gè)圖中沒有看到單獨(dú)的 SCF 分區(qū)或 CSN 節(jié)點(diǎn)，這造成了一些混亂。我們將在演示期間解決這個(gè)問題，并根據(jù)需要進(jìn)行更新。

Nvidia 告訴我們，可擴(kuò)展一致性結(jié)構(gòu) (SCF) 是其專有設(shè)計(jì)，但 Arm 允許其合作伙伴通過調(diào)整核心數(shù)量、緩存大小以及使用不同類型的內(nèi)存（例如 DDR5 和 HBM）來定制 CMN-700 網(wǎng)格，以及選擇各種接口，例如 PCIe 5.0、CXL 和 CCIX。這意味著 Nvidia 可能會(huì)為片上結(jié)構(gòu)使用高度定制的 CMN-700 實(shí)現(xiàn)。

GPU 喜歡內(nèi)存吞吐量，因此 Nvidia 自然而然地將目光轉(zhuǎn)向提高內(nèi)存吞吐量，不僅限于芯片內(nèi)部，還包括 CPU 和 GPU 之間的內(nèi)存吞吐量。Grace CPU 具有 16 個(gè)雙通道 LPDDR5X 內(nèi)存控制器，最多可支持 32 個(gè)通道，支持高達(dá) 512 GB 的內(nèi)存和高達(dá) 546 GB/s 的吞吐量。Nvidia 表示，由于容量和成本等多種因素，它選擇了 LPDDR5X 而不是 HBM2e。同時(shí)，與標(biāo)準(zhǔn) DDR5 內(nèi)存相比，LPDDR5X 的帶寬增加了 53%，每 GB 功耗降低了 1/8，使其成為更好的整體選擇。

Nvidia 還推出了擴(kuò)展 GPU 內(nèi)存 (EGM)，它允許 NVLink 網(wǎng)絡(luò)上的任何 Hopper GPU 訪問網(wǎng)絡(luò)上任何 Grace CPU 的 LPDDR5X 內(nèi)存，但保持本機(jī) NVLink 性能。

Nvidia的目標(biāo)是提供一個(gè)可以在CPU和GPU之間共享的統(tǒng)一內(nèi)存池，從而提供更高的性能，同時(shí)簡化編程模型。Grace Hopper CPU+GPU 芯片支持具有共享頁表的統(tǒng)一內(nèi)存，這意味著芯片可以與 CUDA 應(yīng)用程序共享地址空間和頁表，并允許使用系統(tǒng)分配器來分配 GPU 內(nèi)存。它還支持 CPU 和 GPU 之間的native atomics。

CPU 核心是計(jì)算引擎，但互連是定義計(jì)算未來的戰(zhàn)場。移動(dòng)數(shù)據(jù)比實(shí)際計(jì)算數(shù)據(jù)消耗更多的電量，因此更快、更有效地移動(dòng)數(shù)據(jù)，甚至避免數(shù)據(jù)傳輸，是一個(gè)關(guān)鍵目標(biāo)。

Nvidia 的Grace CPU在一塊板上由兩個(gè) CPU 組成，而 Grace Hopper Superchip 在同一塊板上由一個(gè) Grace CPU 和一個(gè) Hopper GPU 組成，旨在通過專有的 NVLink 芯片最大限度地提高單元之間的數(shù)據(jù)傳輸。芯片間 (C2C) 互連并提供內(nèi)存一致性，以減少或消除數(shù)據(jù)傳輸。

Nvidia 分享了有關(guān)其 NVLink-C2C 互連的新細(xì)節(jié)。提醒一下，這是一種芯片到芯片和芯片到芯片互連，支持內(nèi)存一致性，可提供高達(dá) 900 GB/s 的吞吐量（是 PCIe 5.0 x16 鏈路帶寬的 7 倍）。該接口使用 NVLink 協(xié)議，Nvidia 使用其 SERDES 和 LINK 設(shè)計(jì)技術(shù)設(shè)計(jì)了該接口，重點(diǎn)關(guān)注能源和面積效率。物理 C2C 接口跨標(biāo)準(zhǔn) PCB 運(yùn)行，因此不使用專門的中介層。

NVLink-C2C 還支持行業(yè)標(biāo)準(zhǔn)協(xié)議，例如 CXL 和 Arm 的 AMBA 相干集線器接口（CHI — Neoverse CMN-700 網(wǎng)格的關(guān)鍵）。它還支持多種類型的連接，從基于 PCB 的互連到硅中介層和晶圓級實(shí)現(xiàn)。

電源效率是所有數(shù)據(jù)結(jié)構(gòu)的一個(gè)關(guān)鍵指標(biāo)，今天 Nvidia 表示，傳輸?shù)臄?shù)據(jù)每比特 (pJ/b) 鏈路消耗 1.3 皮焦耳 (pJ/b)。這是 PCIe 5.0 接口效率的 5 倍，但它的功率是未來將上市的 UCIe 互連的兩倍多（0.5 至 0.25 pJ/b）。封裝類型各不相同，C2C 鏈路為 Nvidia 的特定用例提供了性能和效率的堅(jiān)實(shí)結(jié)合，但正如您在上表中看到的，更高級的選項(xiàng)可提供更高水平的功效。

Nvidia 將H100 推理性能提高一倍的秘訣

Nvidia 表示，其新的 TensorRT -LL開源軟件可以顯著提高 GPU 上大型語言模型 (LLM) 的性能。據(jù)該公司稱，Nvidia TensorRT-LL 的功能使其 H100 計(jì)算 GPU 在具有 60 億個(gè)參數(shù)的 GPT-J LLM 中的性能提高了兩倍。重要的是，該軟件可以實(shí)現(xiàn)這種性能改進(jìn)，而無需重新訓(xùn)練模型。

Nvidia 專門開發(fā)了 TensorRT-LLM，以提高 LLM 推理的性能，Nvidia 提供的性能圖形確實(shí)顯示，由于適當(dāng)?shù)能浖?yōu)化，其 H100 的速度提升了 2 倍。Nvidia TensorRT-LLM 的一個(gè)特別突出的功能是其創(chuàng)新的動(dòng)態(tài)批處理技術(shù)。該方法解決了LLM動(dòng)態(tài)且多樣化的工作負(fù)載，這些工作負(fù)載的計(jì)算需求可能存在很大差異。

動(dòng)態(tài)批處理優(yōu)化了這些工作負(fù)載的調(diào)度，確保 GPU 資源得到最大程度的利用。因此，H100 Tensor Core GPU 上的實(shí)際 LLM 請求吞吐量翻倍，從而實(shí)現(xiàn)更快、更高效的 AI 推理過程。

Nvidia 表示，其 TensorRT-LLM 將深度學(xué)習(xí)編譯器與優(yōu)化的內(nèi)核、預(yù)處理和后處理步驟以及多 GPU/多節(jié)點(diǎn)通信原語集成在一起，確保它們在 GPU 上更高效地運(yùn)行。這種集成得到了模塊化 Python API 的進(jìn)一步補(bǔ)充，它提供了一個(gè)開發(fā)人員友好的界面，可以進(jìn)一步增強(qiáng)軟件和硬件的功能，而無需深入研究復(fù)雜的編程語言。例如，MosaicML 在 TensorRT-LLM 之上無縫添加了所需的特定功能，并將它們集成到其推理服務(wù)中。

Databricks 工程副總裁 Naveen Rao 表示：“TensorRT-LLM 易于使用，功能齊全，包括令牌流、動(dòng)態(tài)批處理、分頁注意力、量化等，而且效率很高。” “它為使用 NVIDIA GPU 的LLM服務(wù)提供了最先進(jìn)的性能，并使我們能夠?qū)⒐?jié)省的成本回饋給我們的客戶。”

Nvidia H100 與 TensorRT-LLM 結(jié)合使用時(shí)的性能令人印象深刻。在 NVIDIA 的 Hopper 架構(gòu)上，H100 GPU 與 TensorRT-LLM 配合使用時(shí)，性能是 A100 GPU 的八倍。此外，在測試 Meta 開發(fā)的 Llama 2 模型時(shí)，TensorRT-LLM 的推理性能比 A100 GPU 提高了 4.6 倍。這些數(shù)字強(qiáng)調(diào)了該軟件在人工智能和機(jī)器學(xué)習(xí)領(lǐng)域的變革潛力。

最后，H100 GPU 與 TensorRT-LLM 結(jié)合使用時(shí)支持 FP8 格式。此功能可以減少內(nèi)存消耗，而不會(huì)損失模型準(zhǔn)確性，這對于預(yù)算和/或數(shù)據(jù)中心空間有限且無法安裝足夠數(shù)量的服務(wù)器來調(diào)整其 LLM 的企業(yè)來說是有益的。

編輯：黃飛

閱讀全文

cpu(206162) cpu(206162)
gpu(126253) gpu(126253)
人工智能(229980) 人工智能(229980)
英偉達(dá)(87435) 英偉達(dá)(87435)
深度學(xué)習(xí)(119797) 深度學(xué)習(xí)(119797)

GPU代工轉(zhuǎn)單疑云？砸重金下單臺(tái)積電英偉達(dá)為何有興趣找英特爾合作

電子發(fā)燒友網(wǎng)報(bào)道（文/章鷹）3月23日，英偉達(dá)迎來了高光時(shí)刻。英偉達(dá)創(chuàng)始人兼CEO黃仁勛在GTC大會(huì)上，高調(diào)宣布最新Hopper架構(gòu)的H100?GPU系列。這款號稱地表最強(qiáng)AI芯片，采用臺(tái)積電4納米

2022-03-26 06:37:00

2305

通往AGI之路：揭秘英偉達(dá)A100、A800、H800、V100在高性能計(jì)算與大模型訓(xùn)練中的霸主地位

英偉達(dá)前段時(shí)間發(fā)布GH 200包含 36 個(gè) NVLink 開關(guān)，將 256 個(gè) GH200 Grace Hopper 芯片和 144TB 的共享內(nèi)存連接成一個(gè)單元。除此之外，英偉達(dá)A100、A800、H100、V100也在大模型訓(xùn)練中廣受歡迎。

2023-06-29 11:23:58

25396

英偉達(dá)a100和h100哪個(gè)強(qiáng)?英偉達(dá)A100和H100的區(qū)別

基于Ampere架構(gòu)的GPU計(jì)算加速器，專為高性能計(jì)算、人工智能和機(jī)器學(xué)習(xí)等領(lǐng)域而設(shè)計(jì)。它擁有高達(dá)6912個(gè)CUDA核心(在32GB版本中)，是目前最強(qiáng)大的數(shù)據(jù)中心GPU之一。A100支持更快的訓(xùn)練速度和更大的模型容量，適用于需要進(jìn)行大規(guī)模并行計(jì)算的應(yīng)用程序。 H100是英偉達(dá)公司的InfiniBand適

2023-08-09 17:31:33

32510

大家都在爭相超過A100，無人對標(biāo)的Grace Hopper性能幾何？

電子發(fā)燒友網(wǎng)報(bào)道（文/周凱揚(yáng)）作為英偉達(dá)在CPU與GPU技術(shù)開發(fā)上的集大成之作，Grace Hopper很大程度上象征著復(fù)雜計(jì)算領(lǐng)軍產(chǎn)品。盡管英偉達(dá)竭盡所能地去堆這一“超級芯片”的性能，但英偉達(dá)還是

2023-09-06 01:10:00

1137

英偉達(dá)GPU卡多卡互聯(lián)NVLink，系統(tǒng)累積的公差，是怎么解決的？是連接器吸收的？

英偉達(dá)不斷推出GPU卡，并且實(shí)現(xiàn)多卡互聯(lián)NVLink，實(shí)際整個(gè)系統(tǒng)會(huì)累積到一個(gè)較大的公差，而目前市面上已有的連接器只能吸收較少的公差，這個(gè)是怎么做到匹配的呢？

2022-03-05 16:17:06

英偉達(dá)GPU慘遭專業(yè)礦機(jī)碾壓，黃仁勛宣布砍掉加密貨幣業(yè)務(wù)！

的加密貨幣業(yè)務(wù)的下滑原因不能簡單歸結(jié)于加密貨幣市場的總體趨勢。 GPU挖礦效率不敵專用挖礦芯片，礦工紛紛流失英偉達(dá)的加密貨幣業(yè)務(wù)部門的核心問題是對GPU挖礦的需求下降。由于用于制造顯卡的芯片的計(jì)算能力不足

2018-08-24 10:11:50

英偉達(dá)DPU的過“芯”之處

芯片的路徑”，在一個(gè)是DOCA試圖再一次復(fù)制“CUDA在GPU通用化過程中所起到的開創(chuàng)生態(tài)之功”。如果和不久前英偉達(dá)收購ARM的消息結(jié)合起來，我們看到英偉達(dá)的一個(gè)重要考量，就是以ARM架構(gòu)的CPU為

2022-03-29 14:42:53

英偉達(dá)發(fā)布新一代 GPU 架構(gòu)圖靈和 GPU 系列 Quadro RTX

在 8 月 14 日的 SIGGRAPH 2018 大會(huì)上，英偉達(dá) CEO 黃仁勛正式發(fā)布了新一代 GPU 架構(gòu) Turing（圖靈），以及一系列基于圖靈架構(gòu)的 GPU，包括全球首批支持即時(shí)光線追蹤

2018-08-15 10:59:45

AI芯片界的領(lǐng)頭羊進(jìn)軍機(jī)器人行業(yè)

算法和大數(shù)據(jù)時(shí)代的到來、以及AI芯片的出現(xiàn)。第三波AI浪潮的發(fā)展主要由深度學(xué)習(xí)技術(shù)的突破引領(lǐng)，而英偉達(dá)（Nvidia）憑借其通用的GPU單元，專門的TensorRT加速器，強(qiáng)勁的矩陣運(yùn)算性能加上對其他

2018-06-11 08:20:23

AI開發(fā)者福音！阿里云推出國內(nèi)首個(gè)基于英偉達(dá)NGC的GPU優(yōu)化容器

摘要： 3月28日，在2018云棲大會(huì)·深圳峰會(huì)上，阿里云宣布與英偉達(dá)GPU 云合作（NGC），開發(fā)者可以在云市場下載NVIDIA GPU 云鏡像和運(yùn)行NGC 容器，來使用阿里云上的NVIDIA

2018-04-04 14:39:24

ARM架構(gòu)的GPU和臺(tái)式機(jī)的GPU有什么區(qū)別

達(dá)或者AMD的獨(dú)立顯卡則是需要很高端的才支持4K的分辨率。這樣的話投入完全不是一個(gè)級別。2：移動(dòng)GPU的能耗比是否比獨(dú)立的PC的GPU高？3：支持2K分辨率和4K顯示的市面上的ARM處理器的GPU

2020-07-18 08:04:38

NVIDIA仍不死心，再次加入ARM站場

加強(qiáng)聯(lián)發(fā)科芯片在游戲和AI方面的功能與性能，計(jì)劃最早于2024年將含有英偉達(dá)圖形技術(shù)的GPU集成到聯(lián)發(fā)科的芯片上。目前聯(lián)發(fā)科已成為Chromebook系統(tǒng)芯片的領(lǐng)先供應(yīng)商之一，不少廉價(jià)

2023-05-28 08:51:03

【NVIDIA社招】英偉達(dá)上海熱招ASIC驗(yàn)證工程師

【NVIDIA社招】英偉達(dá)上海熱招ASIC驗(yàn)證工程師一．公司簡介 NVIDIA (英偉達(dá)?)公司(納斯達(dá)克代碼：NVDA)是全球視覺計(jì)算技術(shù)的行業(yè)領(lǐng)袖及GPU(圖形處理器)的發(fā)明者。作為高性能處理器

2016-11-11 17:38:35

【NVIDIA社招】英偉達(dá)上海熱招ASIC驗(yàn)證工程師

2016-09-26 10:14:45

超越英偉達(dá)Pascal五倍？揭秘英特爾深度學(xué)習(xí)芯片架構(gòu) 精選資料推薦

在被英特爾收購兩年之后，深度學(xué)習(xí)芯片公司 Nervana 終于準(zhǔn)備將代號為「Lake Crest」的架構(gòu)轉(zhuǎn)化為實(shí)際的產(chǎn)品了。對于英特爾來說，現(xiàn)在入局或許有些遲到，英偉達(dá)已經(jīng)占據(jù)深度學(xué)習(xí)芯片市場很長一段時(shí)間了，后者有充分的時(shí)間通過新...

2021-07-26 07:04:35

高端VR設(shè)備起量，英偉達(dá)稱今年1500萬，明年翻倍

美元的低廉價(jià)格和PS4廣泛的用戶基礎(chǔ)，PS VR雖然性能稍遜于Oculus Rift和HTC Vive，但卻成了VR普及的急先鋒。不過，Oculus和HTC兩款設(shè)備的銷量也不差，因?yàn)?b class="flag-6" style="color: red">英偉達(dá)稱

2016-12-13 14:32:48

英偉達(dá) GPU 算力服務(wù)器電信運(yùn)營商數(shù)據(jù)中心云服務(wù) 顯卡 IDC NVIDIA NVLINK

;VFG-SYS-821GE-TNHR 1 Base Configuration 8UX13HGX H100 8GPU(Rear I/O),X13DEG-OAD*12 CPU P4X-S

2024-01-02 09:35:32

192.號稱“中國版英偉達(dá)”，造出3款GPU打破外資封鎖，一年收入超10億

gpu英偉達(dá)

小凡發(fā)布于 2022-10-04 12:16:58

197.再次無理打壓！美國命令英偉達(dá)對中俄出售高端GPU需要新的許可

gpu英偉達(dá)

小凡發(fā)布于 2022-10-04 12:25:19

224.離開英偉達(dá)僅19個(gè)月，交出了一塊國產(chǎn)全功能GPU，真是太厲害了

gpu英偉達(dá)

小凡發(fā)布于 2022-10-04 13:09:49

233.國產(chǎn)GPU和國外競爭對手的差距在哪里？#國產(chǎn)gpu#英偉達(dá)

gpu英偉達(dá)

小凡發(fā)布于 2022-10-04 13:19:50

267.英偉達(dá)對中俄出口高端GPU芯片受新限制

gpu英偉達(dá)

小凡發(fā)布于 2022-10-04 15:13:52

268.英偉達(dá)顯卡GPU占用0%，CPU占用100%3D游戲卡頓解決方案NVIDIA設(shè)置

NVIDIAgpu顯卡解決方案英偉達(dá)

小凡發(fā)布于 2022-10-04 15:16:33

00032 Jetson TX2 NX開發(fā)者套件！TX2的性能，NANO的尺寸！ #英偉達(dá) #jetson

英偉達(dá)

學(xué)習(xí)電子知識(shí)發(fā)布于 2023-07-02 13:21:19

#英偉達(dá) #顯卡英偉達(dá)全新旗艦顯卡RTX 5090性能暴漲70%

顯卡英偉達(dá)

深圳市浮思特科技有限公司發(fā)布于 2023-11-20 14:19:25

英偉達(dá)加速部署下一代GPU，7納米GPU性能有希望提升100%

　　英偉達(dá)7納米GPU什么時(shí)候來?印第安納大學(xué)一場次時(shí)代平臺(tái)活動(dòng)中暗示了英偉達(dá)最近的動(dòng)向，他們很可能在今年夏天開始在超級計(jì)算機(jī)上部署全新的Tesla加速GPU，同時(shí)也是英偉達(dá)7納米GPU序幕的開端。

2020-02-04 15:46:55

3691

英偉達(dá)新一代GPU架構(gòu)安培A100發(fā)布，實(shí)現(xiàn)高達(dá)20倍的性能提升

達(dá)新一代GPU架構(gòu)安培，并帶來了基于安培架構(gòu)GPU A100的DGX-A100 AI系統(tǒng)和面向邊緣AI計(jì)算的EGX A100。

2020-05-15 14:48:00

7763

英偉達(dá) A100 GPU 全面上市，推理性能比 CPU 快 237 倍

根據(jù)英偉達(dá)官方的消息，在 AWS 運(yùn)行 NVIDIA GPU 十周年之際，AWS 發(fā)布了采用全新 A100 的 Amazon EC2 P4d 實(shí)例。 IT之家了解到，現(xiàn)在已全面上市的全新 AWS

2020-11-04 15:34:55

2907

英偉達(dá):GPU讓AI的性能每年都成倍提升

英偉達(dá)首席科學(xué)家Bill Dally在一年一度的中國GPU技術(shù)大會(huì)召開前接受第一財(cái)經(jīng)記者獨(dú)家專訪時(shí)表示，GPU讓人工智能（AI）的性能每年都能成倍提升，英偉達(dá)的研究人員正在定義如何在具有更高帶寬、更易于編程的系統(tǒng)中制造更快AI芯片的方法。

2020-12-15 13:37:09

2133

NVIDIA發(fā)布新一代產(chǎn)品—NVIDIA H100

NVIDIA發(fā)布新一代產(chǎn)品—NVIDIA H100，H100是一款超大的芯片，采用TSMC 4N工藝，具有800億個(gè)晶體管，也是首款采用HBM3標(biāo)準(zhǔn)的GPU。

2022-03-23 17:21:42

2476

GTC2022大會(huì)黃仁勛：NVIDIA H100的5項(xiàng)突破性創(chuàng)新

GTC2022大會(huì)黃仁勛：NVIDIA H100的5項(xiàng)突破性創(chuàng)新，擁有強(qiáng)大的性能，新的Tensor處理格式：FP8等，是首個(gè)實(shí)現(xiàn)性能擴(kuò)展至700瓦的GPU。

2022-03-23 17:37:18

1966

GTC2022大會(huì)亮點(diǎn)：NVIDIA發(fā)布全新AI計(jì)算系統(tǒng)—DGX H100

GTC2022大會(huì)亮點(diǎn)：NVIDIA發(fā)布全新AI計(jì)算系統(tǒng)—DGX H100，借助NVLink連接，DGX使八塊H100成為了一個(gè)巨型GPU。

2022-03-24 15:06:31

1574

NVIDIA發(fā)布最新Hopper架構(gòu)的H100系列GPU和Grace CPU超級芯片

今日凌晨，NVIDIA(英偉達(dá))發(fā)布了基于最新Hopper架構(gòu)的H100系列GPU和Grace CPU超級芯片!

2022-03-26 09:07:05

2380

NVDIA為何要找英特爾代工GPU等芯片產(chǎn)品

電子發(fā)燒友網(wǎng)報(bào)道(文/章鷹)英偉達(dá)迎來了高光時(shí)刻。英偉達(dá)創(chuàng)始人兼CEO黃仁勛在GTC大會(huì)上，高調(diào)宣布最新Hopper架構(gòu)的H100 GPU系列。這款號稱地表最強(qiáng)AI芯片，采用臺(tái)積電4納米工藝

2022-03-26 11:03:57

2324

藍(lán)海大腦服務(wù)器全力支持NVIDIA H100 GPU

藍(lán)海大腦宣布服務(wù)器產(chǎn)品線全力支持最新的 NVIDIA H100 GPU。藍(lán)海大腦服務(wù)器產(chǎn)品在單機(jī)上最多可支持4、8甚至9個(gè)H100 GPU，可為多種人工智能場景提供超強(qiáng)算力、靈活的資源調(diào)度和成熟的生態(tài)支持。

2022-03-31 11:47:09

1067

利用NVIDIA HGX H100加速計(jì)算數(shù)據(jù)中心平臺(tái)應(yīng)用

HGX H100 8- GPU 是新一代 Hopper GPU 服務(wù)器的關(guān)鍵組成部分。它擁有八個(gè) H100 張量核 GPU 和四個(gè)第三代 NV 交換機(jī)。每個(gè) H100 GPU 都有多個(gè)第四代

2022-04-20 10:54:19

2108

關(guān)于NVIDIA H100 GPU的問題解答

今年的 GTC22 上 NVIDIA 發(fā)布其首款基于 Hopper 架構(gòu)的 GPU —NVIDIA H100。

2022-07-18 10:35:23

1300

美限制英偉達(dá)對華出口芯片中方回應(yīng)

　　8月31日，美國芯片設(shè)計(jì)公司Nvidia表示，美國政府要求其限制向中國出口最新一代GPU旗艦計(jì)算芯片A100和H100，這兩種芯片用于加速人工智能任務(wù)。

2022-09-01 17:55:27

6060

美國限制英偉達(dá)向中俄出口高端芯片中方回應(yīng)

（含中國香港）和俄羅斯的客戶出口兩款高端GPU芯片，分別是A100和H100。受此影響，英偉達(dá)和AMD股價(jià)下跌，英偉達(dá)本季度的銷售額可能會(huì)減少4億美元，AMD的產(chǎn)品受限制估計(jì)也會(huì)被美國政府提上日程。AMD公司目前已經(jīng)受限供應(yīng)的產(chǎn)品是MI250人工

2022-09-02 12:03:32

4163

NVIDIA H100 Tensor Core GPU性能比上一代GPU高出4.5 倍

在行業(yè)標(biāo)準(zhǔn) AI 推理測試中，NVIDIA H100 GPU 創(chuàng)造多項(xiàng)世界紀(jì)錄、A100 GPU 在主流性能方面展現(xiàn)領(lǐng)先優(yōu)勢、Jetson AGX Orin 在邊緣計(jì)算方面處于領(lǐng)先地位。

2022-09-13 15:29:19

2352

詳解NVIDIA H100 TransformerEngine

在H100發(fā)布之際，英偉達(dá)還帶來一個(gè)“重磅產(chǎn)品”——Transformer Engine。在Transformer大火之際推出這么一個(gè)產(chǎn)品，無疑是煉丹師福音。

2022-10-24 15:26:29

2259

英偉達(dá)將向中國推出芯片A800可替代被禁的A100

此前被禁止出貨的A100 GPU一種替代產(chǎn)品。業(yè)內(nèi)預(yù)計(jì)A800 GPU的某些性能肯定會(huì)被限制或閹割。對于上市時(shí)間的話預(yù)計(jì)A800 GPU將在第三季度投產(chǎn)。此前英偉達(dá)公司稱被美國政府要求限制出口兩款被用于加速人工智能任務(wù)的最新兩代旗艦GPU計(jì)算芯片A100和H100。美方無理打壓，違反國際經(jīng)

2022-11-08 16:07:19

2715

英偉達(dá)推出A800 GPU，為了能賣給中國客戶，對A100“砍了一刀”...

，不能通過編程超過限制的性能。今年8月的最后一天，英偉達(dá)發(fā)布公告稱，公司收到美國政府通知，要求對中國大陸以及中國香港、俄羅斯的客戶出口的高端GPU芯片，需要申請出口許可證，其中覆蓋到A100和H100等幾款GPU，同時(shí)未來性能等于或高于A100的產(chǎn)品都會(huì)受

2022-11-09 07:15:01

7427

英偉達(dá)GTC：ChatGPT專用Hopper GPU H100 NVL來了

英偉達(dá)GTC：ChatGPT專用Hopper GPU H100 NVL來了 ChatGPT 一經(jīng)推出火爆程度讓人咋舌，似乎一夜之間就將生成式 AI、大語言模型推到了風(fēng)口浪尖。英偉達(dá)估計(jì)也要笑出

2023-03-23 16:55:46

3017

英偉達(dá)涌入急單，成為AI芯片最大贏家

英偉達(dá)支付訂單為h100、a100、h800、a800。消息人士補(bǔ)充說，tsl對nvidia ai gpu的shr將持續(xù)1年。英偉達(dá)之前的訂單提高了7/6nm的工藝效率。臺(tái)灣存儲(chǔ)半導(dǎo)體預(yù)測蘋果的訂單會(huì)蜂擁而至，但沒想到英偉達(dá)的緊急訂單會(huì)蜂擁而至。

2023-05-30 16:18:21

864

AMD甩出最強(qiáng)AI芯片單個(gè)GPU跑大模型

專為生成式AI設(shè)計(jì)的GPU：HBM密度是英偉達(dá)H100的2.4倍，帶寬是英偉達(dá)H100的1.6倍。

2023-06-20 10:47:47

605

字節(jié)跳動(dòng)今年已經(jīng)為AI購買了超10億美元的GPU

英偉達(dá)在出口限制首次實(shí)施時(shí)發(fā)出了一些聲音，稱它將損失大約400億美元，這種損失可能會(huì)損害其H100芯片的開發(fā)。不過，我們永遠(yuǎn)不會(huì)知道H100加速器的開發(fā)是否會(huì)真正完成，因?yàn)槊绹畬⒊隹诮钔七t到了今年9月，允許英偉達(dá)出貨更多的H100芯片。

2023-06-20 15:03:44

1858

三星計(jì)劃為英偉達(dá)AI GPU提供HBM3和2.5D封裝服務(wù)；傳蘋果悄悄開發(fā)“Apple GPT” 或?qū)⑻魬?zhàn)OpenAI

與包括三星在內(nèi)的潛在供應(yīng)商進(jìn)行交易談判。目前，英偉達(dá)的A100、H100和其他AI GPU均使用臺(tái)積電進(jìn)行晶圓制造和2.5封裝工作的前端工藝。英偉達(dá)AI GPU使用的HBM（高帶寬內(nèi)存）芯片由SK海力士獨(dú)家提供。然而，臺(tái)積電沒有能力處理這些芯片所需的2.5D封裝的所有工作量。消息人士稱，英

2023-07-20 17:00:02

404

三星正與英偉達(dá)開展GPU HBM3驗(yàn)證及先進(jìn)封裝服務(wù)

在此之前，英偉達(dá)將大部分gpu的高級成套產(chǎn)品委托給tsmc。半導(dǎo)體方面，將sk海力士的hbm3安裝在自主制造的單一gpu芯片上，生產(chǎn)英偉達(dá)h100。但是最近隨著生成型人工智能的普及，h100的需求劇增，在處理nvidia的所有訂單上遇到了困難。

2023-08-02 11:54:18

720

英偉達(dá)a100和h100哪個(gè)強(qiáng)？

英偉達(dá)a100和h100哪個(gè)強(qiáng)？英偉達(dá)A100比H100更強(qiáng)。英偉達(dá)A100在處理大型模型和數(shù)據(jù)集時(shí)可能比V100表現(xiàn)更優(yōu)秀。 H100 是一款針對大模型專門優(yōu)化過的芯片，使用臺(tái)積電 5nm 定制

2023-08-07 17:32:59

10412

英偉達(dá)A100和H100的區(qū)別

英偉達(dá)A100和H100的區(qū)別英偉達(dá)A100和H100是兩種不同的產(chǎn)品。A100是英偉達(dá)在2020年推出的一款基于Ampere架構(gòu)的數(shù)據(jù)中心GPU，主要用于高性能計(jì)算和人工智能應(yīng)用。A100具有

2023-08-07 18:06:03

22944

英偉達(dá)A100和V100參數(shù)對比

英偉達(dá)A100這個(gè)AI芯片怎么樣？英偉達(dá)A100是一款基于英偉達(dá)Ampere架構(gòu)的高性能計(jì)算卡，主要面向數(shù)據(jù)中心和高性能計(jì)算領(lǐng)域。其擁有高達(dá)6912個(gè)CUDA核心和432個(gè)Turing Tensor

2023-08-08 11:54:02

8143

英偉達(dá)A100和A40的對比

TFLOPS的FP32浮點(diǎn)性能和156 TFLOPS的深度學(xué)習(xí)性能。英偉達(dá)A100和A40是英偉達(dá)公司推出的兩個(gè)數(shù)據(jù)中心加速器。它們都是基于英偉達(dá)的Ampere架構(gòu)設(shè)計(jì)的最新GPU，支持全新的NVIDIA

2023-08-08 15:08:34

11418

英偉達(dá)A100是什么系列？

被暴搶。英偉達(dá)A100是英偉達(dá)推出的一款數(shù)據(jù)中心GPU系列，采用了全新的Ampere架構(gòu)。它是一款專為深度學(xué)習(xí)、科學(xué)計(jì)算、超級計(jì)算等工作負(fù)載設(shè)計(jì)的高性能計(jì)算解決方案，擁有更高的計(jì)算能力、更大的顯存容量和更快的數(shù)據(jù)傳輸速度等優(yōu)勢。英偉達(dá)A100這個(gè)AI芯片怎么樣？英

2023-08-08 15:13:48

2001

英偉達(dá)A100的簡介

英偉達(dá)A100的簡介 A100都是非常強(qiáng)大的GPU。英偉達(dá)A100、A800、H100、V100也在大模型訓(xùn)練中廣受歡迎。特別是OpenAI發(fā)布ChatGPT以來，全球都在關(guān)注生成式人工智能。英偉

2023-08-08 15:17:16

7309

英偉達(dá)A100的優(yōu)勢分析

HBM2顯存。英偉達(dá)A100是一款高性能的GPU，其主要優(yōu)勢如下： 1. 支持高效的AI計(jì)算：A100采用了新一代的Tensor Core技術(shù)，能夠在AI計(jì)算方面提供卓越的性能，為AI模型的訓(xùn)練和推理

2023-08-08 15:25:22

2540

英偉達(dá)A100的算力是多少？

，但 A100 的算力是前者的 20 倍。 A100是英偉達(dá)推出的一款強(qiáng)大的數(shù)據(jù)中心GPU，采用全新的Ampere架構(gòu)。它擁有高達(dá)6，912個(gè)CUDA核心和40GB的高速HBM2顯存。可以實(shí)現(xiàn)高達(dá)

2023-08-08 15:28:45

21152

英偉達(dá)h800和h100的區(qū)別

英偉達(dá)h800和h100的區(qū)別其實(shí)大白話就是，A100、H100是原版，特供中國市場的減配版是A800、H800。A100、H100是價(jià)格更便宜，性能更好，但是不賣，A800、H800性能

2023-08-08 16:06:55

32420

生成式人工智能推動(dòng)，傳英偉達(dá)今年將銷售55萬個(gè)H100 GPU

雖然目前尚未確定gpu的準(zhǔn)確配置，但英偉達(dá) h100 80gb hbm2e運(yùn)算卡gpu （14592 cuda core， 26 fp64 tflops， 1513 fp16 tflops

2023-08-16 11:05:16

699

gh200和h100性能對比

gh200和h100性能對比隨著計(jì)算機(jī)的普及和技術(shù)的不斷提高，CPU發(fā)熱問題越來越重要。因此，散熱器作為一種重要的CPU散熱裝置，起到了非常重要的作用。其中，GH200和H100散熱器都是較為知名

2023-08-16 17:33:27

565

gh200和h100哪個(gè)更好

gh200和h100哪個(gè)更好在冷靜分析的基礎(chǔ)上，我認(rèn)為GH200和H100各有優(yōu)缺點(diǎn)，沒有絕對的好與不好之分。以下是我對GH200和H100性能、價(jià)格、安裝等方面做出的詳細(xì)比較和評價(jià)，希望能

2023-08-16 17:33:58

666

生成式人工智能推動(dòng)，傳英偉達(dá)今年將銷售55萬個(gè)H100 GPU

雖然目前尚未確定gpu的準(zhǔn)確配置，但nvidia h100 80gb hbm2e運(yùn)算卡gpu （14592 cuda core， 26 fp64 tflops， 1513 fp16 tflops

2023-08-17 10:22:48

240

gh200和h100性能對比

2023-08-17 10:51:35

877

gh200和h100哪個(gè)更好

2023-08-17 10:51:52

622

英偉達(dá)賺翻了，分析稱H100 AI GPU利潤高達(dá)1000%

　據(jù)Tae Kim透露，金融咨詢公司Raymond James推算，每個(gè)h100芯片的費(fèi)用為3320美元。但是，目前還不清楚bom成本分析進(jìn)行得有多深入。如果這是純粹的制造成本（晶片和其他部件的平均收益率）的問題，英偉達(dá)仍需支付相當(dāng)大的銷售成本。

2023-08-21 11:13:25

498

mi300芯片和h100性能參數(shù)對比

mi300芯片和h100性能參數(shù)對比 MI300芯片和H100芯片都是目前市場上比較常見的芯片，其性能參數(shù)直接關(guān)系到設(shè)備的使用體驗(yàn)和性能表現(xiàn)。本文將詳細(xì)對比MI300芯片和H100芯片的性能

2023-08-22 16:46:29

1485

特斯拉已啟動(dòng)1萬顆英偉達(dá)H100 GPU，訓(xùn)練FSD自動(dòng)駕駛

Sawyer Merritt表示，由于英偉達(dá)的gpu生產(chǎn)無法滿足特斯拉的要求，特斯拉使用自己開發(fā)的芯片，花費(fèi)10億美元開發(fā)了自己的超級電腦dojo。預(yù)計(jì)到2024年，dojo將成為世界上最強(qiáng)大的企業(yè)之一。

2023-08-30 09:45:47

433

升騰910和英偉達(dá)h100對比

升騰910和英偉達(dá)h100對比? 隨著人工智能計(jì)算進(jìn)入快速發(fā)展的階段，AI芯片的性能也越來越得到人們的關(guān)注，其中兩款最受關(guān)注的芯片必須是華為的升騰910以及英偉達(dá)的H100，兩者各有優(yōu)劣，下面將對

2023-08-31 17:06:57

11462

美國限制英偉達(dá)向中東出口高性能GPU

據(jù)《衛(wèi)報(bào)》報(bào)道，拜登政府決定對Nvidia的A100和H100產(chǎn)品以及基于它們的服務(wù)器實(shí)施出口許可證的原因之一，是為了阻止中國的人工智能發(fā)展，防止這些GPU被轉(zhuǎn)售到中國。

2023-09-01 15:57:06

583

創(chuàng)企推Chiplet結(jié)構(gòu)大算力芯片，稱性能大幅領(lǐng)先英偉達(dá)H100

公司方面表示，該引擎的內(nèi)存帶寬比nvidia的h100a100等高端的gpu大40倍。此外，d-matrix還主張，jayhawk ii對30億至400億大型語言模型（llm）的每秒生成推理能力增加10至20倍。

2023-09-05 14:24:53

417

傳微軟砍單英偉達(dá)H100芯片

但中國臺(tái)灣工廠的ai供應(yīng)鏈條方面英偉達(dá)ai芯片仍供不應(yīng)求，但微軟到2024年的需求成倍增加有望保持gh200芯片訂單上調(diào)，ai服務(wù)器的長期成長動(dòng)力是不會(huì)改變。”

2023-09-20 11:37:00

610

a17芯片是最強(qiáng)芯片嗎 a17芯片和m2差距怎么樣啊

a17芯片是最強(qiáng)芯片嗎蘋果A17是移動(dòng)終端芯片之王。蘋果A17作為移動(dòng)終端芯片的頂尖王者，性能上無可爭議地領(lǐng)先于其他安卓陣營的芯片。 a17芯片和m2差距怎么樣啊 a17芯片和m2都是非常流行

2023-09-26 16:11:02

8709

MI300X能否與H100一較高下？

市場研究公司Omdia近日發(fā)布報(bào)告稱，預(yù)計(jì)英偉達(dá)二季度用于AI和高性能計(jì)算應(yīng)用的H100 GPU的出貨量超過了900噸。并且預(yù)計(jì)其在未來幾個(gè)季度的GPU銷量將大致相同，因此英偉達(dá)今年將銷售約3600 噸重的H100 GPU。

2023-09-28 14:50:55

1250

AI需求大增！傳英偉達(dá) B100 提前至明年Q2發(fā)布

市場有關(guān)負(fù)責(zé)人表示，h100是英偉達(dá)gpu中規(guī)格最高的技術(shù)，但b100的影響力比h100更大，今后將采用3至4納米工程和芯片設(shè)計(jì)。隨著sk海力士決定獨(dú)家向英偉達(dá)提供可驅(qū)動(dòng)新一代b100 gpu的最新hbm3e顯示器存儲(chǔ)器，該公司將躍升為ai業(yè)界的半導(dǎo)體主要企業(yè)。

2023-10-17 09:23:47

492

英偉達(dá)H100的最強(qiáng)替代者

首先，我們首先要說的是，如果您現(xiàn)在想要訓(xùn)練基礎(chǔ)模型（例如 ChatGPT），那么 NVIDIA H100 80GB SXM5 仍然是首選 GPU。一旦基礎(chǔ)模型經(jīng)過訓(xùn)練，通常可以在成本和功耗顯著降低的部件上根據(jù)特定領(lǐng)域的數(shù)據(jù)或推理來定制模型。

2023-11-08 15:35:53

470

傳英偉達(dá)已開發(fā)三款中國特供AI芯片，最快11月16日后公布

　熟悉內(nèi)部情況的人士表示：“最新3款芯片是h100的改良，英偉達(dá)最快將在11月16日以后公布這一消息，國內(nèi)制造企業(yè)最快將在這幾天內(nèi)收到產(chǎn)品。”

2023-11-10 10:33:46

491

傳英偉達(dá)新AI芯片H20綜合算力比H100降80%

但據(jù)悉，三種新型AI芯片不是“改良型”，而是“縮小型”。用于ai模型教育的hgx h20的帶寬和計(jì)算速度是有限的。整體計(jì)算能力理論上比nvidia的h100 gpu芯片低80%左右。h20是h100的20%的綜合計(jì)算性能。

2023-11-13 09:41:58

746

英偉達(dá)確認(rèn)為中國推三款改良AI芯片性能暴降80%

據(jù)報(bào)道，nvidia的3種ai芯片不是“改良版”，而是“縮水版”，分別是hgx h20、l20 pcle和l2 pcle。用于ai模型訓(xùn)練的hgx h20雖然帶寬和計(jì)算速度有限，但整體計(jì)算能力理論上比英偉達(dá)h100 gpu芯片低80%左右。

2023-11-13 10:46:07

409

揭秘：英偉達(dá)H100最強(qiáng)替代者

目前，用于高端推理的 GPU 主要有三種：NVIDIA A100、NVIDIA H100 和新的 NVIDIA L40S。我們將跳過NVIDIA L4 24GB，因?yàn)樗袷堑投送评砜ā?/div>

2023-11-13 16:13:31

572

英偉達(dá)特供版芯片將上市：性能最高不到H100的20%

本周四，一些媒體首次報(bào)道了英偉達(dá)特供芯片的消息。報(bào)道稱，這三款新產(chǎn)品是在 H100 GPU 的基礎(chǔ)版本基礎(chǔ)上進(jìn)行修改的，采用的是最新架構(gòu)，但性能大幅度縮減。H100 GPU 是一種用于人工智能訓(xùn)練的高端 GPU，已于 2022 年 8 月被禁止在國內(nèi)銷售。

2023-11-13 16:44:13

413

世界最強(qiáng)AI芯H200發(fā)布，英偉達(dá)：性能提升90%

在備受關(guān)注的人工智能領(lǐng)域，英偉達(dá)表示，h200將進(jìn)一步提高性能。llama 2（700億個(gè)llm）的推理速度是h100的兩倍。未來的軟件更新有望為h200帶來更多的性能和改進(jìn)。

2023-11-14 10:49:16

552

對英偉達(dá)A100芯片算力服務(wù)收費(fèi)價(jià)格上調(diào)100%，這家企業(yè)的硬氣來自哪里？

半導(dǎo)體芯情了解到，A100是英偉達(dá)最新推出的一款高性能計(jì)算芯片，采用了全新的Ampere架構(gòu)，Ampere架構(gòu)是NVIDIA于 GTC 2020發(fā)布的GPU架構(gòu)，NVIDIA Ampere 由540億晶體管組成，是7nm芯片。

2023-11-14 16:30:16

561

英偉達(dá)推出新款A(yù)I芯片H200 性能飆升90%但是估計(jì)依然被出口管制

大，也是H100的升級版，號稱性能飆升90%；全球最強(qiáng) AI 芯片。據(jù)英偉達(dá)的消息，H200擁有141GB的內(nèi)存、4.8TB/秒的帶寬，并將與H100相互兼容，推理速度幾乎達(dá)到H100的兩倍

2023-11-14 16:45:50

916

英偉達(dá)特供版芯片性能降80%！

報(bào)道中提到，英偉達(dá)的這三款A(yù)I芯片并非“改良版”，而是“縮水版”，其分別是HGX H20、L20 PCle和L2 PCle。用于AI模型訓(xùn)練的HGX H20在帶寬、計(jì)算速度等方面均有所限制，理論上，整體算力要比英偉達(dá) H100 GPU芯片降80%左右。

2023-11-14 17:09:36

558

英偉達(dá)推出用于人工智能工作的頂級芯片HGX H200

近日，英偉達(dá)推出了一款用于人工智能工作的頂級芯片HGX H200。新的GPU升級了需求巨大的H100，內(nèi)存帶寬增加了1.4倍，內(nèi)存容量增加了1.8倍，提高了其處理密集生成人工智能工作的能力

2023-11-15 14:34:50

859

英偉達(dá)發(fā)布最新AI芯片H200：性能提升2倍，成本下降50%

很明顯，如果能在相同的功率范圍之內(nèi)實(shí)現(xiàn) 2 倍的性能提升，就意味著實(shí)際能耗和總體擁有成本降低了 50%。所以從理論上講，英偉達(dá)似乎可以讓 H200 GPU 的價(jià)格與 H100 持平。

2023-11-22 17:14:00

732

英偉達(dá)H100，沒那么缺貨了 !RTX 4090 ，大漲

這樣，在云端使用 H100 GPU 的排隊(duì)時(shí)間可能會(huì)縮短。數(shù)據(jù)中心提供商和前比特幣挖礦公司正在開設(shè)具有 H100 集群的數(shù)據(jù)中心。這些公司承諾以大型云提供商成本的一小部分提供 H100 GPU 計(jì)算，而大型云提供商對 H100 GPU 加速的虛擬機(jī)收取高價(jià)。

2023-11-23 15:59:22

569

英偉達(dá)H100 GPU Q3售出50萬塊，科技巨頭爭搶

這款產(chǎn)品最大購買客戶是Meta與微軟，各自購買了15萬塊；谷歌、亞馬遜、甲骨文、騰訊各自購買了5萬塊，榜單中還出現(xiàn)了百度、阿里巴巴、字節(jié)跳動(dòng)這幾家中國公司。集微網(wǎng)了解到，目前H100 80GB單卡售價(jià)將近4萬美元，約合28萬元人民幣。

2023-12-07 15:18:58

422

AMD正式發(fā)布 MI300X AI 加速器，力壓英偉達(dá)H100

如今，AMD已正式步入高性能計(jì)算（HPC）領(lǐng)域，并攜正規(guī)的數(shù)據(jù)中心GPU，觀察其與英偉達(dá)主導(dǎo)地位的角逐將會(huì)相當(dāng)有趣。這場戰(zhàn)斗類似于游戲GPU領(lǐng)域中的角逐，英偉達(dá)已占據(jù)了絕大多數(shù)市場份額，AMD 正為

2023-12-10 11:30:00

582

AI計(jì)算需求激增，英偉達(dá)H100功耗成挑戰(zhàn)

根據(jù)預(yù)測，若H100的年利用率保持在61%，那么單臺(tái)設(shè)備每年將耗電3740千瓦小時(shí)左右。如果英偉達(dá)在2023年售出150萬塊H100，2024年再增加至200萬塊，那么到2024年底，將有350萬塊H100芯片投入使用，其總年用電量將高達(dá)130.91億千瓦小時(shí)（13091.82GWh）。

2023-12-28 09:29:47

373

英偉達(dá)和華為/海思主流GPU型號性能參考

一句話總結(jié)，H100 vs. A100：3 倍性能，2 倍價(jià)格值得注意的是，HCCS vs. NVLINK的GPU 間帶寬。對于 8 卡 A800 和 910B 模塊而言，910B HCCS 的總帶寬為392GB/s，與 A800 NVLink (400GB/s) 相當(dāng)。

2023-12-29 11:43:55

1208

英偉達(dá)縮短AI GPU交付周期，持續(xù)推進(jìn)算力產(chǎn)業(yè)鏈發(fā)展

與此同時(shí)，隨著人工智能的迅猛發(fā)展及其廣泛應(yīng)用，對像H100和A100這類專為數(shù)據(jù)中心設(shè)計(jì)的高性能GPU的需求也大幅增長。而包括Yotta在內(nèi)的多家公司因此紛紛加大向英偉達(dá)的采購力度，導(dǎo)致這些產(chǎn)品出現(xiàn)短缺現(xiàn)象。

2024-02-18 09:36:17

149

H100 GPU供應(yīng)改善，AI市場需求依舊強(qiáng)勁

值得注意的是，H100 GPU的供求關(guān)系已經(jīng)緩解，且維護(hù)成本高起，部分客戶正在置換這類硬件以轉(zhuǎn)向云服務(wù)，這種轉(zhuǎn)變在過去的市場緊縮中很少見到。同時(shí)，市場上雖然有其他選擇如AMD的MI300 GPU，性能穩(wěn)定且價(jià)格低廉。

2024-02-29 16:10:05

151

英偉達(dá)H200和H100的比較

英偉達(dá)H200和H100是兩款不同的AI芯片，它們各自具有獨(dú)特的特點(diǎn)和優(yōu)勢。以下是關(guān)于這兩款芯片的一些比較。

2024-03-07 15:53:52

438

英偉達(dá)H200顯卡價(jià)格

英偉達(dá)H200顯卡的具體價(jià)格尚未公布。根據(jù)上一代H100顯卡的價(jià)格范圍，預(yù)計(jì)H200的單片價(jià)格將超過40000美元。由于新芯片通常定價(jià)較高，因此可以推斷H200的價(jià)格會(huì)比H100高出許多。

2024-03-07 16:09:03

371

高端GPU芯片拉警報(bào)，國產(chǎn)算力芯片能力如何？

電子發(fā)燒友網(wǎng)報(bào)道（文/李彎彎）近日，英偉達(dá)高端GPU對中國供應(yīng)受到限制的消息，引起熱議。8月31日，英偉達(dá)發(fā)布公告稱，美國通知公司向中國出口A100和H100芯片將需要新的許可證要求，同時(shí)DGX

2022-09-03 07:47:00

6221

英偉達(dá)推出A800 GPU，為了能賣給中國客戶，對A100“砍了一刀”...

，不能通過編程超過限制的性能。 ? 今年8月的最后一天，英偉達(dá)發(fā)布公告稱，公司收到美國政府通知，要求對中國大陸以及中國香港、俄羅斯的客戶出口的高端GPU芯片，需要申請出口許可證，其中覆蓋到A100和H100等幾款GPU，同時(shí)未來性能等于或高于A100的產(chǎn)品都會(huì)

2022-11-09 09:23:59

6683

英偉達(dá)GH200、特斯拉Dojo超級算力集群，性能爆棚！算力之爭加劇！

與H100 GPU相比，性能高出17%。要知道，英偉達(dá)的H100 GPU產(chǎn)品性能在業(yè)界已經(jīng)是處于遙遙領(lǐng)先的水平。 ? 相比于H10

2023-09-14 09:10:04

1930

英偉達(dá)發(fā)布新一代H200，搭載HBM3e，推理速度是H100兩倍！

電子發(fā)燒友網(wǎng)報(bào)道（文/李彎彎）日前，英偉達(dá)正式宣布，在目前最強(qiáng)AI芯片H100的基礎(chǔ)上進(jìn)行一次大升級，發(fā)布新一代H200芯片。H200擁有141GB的內(nèi)存、4.8TB/秒的帶寬，并將與H100相互

2023-11-15 01:15:00

2221

已全部加載完成

搜索歷史

英偉達(dá)最強(qiáng)芯片性能公布，比H100 GPU高出17%

評論