NVIDIA GPU已經(jīng)在AI、HPC領(lǐng)域遙遙領(lǐng)先,但沒有最強(qiáng),只有更強(qiáng)。
現(xiàn)在,NVIDIA又發(fā)布了全新的HGX H200加速器,可處理AIGC、HPC工作負(fù)載的海量數(shù)據(jù)。
NVIDIA H200的一大特點(diǎn)就是首發(fā)新一代HBM3e高帶寬內(nèi)存(疑似來自SK海力士),單顆容量就多達(dá)141GB(原始容量144GB但為提高良率屏蔽了一點(diǎn)點(diǎn)),同時(shí)帶寬多達(dá)4.8TB/s。
對比H100,容量增加了76%,帶寬增加了43%,而對比上代A100,更是容量幾乎翻番,帶寬增加2.4倍。
得益于NVLink、NVSwitch高速互連技術(shù),H200還可以四路、八路并聯(lián),因此單系統(tǒng)的HBM3e內(nèi)存容量能做到最多1128GB,也就是1.1TB。
只是相比于AMD Instinct MI300X還差點(diǎn)意思,后者搭載了192GB HBM3,帶寬高達(dá)5.2TB/s。
性能方面,H200再一次實(shí)現(xiàn)了飛躍,700億參數(shù)的Llama2大語言模型推理性能比H100提高了多達(dá)90%,1750億參數(shù)的GTP-3模型推理性能也提高了60%,而對比前代A100 HPC模擬性能直接翻番。
八路H200系統(tǒng)下,F(xiàn)P8深度學(xué)習(xí)計(jì)算性能可以超過32PFlops,也就是每秒3.2億億次浮點(diǎn)計(jì)算,堪比一臺大型超級計(jì)算機(jī)。
隨著未來軟件的持續(xù)升級,H200還有望繼續(xù)釋放潛力,實(shí)現(xiàn)更大的性能優(yōu)勢。
此外,H200還可以與采用超高速NVLink-C2C互連技術(shù)的NVIDIA Grace CPU處理器搭配使用,就組成了GH200 Grace Hopper超級芯片,專為大型HPC、AI應(yīng)用而設(shè)計(jì)的計(jì)算模塊。
NVIDIA H200將從2024年第二季度開始通過全球系統(tǒng)制造商、云服務(wù)提供商提供。
另外,NVIDIA第一次披露了下一代AI/HPC加速器的情況,架構(gòu)代號Blackwell,核心編號GB200,加速器型號B100。
NVIDIA第一次公開確認(rèn),B100將在2024年發(fā)布,但未出更具體的時(shí)間表。
此前曝料稱,B100原計(jì)劃2024年第四季度推出,但因?yàn)锳I需求太火爆,已經(jīng)提前到第二季度,現(xiàn)已進(jìn)入供應(yīng)鏈認(rèn)證階段。
NVIDIA表示,B100加速器可以輕松搞定1730億參數(shù)的大語言模型,是現(xiàn)在H200的兩倍甚至更多。
雖然這不代表原始計(jì)算性能,但也足以令人望而生畏。
同時(shí),B100還將帶來更高級的HBM高帶寬內(nèi)存規(guī)格。
回顧歷史,Pascal P100、Ampere A100、Hopper H100、H200分別首發(fā)應(yīng)用HBM2、HBM2e、HBM3、HBM3e。
接下來的B100肯定趕不上HBM4(規(guī)范還沒定呢),但必然會(huì)在堆疊容量、帶寬上繼續(xù)突破,大大超越現(xiàn)在的4.8TB/s。
Blackwell架構(gòu)同時(shí)也會(huì)用于圖形工作站和桌面游戲,傳聞?dòng)蠫B202、GB203、GB205、GB206、GB207等不同核心,但是對于RTX 50系列,NVIDIA始終三緘其口,幾乎肯定到2025年才會(huì)發(fā)布。
2024年就將是RTX 40 SUPER系列的天下了,明年初的CES 2025首發(fā)三款型號RTX 4080 SUPER、RTX 4070 Ti SUPER、RTX 4070 SUPER。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5107瀏覽量
104463 -
gpu
+關(guān)注
關(guān)注
28文章
4830瀏覽量
129778 -
堆疊
+關(guān)注
關(guān)注
0文章
35瀏覽量
16693 -
AI
+關(guān)注
關(guān)注
87文章
32439瀏覽量
271616 -
HBM3
+關(guān)注
關(guān)注
0文章
74瀏覽量
199 -
HBM3E
+關(guān)注
關(guān)注
0文章
79瀏覽量
332
原文標(biāo)題:1.1TB HBM3e內(nèi)存!NVIDIA奉上全球第一GPU:可惜無緣中國
文章出處:【微信號:hdworld16,微信公眾號:硬件世界】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
三星電子將供應(yīng)改良版HBM3E芯片
美光加入16-Hi HBM3E內(nèi)存競爭
SK海力士加速16Hi HBM3E內(nèi)存量產(chǎn)準(zhǔn)備
美光12層堆疊HBM3E 36GB內(nèi)存啟動(dòng)交付
三星電子HBM3E內(nèi)存獲英偉達(dá)認(rèn)證,加速AI GPU市場布局
SK海力士9月底將量產(chǎn)12層HBM3E高性能內(nèi)存
TrendForce:三星HBM3E內(nèi)存通過英偉達(dá)驗(yàn)證,8Hi版本正式出貨
三星HBM3e獲英偉達(dá)認(rèn)證,加速DRAM產(chǎn)能轉(zhuǎn)型
三星否認(rèn)HBM3E通過英偉達(dá)測試傳聞
中國AI芯片和HBM市場的未來
SK海力士HBM3E內(nèi)存良率已達(dá)80%
三星電子HBM存儲(chǔ)技術(shù)進(jìn)展:12層HBM3E芯片,2TB/s帶寬HBM4即將上市
NVIDIA預(yù)定購三星獨(dú)家供應(yīng)的大量12層HBM3E內(nèi)存
什么是HBM3E內(nèi)存?Rambus HBM3E/3內(nèi)存控制器內(nèi)核

評論