色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA CPU+GPU超級芯片終于量產

硬件世界 ? 來源:硬件世界 ? 2023-05-30 14:45 ? 次閱讀

2022年3月,NVIDIA發布了首款數據中心CPU Grace、新一代高性能計算GPU Hopper,同時利用它們打造了兩顆“超級芯片”(Super Chip),一是Grace CPU二合一,二是Grace CPU+Hopper GPU二合一,看起來都極為酷炫。

現在,足足14個月過去了,NVIDIA終于宣布,GH200 Grace Hopper超級芯片已經全面投產,將為復雜AI、HPC工作負載提供澎湃的動力。

再加上Grace CPU、Hopper GPU、Ada Lovelace GPU、BlueField DPU等全套系統方案,NVIDIA現在已經有400多種配置,可滿足市場對生成式AI的激增需求。

歐洲和美國的超大規模云服務商、超算中心,將會成為接入GH200系統的首批客戶。

同時,黃仁勛還公布了Grace Hopper的更多細節,尤其是它的CPU、GPU之間使用NVLink-C2C互連技術,總帶寬高達900GB/s,相比傳統的PCIe 5.0通道超出足足7倍,能夠滿足要求最苛刻的生成式AI和HPC應用,功耗也降低了超過80%。

Grace Hopper是一塊CPU+GPU合體的超級芯片,CPU是NVIDIA自研的72核處理器,Neoverse V2內核,擁有480GB LPDDR5內存,512GB/s帶寬。

GPU部分是H100,FP64性能34TFLOPS,但更強的是INT8性能,AI運算能力達到了3958TFLOPS,帶96GB HBM3內存。

同時,NVIDIA發布了針對AI推出的大內存DGX GH200超算系統,配備了256個Grace Hopper芯片,總計1.8萬CPU核心,144TB內存,相比之前漲了500倍。

AI運算對內存容量的要求更高,所以DGX GH200通過最新的NVLink、NVLink Switch等技術連接了256塊Grace Hooper超級芯片,實現了極為夸張的性能及內存。

GH200總計有256塊Grace Hooper芯片,因此總計18432個CPU核心,144TB HBM3內存,AI性能達到了1 exaFLOPS,也就是100億億次。

這是什么概念?當前最強的TOP500超算也就是百億億次性能,只不過這個性能是HPC計算的,NVIDIA的是百億億次AI性能。

45b302e0-fe68-11ed-90ce-dac502259ad0.jpg

為了讓256個超級芯片互聯,GH200還使用了256塊單口400Gb/s InfiniBand互聯芯片,256個雙口200Gb/s InfiniBand芯片,還有96組L1 NVLink、36組L2 NVLink開關等等,設計非常復雜。

NVIDIA表示,谷歌、Meta及微軟是首批獲得DGX H200系統的公司,后續他們還會開放給更多客戶,運行客戶定制。

不過DGX H200還不是最強的,NVIDIA今年晚些時候會推出名為NVIDIA Helios的AI超算系統,由4組GH200組成,總計1024個Grace Hooper超級芯片,576TB HBM內存。

黃仁勛還向傳統的CPU服務器集群發起“挑戰”,認為在人工智能加速計算這一未來方向上,GPU服務器有著更為強大的優勢。

根據黃仁勛在演講上展示的范例,訓練一個LLM大語言模型,將需要960個CPU組成的服務器集群,這將耗費大約1000萬美元(約合人民幣7070萬元),并消耗11千兆瓦時的電力。

45ce1166-fe68-11ed-90ce-dac502259ad0.png

相比之下,同樣以1000萬美元的成本去組建GPU服務器集群,將以僅3.2千兆瓦時的電力消耗,訓練44個LLM大模型。

45fca774-fe68-11ed-90ce-dac502259ad0.png

如果同樣消耗11千兆瓦時的電量,那么GPU服務器集群能夠實現150倍的加速,訓練150個LLM大模型,且占地面積更小。

而當用戶僅僅想訓練一個LLM大模型時,則只需要一個40萬美元左右,消耗0.13千兆瓦時電力的GPU服務器即可。

換言之,相比CPU服務器,GPU服務器能夠以4%的成本和1.2%的電力消耗來訓練一個LLM,這將帶來巨大的成本節省。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    4981

    瀏覽量

    102997
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4729

    瀏覽量

    128897
  • 超級芯片
    +關注

    關注

    0

    文章

    34

    瀏覽量

    8876

原文標題:領先幾光年!NVIDIA CPU+GPU超級芯片終于量產

文章出處:【微信號:hdworld16,微信公眾號:硬件世界】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    NVIDIA 以太網加速 xAI 構建的全球最大 AI 超級計算機

    市的 Colossus 超級計算機集群達到了 10 萬顆 NVIDIA? Hopper? GPU 的巨大規模。該集群使用了 NVIDIA Spectrum-X? 以太網網絡平臺,該平臺
    發表于 10-30 09:33 ?142次閱讀
    <b class='flag-5'>NVIDIA</b> 以太網加速 xAI 構建的全球最大 AI <b class='flag-5'>超級</b>計算機

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】--全書概覽

    本帖最后由 1653149838.791300 于 2024-10-16 22:19 編輯 感謝平臺提供的書籍,厚厚的一本,很有分量,感謝作者的傾力付出成書。 本書主要講算力芯片CPU
    發表于 10-15 22:08

    名單公布!【書籍評測活動NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架構分析

    紙質媒體的高質量和專業網絡媒體的信息更新速度。 算力芯片在最近15年有著巨大性能突破,這些年Intel的CPU芯片從雙核128位SIMD到眾核512位SIMD;NVIDIA
    發表于 09-02 10:09

    NVIDIA GB200超級芯片引領液冷散熱新紀元

    ,特別是其單顆B200芯片功耗高達1000W,以及由一顆Grace CPU與兩顆Blackwell GPU組成的超級芯片GB200功耗驚人地
    的頭像 發表于 08-01 16:35 ?974次閱讀

    NVIDIA GB200 CPU+GPU超級芯片功耗達2700W

    7月31日,集邦咨詢發布的最新報告揭示了AI服務器領域的一個重要趨勢:隨著計算能力與功耗的同步攀升,特別是NVIDIA計劃在年底推出的下一代Blackwell平臺將帶來顯著的功耗增長,液冷散熱技術正逐步成為行業標配,預計今年底其市場滲透率將達到10%。
    的頭像 發表于 07-31 13:02 ?1018次閱讀

    超級猛獸 GPU ?NVIDIA GeForce RTX 5090 基本頻率接近 2.9 GHz

    ABSTRACT摘要根據最新傳言,旗艦級NVIDIAGeForceRTX5090GPU看起來將是一款超級猛獸。據稱,顯卡的基本時鐘速度將設定在2.9GHz左右,幾乎達到3GHz的門檻
    的頭像 發表于 07-12 08:26 ?435次閱讀
    <b class='flag-5'>超級</b>猛獸 <b class='flag-5'>GPU</b> ?<b class='flag-5'>NVIDIA</b> GeForce RTX 5090 基本頻率接近 2.9 GHz

    CPU渲染和GPU渲染優劣分析

    GPU的出現,基于GPU的渲染獲得了很大的普及。這些GPU是特定用途的芯片,在某些情況下提供與CPU渲染相當的結果。從廣義上講,
    的頭像 發表于 05-23 08:27 ?591次閱讀
    <b class='flag-5'>CPU</b>渲染和<b class='flag-5'>GPU</b>渲染優劣分析

    進一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片

    CPU和72個Blackwell GPU,并通過NVIDIA NVLink技術連接。DGX SuperPOD可以通過NVIDIA Quantum InfiniBand連接多個機架,實
    發表于 05-13 17:16

    利用NVIDIA組件提升GPU推理的吞吐

    本實踐中,唯品會 AI 平臺與 NVIDIA 團隊合作,結合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)將推理的稠密網絡和熱 Embedding 全置于
    的頭像 發表于 04-20 09:39 ?718次閱讀

    AI服務器異構計算深度解讀

    AI服務器按芯片類型可分為CPU+GPUCPU+FPGA、CPU+ASIC等組合形式,CPU+GPU是目前國內的主要選擇(占比91.9%)
    發表于 04-12 12:27 ?611次閱讀
    AI服務器異構計算深度解讀

    NVIDIA推出搭載GB200 Grace Blackwell超級芯片NVIDIA DGX SuperPOD?

    NVIDIA 于太平洋時間 3 月 18 日發布新一代 AI 超級計算機 —— 搭載 NVIDIA GB200 Grace Blackwell 超級
    的頭像 發表于 03-21 09:49 ?698次閱讀

    NVIDIA 推出 Blackwell 架構 DGX SuperPOD,適用于萬億參數級的生成式 AI 超級計算

    基于先進的 NVIDIA 網絡、NVIDIA 全棧 AI 軟件和存儲技術,可將集群中 Grace Blackwell 超級芯片的數量擴展至數萬個,通過
    發表于 03-19 10:56 ?422次閱讀
    <b class='flag-5'>NVIDIA</b> 推出 Blackwell 架構 DGX SuperPOD,適用于萬億參數級的生成式 AI <b class='flag-5'>超級</b>計算

    深度解讀Nvidia AI芯片路線圖

    Nvidia是一個同時擁有 GPUCPU和DPU的計算芯片和系統公司。Nvidia通過NVLink、NVSwitch和NVLink C2C
    發表于 03-13 09:25 ?923次閱讀
    深度解讀<b class='flag-5'>Nvidia</b> AI<b class='flag-5'>芯片</b>路線圖

    Nvidia與AMD新芯片,突破PCIe瓶頸

    AMD 和 NvidiaGPU 都依賴 PCI 總線與 CPU 進行通信。CPUGPU 有兩個不同的內存域,數據必須通過 PCI
    的頭像 發表于 03-08 14:15 ?667次閱讀
    <b class='flag-5'>Nvidia</b>與AMD新<b class='flag-5'>芯片</b>,突破PCIe瓶頸

    為什么GPUCPU更快?

    GPUCPU更快的原因并行處理能力:GPU可以同時處理多個任務和數據,而CPU通常只能一次處理一項任務。這是因為GPU的架構使得它可以同時
    的頭像 發表于 01-26 08:30 ?2398次閱讀
    為什么<b class='flag-5'>GPU</b>比<b class='flag-5'>CPU</b>更快?
    主站蜘蛛池模板: 国产免费人成在线看视频| 韩国无遮羞禁动漫在线观看 | 动漫美女无衣| 国产在线精品亚洲第一区| 美女被撕开胸罩狂揉大乳| 特级做A爰片毛片免费69| 在线观看国产亚洲| 丰满五十六十老熟女HD60| 久久天堂视频| 水蜜桃亚洲一二三四在线| 2020亚洲国产在线播放在线| 国产精品A久久777777| 美女坐脸vk| 小泽玛丽av无码观看| a级全黄试频试看30分钟| 国产中文在线观看| 欧美一级久久久久久久久大| 亚洲一区二区影院| 广播电台在线收听| 毛片一区二区三区| 亚洲精品乱码久久久久久v| 趁老师睡着吃她的奶水| 久久婷婷色一区二区三区| 午夜伦理yy44008影院| FERRCHINA内入内射| 九九热视频这里只有精| 午夜特级毛片| 拔萝卜电视剧高清免费| 久久人妻熟女中文字幕AV蜜芽 | 视频成人app永久在线观看| 99国产精品免费视频| 极品美女穴| 无码人妻精品国产婷婷| 把内衣脱了把奶露出来| 撅高 自己扒开 调教| 亚洲合集综合久久性色| 国产av在在免费线观看美女| 欧美z000z猪| 123成人站| 九九热免费在线观看| 亚洲国产精品嫩草影院久久|