色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

DGX-2為什么被稱(chēng)為全球最大GPU

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來(lái)源:未知 ? 作者:胡薇 ? 2018-10-25 15:07 ? 次閱讀

今年早些時(shí)候,NVIDIA首席執(zhí)行官黃仁勛發(fā)布了NVIDIA? DGX-2?服務(wù)器,并稱(chēng)其為“全球最大GPU”。DGX-2在單一系統(tǒng)中包含了16個(gè)NVIDIA Tesla? V100 32 GB GPU和其他頂級(jí)組件(兩個(gè)24核Xeon CPU、1.5 TB DDR4 DRAM內(nèi)存和30 TB NVMe存儲(chǔ)),通過(guò)基于NVSwitch的NVLink結(jié)構(gòu)連接,可提供2 petaFLOPS的性能,堪稱(chēng)最強(qiáng)大的超級(jí)計(jì)算機(jī)之一。

NVSwitch使DGX-2成為了最大的GPU,這意味著其總體并非各部分的簡(jiǎn)單加成。事實(shí)證明,讓DGX-2服務(wù)器能夠稱(chēng)得上“全球最大GPU”的,正是其中看似最不起眼的部分。讓我們來(lái)看看創(chuàng)新NVIDIA NVSwitch?芯片及其他工程特性如何使DGX-2成為了全球最大的GPU。

注:本文中的信息來(lái)自于Alex Ishii 和 Denis Foley 在Hot Chip 2018大會(huì)上的專(zhuān)題演示“NVSwitch and DGX?2 – NVIDIA NVLink-Switching Chip and Scale-Up GPU-Compute Server”。

單一GPU

讓我們先看看單一多核GPU如何與CPU交互,如圖1所示。程序員通過(guò)NVIDIA CUDA?技術(shù)明確地展現(xiàn)了并行工作。工作流經(jīng)PCIe I / O端口進(jìn)入GPU,其中數(shù)據(jù)由GPU驅(qū)動(dòng)程序分發(fā)到可用的圖形處理群集(GPC)和流式多處理器(SM)內(nèi)核。XBAR的采用讓GPU / SM內(nèi)核能夠在L2高速緩存和高帶寬GPU內(nèi)存(HBM2)上交換數(shù)據(jù)。

GPC和GPU內(nèi)存之間的高帶寬可實(shí)現(xiàn)大規(guī)模計(jì)算能力和快速同步,但規(guī)模受限,因其要求數(shù)據(jù)必須適合本地GPU內(nèi)存,才能有效使用XBAR提供的高帶寬。

圖1. 連接到CPU的單一GPU

雙GPU(PCIe和NVLink)

圖2顯示了添加另一個(gè)GPU是如何增加可用GPU內(nèi)存量的。在所示配置中,GPU只能以PCIe提供的32 GBps的最大雙向帶寬,訪問(wèn)其他GPU上的內(nèi)存。此外,這些交互會(huì)與總線上的CPU操作競(jìng)爭(zhēng),甚至進(jìn)一步占用可用帶寬。

圖2. 通過(guò)PCIe總線連接的雙GPU

NVIDIA NVLink?技術(shù)使GPC無(wú)需通過(guò)PCIe總線即可訪問(wèn)遠(yuǎn)程GPU內(nèi)存,如圖3所示。NVLinks實(shí)現(xiàn)了XBAR之間的有效橋接。V100 GPU上最多可采用六個(gè)NVLink,GPU之間的雙向帶寬可達(dá)300 GBps。但是,在具有兩個(gè)以上GPU的系統(tǒng)中,六個(gè)可用的NVLink必須先分成較小的鏈接組,每個(gè)組專(zhuān)用于訪問(wèn)不同的特定單一GPU。這就限制了可使用直接連接來(lái)構(gòu)建的機(jī)器規(guī)模,并降低了每對(duì)GPU之間的帶寬。

圖3. 通過(guò)NVLink技術(shù)連接的雙GPU

Super Crossbar將GPU連接在一起

理想的情況是提供某種交叉,讓更多GPU能夠訪問(wèn)所有GPU內(nèi)存,所有GPU都可能在單一GPU驅(qū)動(dòng)程序?qū)嵗目刂葡拢鐖D4所示。有了這樣的交叉,可在沒(méi)有其他進(jìn)程干預(yù)的情況對(duì)GPU內(nèi)存進(jìn)行訪問(wèn),且可用帶寬將足夠高,可提供類(lèi)似于上文所述的雙GPU情況下的性能擴(kuò)展。

圖4. 尋找交叉開(kāi)關(guān)設(shè)備

最終目標(biāo)是提供以下所有內(nèi)容:

更大的問(wèn)題規(guī)模容量。大小受整個(gè)GPU集合的GPU內(nèi)存容量限制,而非單一GPU容量。

強(qiáng)大的可擴(kuò)展性。與現(xiàn)有解決方案相比,NUMA效應(yīng)將大大降低。總內(nèi)存帶寬實(shí)際上會(huì)隨GPU數(shù)量而增長(zhǎng)。

使用便利。針對(duì)較少數(shù)量的GPU編寫(xiě)的應(yīng)用程序?qū)⒏子谝浦病4送猓S富的資源可助力快速開(kāi)展實(shí)驗(yàn)。

以上16-GPU配置(假設(shè)有32GB V100 GPU)產(chǎn)生的總?cè)萘渴蛊淠軌蚯八从械剡\(yùn)行“一個(gè)超強(qiáng)GPU”的計(jì)算。

NVIDIA NVSwitch介紹

NVSwitch(圖5)是一款GPU橋接設(shè)備,可提供所需的NVLink交叉網(wǎng)絡(luò)。端口邏輯模塊中的數(shù)據(jù)包轉(zhuǎn)換使得進(jìn)出多GPU的流量看似是通過(guò)單一GPU的。

圖5. 帶有標(biāo)注的NVSwitch芯片裸片

NVSwitch芯片并行運(yùn)行,以支持?jǐn)?shù)量日益增加的GPU之間的互連。可使用三個(gè)NVSwitch芯片構(gòu)建一個(gè)8 GPU封閉系統(tǒng)。兩條NVLink路徑將每個(gè)GPU連接至每臺(tái)交換機(jī),流量在所有NVLink和NVSwitch之間交叉。 GPU使用任意對(duì)之間的300 GBps雙向帶寬成對(duì)通信,因?yàn)镹VSwitch芯片提供了從任何源到任何目的地的唯一路徑。

圖6. NVSwitch框圖

實(shí)現(xiàn)了對(duì)分帶寬

讓每個(gè)GPU從另一個(gè)GPU讀取數(shù)據(jù),而不會(huì)有兩個(gè)GPU從同一遠(yuǎn)程GPU讀取數(shù)據(jù),就實(shí)現(xiàn)了無(wú)干擾的成對(duì)通信能力。使用16個(gè)GPU實(shí)現(xiàn)的1.98 TBps讀取帶寬與128B傳輸在理論上80%的雙向NVLink效率相匹配。

圖7. 實(shí)現(xiàn)的對(duì)分帶寬結(jié)果

使用cuFFT(16K X 16K)

實(shí)現(xiàn)更強(qiáng)大的可擴(kuò)展性

通過(guò)在越來(lái)越多的GPU上(更高的GFLOPS,相應(yīng)的總運(yùn)行時(shí)間卻更短)、以及搭載V100 GPU的NVIDIA DGX-1服務(wù)器上運(yùn)行“iso-problem instance”計(jì)算進(jìn)行對(duì)比,即能證明其強(qiáng)大的可擴(kuò)展性能,如圖8所示。如果沒(méi)有NVSwitch網(wǎng)絡(luò)提供的NVLink交叉,由于問(wèn)題分散在更多GPU上,傳輸數(shù)據(jù)所需的時(shí)間要長(zhǎng)于在本地對(duì)相同數(shù)據(jù)進(jìn)行簡(jiǎn)單計(jì)算所需的時(shí)間。

圖8. 使用NVLink與Hybrid Cube Mesh的cuFFT結(jié)果

全歸約基準(zhǔn)測(cè)試

圖9也體現(xiàn)了NVLink交叉的優(yōu)勢(shì)。全歸約基準(zhǔn)測(cè)試是對(duì)機(jī)器學(xué)習(xí)應(yīng)用程序中采用的重要通信原語(yǔ)進(jìn)行的測(cè)量。與兩臺(tái)配備八個(gè)GPU的服務(wù)器(通過(guò)InfiniBand連接)相比,NVLink交叉讓16 GPU DGX-2服務(wù)器能夠提供更高帶寬和更低延遲。 針對(duì)較小的信息,NVLink網(wǎng)絡(luò)的效率明顯優(yōu)于InfiniBand。

圖9. 全歸約基準(zhǔn)測(cè)試結(jié)果顯示NVLink與InfiniBand帶寬效率的顯著差異

HPC和AI訓(xùn)練基準(zhǔn)測(cè)試的加速

圖10所示,與總GPU數(shù)相同的兩臺(tái)DGX-1(采用V100)服務(wù)器相比,HPC和AI訓(xùn)練基準(zhǔn)測(cè)試性能得以提升,速度達(dá)到了其2到2.7倍。對(duì)比所用的DGX-1服務(wù)器各采用了8個(gè)Tesla V100 32 GB GPU和雙槽Xeon E5 2698v4處理器。服務(wù)器通過(guò)四個(gè)EDR IB / GbE端口連接。

圖10. HPC和AI訓(xùn)練基準(zhǔn)測(cè)試的加速

總結(jié)

正因有了NVSwitch芯片,DGX-2才可謂全球最大GPU。NVSwitch是一種暢通無(wú)阻的設(shè)備,具有18個(gè)NVLink端口,每端口51.5 GBps,聚合雙向帶寬達(dá)928 GBps。采用了NVSwitch芯片的DGX-2可提供512 GB的總?cè)萘浚槍?duì)特定應(yīng)用的性能表現(xiàn)超過(guò)InfiniBand連接的一對(duì)DGX-1服務(wù)器的兩倍。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5213

    瀏覽量

    105645
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4898

    瀏覽量

    130554

原文標(biāo)題:全球最大GPU 背后的秘密:NVSwitch如何實(shí)現(xiàn)NVIDIA DGX-2的超強(qiáng)功力?

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 0人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    薩瑞微電子SiC 和 GaN賦能AI服務(wù)器電源系統(tǒng)

    01AI服務(wù)器電源的核心挑戰(zhàn)與技術(shù)需求超高功率密度:?jiǎn)螜C(jī)架功率已從傳統(tǒng)服務(wù)器的數(shù)千瓦提升至數(shù)十千瓦(如英偉達(dá)DGX-2需10kW,未來(lái)GB300芯片預(yù)計(jì)達(dá)1.4kW單芯片功耗),要求電源方案在有
    的頭像 發(fā)表于 04-03 14:41 ?276次閱讀
    薩瑞微電子SiC 和 GaN賦能AI服務(wù)器電源系統(tǒng)

    NVIDIA GTC2025 亮點(diǎn) NVIDIA推出 DGX Spark個(gè)人AI計(jì)算機(jī)

    和聯(lián)想)提供。 NVIDIA 發(fā)布了由 NVIDIA Grace Blackwell 平臺(tái)驅(qū)動(dòng)的 DGX 個(gè)人 AI 超級(jí)計(jì)算機(jī)。 DGX Spark(前身為 Project DIGITS)支持 AI
    的頭像 發(fā)表于 03-20 18:59 ?730次閱讀
    NVIDIA GTC2025 亮點(diǎn)  NVIDIA推出 <b class='flag-5'>DGX</b> Spark個(gè)人AI計(jì)算機(jī)

    NVIDIA 宣布推出 DGX Spark 個(gè)人 AI 計(jì)算機(jī)

    DGX? 個(gè)人 AI 超級(jí)計(jì)算機(jī)。 ? DGX Spark(前身為 Project DIGITS)支持 AI 開(kāi)發(fā)者、研究人員、數(shù)據(jù)科學(xué)家和學(xué)生,在臺(tái)式電腦上對(duì)大模型進(jìn)行原型設(shè)計(jì)、微調(diào)和推理。用
    發(fā)表于 03-19 09:59 ?250次閱讀
       NVIDIA 宣布推出 <b class='flag-5'>DGX</b> Spark 個(gè)人 AI 計(jì)算機(jī)

    OpenVINO?檢測(cè)到GPU,但網(wǎng)絡(luò)無(wú)法加載到GPU插件,為什么?

    GPU 插件。 遇到的錯(cuò)誤: OpenVINOException: cldnn program build failed! Program build failed(2_part_0)
    發(fā)表于 03-05 06:01

    ASIC和GPU的原理和優(yōu)勢(shì)

    ? 本文介紹了ASIC和GPU兩種能夠用于AI計(jì)算的半導(dǎo)體芯片各自的原理和優(yōu)勢(shì)。 ASIC和GPU是什么 ASIC和GPU,都是用于計(jì)算功能的半導(dǎo)體芯片。因?yàn)槎伎梢杂糜贏I計(jì)算,所以也被稱(chēng)為
    的頭像 發(fā)表于 01-06 13:58 ?1337次閱讀
    ASIC和<b class='flag-5'>GPU</b>的原理和優(yōu)勢(shì)

    《CST Studio Suite 2024 GPU加速計(jì)算指南》

    2. 操作系統(tǒng)支持:CST Studio Suite在不同操作系統(tǒng)上持續(xù)測(cè)試,可在支持的操作系統(tǒng)上使用GPU計(jì)算,具體參考相關(guān)文檔。 3. 許可證:GPU計(jì)算功能通過(guò)CST Studio Suite
    發(fā)表于 12-16 14:25

    預(yù)計(jì)2024年全球GPU市場(chǎng)銷(xiāo)售額將超985億美元

    根據(jù)市場(chǎng)研究機(jī)構(gòu)Jon Peddie Research(JPR)最新發(fā)布的預(yù)測(cè)數(shù)據(jù),2024年全球GPU市場(chǎng)的銷(xiāo)售額預(yù)計(jì)將超過(guò)985億美元,這一數(shù)字凸顯出GPU市場(chǎng)的強(qiáng)勁增長(zhǎng)勢(shì)頭。
    的頭像 發(fā)表于 11-15 16:26 ?710次閱讀

    【一文看懂】大白話解釋“GPUGPU算力”

    GPUGPU算力1.GPU是什么?2.GPU與CPU的區(qū)別?3.GPU算力是什么?4.哪些因素影響了G
    的頭像 發(fā)表于 10-29 08:05 ?2131次閱讀
    【一文看懂】大白話解釋“<b class='flag-5'>GPU</b>與<b class='flag-5'>GPU</b>算力”

    為什么被稱(chēng)為超級(jí)電容?超級(jí)電容怎么用?

    說(shuō)起電容的作用,很多電子人脫口而出:濾波。沒(méi)錯(cuò),這是大部分電容在電路中的作用,但有一種電容生而不是為了濾波,那就是超級(jí)電容。本期貿(mào)澤科普實(shí)驗(yàn)室,momo就為大家說(shuō)一說(shuō)超級(jí)電容。
    的頭像 發(fā)表于 10-24 10:15 ?2820次閱讀
    為什么<b class='flag-5'>被稱(chēng)為</b>超級(jí)電容?超級(jí)電容怎么用?

    NVIDIA DGX B200首次面向零售市場(chǎng):配備8塊B200 GPU

    10月13日最新消息,NVIDIA的DGX B200 AI服務(wù)器近期已在Broadberry上架,標(biāo)價(jià)515,410美元(相當(dāng)于約364.2萬(wàn)元人民幣)。   自發(fā)布以來(lái),Blackwell架構(gòu)就備受業(yè)界矚目,NVIDIA首席執(zhí)行官黃仁勛對(duì)其贊譽(yù)有加,微軟、Meta等科技巨頭也迅速跟進(jìn)采用。
    的頭像 發(fā)表于 10-14 14:34 ?1595次閱讀

    TI TDA2x SoC上基于GPU的環(huán)視優(yōu)化

    電子發(fā)燒友網(wǎng)站提供《TI TDA2x SoC上基于GPU的環(huán)視優(yōu)化.pdf》資料免費(fèi)下載
    發(fā)表于 10-10 09:14 ?0次下載
    TI TDA<b class='flag-5'>2</b>x SoC上基于<b class='flag-5'>GPU</b>的環(huán)視優(yōu)化

    3DP工藝最大的優(yōu)勢(shì)是什么

    3DP(Three Dimensional Printing and Gluing)工藝,也被稱(chēng)為三維打印黏結(jié)成型、噴墨沉積或粘合噴射、噴墨粉末打印,是一種先進(jìn)的3D打印技術(shù)。其最大的優(yōu)勢(shì)主要體現(xiàn)在以下幾個(gè)方面:
    的頭像 發(fā)表于 09-16 15:37 ?1504次閱讀

    暴漲預(yù)警!NVIDIA GPU供應(yīng)大跳水

    gpu
    jf_02331860
    發(fā)布于 :2024年07月26日 09:41:42

    被稱(chēng)為“小號(hào)HBM”,華邦電子CUBE進(jìn)階邊緣AI存儲(chǔ)

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)與AI訓(xùn)練以GPU搭配HBM不同,邊緣AI采用何種內(nèi)存方式,DDR、GDDR、LPDDR等適用于不同的場(chǎng)景。日前,華邦電子產(chǎn)品總監(jiān)朱迪接受包括電子發(fā)燒友網(wǎng)在內(nèi)的媒體采訪
    的頭像 發(fā)表于 07-01 16:21 ?3824次閱讀

    聚徽觸控-GPU 工控機(jī)是什么產(chǎn)品

    圖像處理器(Graphics Processing Unit,簡(jiǎn)稱(chēng) GPU),又被稱(chēng)為視覺(jué)處理單元、圖形核心,其設(shè)計(jì)專(zhuān)注于特定的任務(wù),主要用于加速幀緩沖區(qū)中實(shí)時(shí)的 3D 圖像構(gòu)建以及顯示相關(guān)的電子運(yùn)算。通常,GPU 與中央處理器
    的頭像 發(fā)表于 06-14 09:57 ?421次閱讀
    主站蜘蛛池模板: 国产露脸150部国语对白 | 九九免费的视频 | 99re久久精品在线播放 | 亚洲香蕉视频在线播放 | 午夜看片a福利在线观看 | 欧美一第一页草草影院 | 午夜特级毛片 | 人成片在线观看亚洲无遮拦 | 免费毛片播放 | 欧美黄色一级 | 蜜臀AV浪潮99国产麻豆 | 美丽的姑娘BD在线观看 | 精品视频久久久久 | 浪荡受自我调教纯肉BL | 99视频精品国产免费观看 | 扒开校花粉嫩小泬喷潮漫画 | 国产亚洲精品久久精品6 | 久久精品熟一区二区三区 | 污污又黄又爽免费的网站 | 亚洲合集综合久久性色 | 暖暖的视频完整视频免费韩国 | 色戒未删减版在线观看完整 | 日韩一区二区天海翼 | 久久精品热只有精品 | 国拍在线精品视频免费观看 | 乱h好大噗嗤噗嗤烂了 | 国产传媒18精品免费观看 | 一区二区三区国产 | 99久久精品国产国产毛片 | 老人洗澡自拍xxx互摸 | 伊人精品影院一本到综合 | 国产成人免费高清激情视频 | 伊人情人网综合 | 亚洲电影成人 成人影院 | 十八禁久久成人一区二区 | 黑吊大战白女出浆 | 免费精品一区二区三区AA片 | 国产精品99久久免费黑人人妻 | 国产一区二区精品视频 | 一级特黄aa大片欧美 | 欧美熟妇VIVOE精品 |

    電子發(fā)燒友

    中國(guó)電子工程師最喜歡的網(wǎng)站

    • 2931785位工程師會(huì)員交流學(xué)習(xí)
    • 獲取您個(gè)性化的科技前沿技術(shù)信息
    • 參加活動(dòng)獲取豐厚的禮品