亚洲狂妇,亚洲区一,天堂成人av

NVLink是Nvidia開發(fā)的一項(xiàng)用于GPU之間點(diǎn)對點(diǎn)高速互聯(lián)的技術(shù)，其旨在突破PCIe互聯(lián)帶寬的限制，實(shí)現(xiàn)GPU芯片間低延遲、高帶寬的數(shù)據(jù)互聯(lián)，使得GPU間更加高效地協(xié)同工作。在NVLink技術(shù)問世之前(2014年前)，GPU之間的互聯(lián)需要通過PCIe switch來實(shí)現(xiàn)，如下圖所示。GPU發(fā)出的信號需要先傳遞到PCIe switch, PCIe switch中涉及到數(shù)據(jù)的處理，CPU會對數(shù)據(jù)進(jìn)行分發(fā)調(diào)度，這些都會引入額外的網(wǎng)絡(luò)延遲，限制了系統(tǒng)性能。彼時，PCIe協(xié)議已經(jīng)發(fā)展到Gen 3, 單通道的速率為8Gb/s, 16通道的總帶寬為16GB/s (128Gbps，1 Byte= 8 bits )，隨著GPU芯片性能的不斷提升，其互聯(lián)帶寬成為瓶頸。

(圖片來自https://en.wikichip.org/wiki/nvidia/nvlink)

2014年，NVLink 1.0發(fā)布，并應(yīng)用在P100芯片上，如下圖所示。兩顆GPU之間有4條NVlink, 每個link中包含8個lane, 每條lane的速率是20Gb/s, 因此整個系統(tǒng)的雙向帶寬為160GB/s，是PCIe3 x16帶寬的5倍。

(圖片來自https://en.wikichip.org/wiki/nvidia/nvlink)

單個NVLink內(nèi)部含有16對差分線，對應(yīng)兩個方向各8條lane的信道，如下圖所示，差分對的兩端為PHY，內(nèi)部包含SerDes。

(圖片來自https://www.nextplatform.com/2016/05/04/nvlink-takes-gpu-acceleration-next-level/)

基于NVLink 1.0，可以形成4個GPU的平面mesh結(jié)構(gòu)，兩兩之間形成點(diǎn)對點(diǎn)直連，而8個GPU則對應(yīng)cube-mesh，進(jìn)而可以組成DGX-1服務(wù)器，這也對應(yīng)常見的8卡配置，如下圖所示，需要注意的是，此時8個GPU并沒有形成all-to-all連接。

（圖片來自https://developer.nvidia.com/blog/dgx-1-fastest-deep-learning-system/）

2017年，Nvidia推出了第二代NVLink技術(shù)。兩顆GPU V100之間含6條NVLink, 每個link中包含8個lane, 每條lane的速率提升到25Gb/s, 整個系統(tǒng)的雙向帶寬變?yōu)?00GB/s，帶寬是NVLink 1.0的近2倍。與此同時，為了實(shí)現(xiàn)8顆GPU之間的all-to-all互聯(lián)，Nvidia推出了NVSwitch技術(shù)。NVSwitch 1.0含有18個port, 每個port的帶寬為50GB/s, 整體帶寬為900GB/s。每個NVSwitch預(yù)留了兩個port, 用于連接CPU。使用6個NVSwitch即可實(shí)現(xiàn)8顆GPU V100的all-to-all連接，如下圖所示。

（圖片來自https://en.wikichip.org/wiki/nvidia/nvswitch）

DGX-2系統(tǒng)則采用兩個上圖中的板子構(gòu)建而成，如下圖所示，實(shí)現(xiàn)了16顆GPU芯片的all-to-all連接。

（圖片來自https://en.wikichip.org/wiki/nvidia/nvswitch）

2020年，NVLink 3.0技術(shù)誕生，兩顆GPU A100芯片之間存在12條NVLink, 每條NVLink含有4條lane, 單條lane的速率為50Gb/s, 因此整個系統(tǒng)的雙向帶寬提升到600GB/s，總帶寬相比NVLink 2.0提升了1倍。由于NVLink的數(shù)目增加了，NVSwitch的port數(shù)目也相應(yīng)增加到36個，每個port的速率為50GB/s。由8顆GPU A100與4個NVSwitch組成了DGX A100, 如下圖所示。

(圖片來自http://www.eventdrive.co.kr/2020/azwell/DGX_A100_Azwellplus.pdf)

2022年，NVLink技術(shù)升級到第四代，兩個GPU H100芯片間通過18條NVLink互聯(lián)，每條link中含2條lane, 每條lane支持100Gb/s PAM4的速率，因此雙向總帶寬提升到900GB/s。NVSwitch也升級到第三代，每個NVSwitch支持64個port，每個port的速率為50GB/s。DGX H100由8顆H100芯片與4顆NVSwitch芯片構(gòu)成，如下圖所示。圖中每個NVSwitch的另一側(cè)與多個800G OSFP光模塊相連。以左側(cè)第一個NVSwitch為例，其與GPU相連側(cè)的單向總帶寬為4Tbps (20NVLink*200Gbps)，與光模塊相連側(cè)的總帶寬為也為4Tbps (5*800Gbps)，兩者大小相等，是非阻塞(non-blocking)網(wǎng)絡(luò)。需要注意的是，光模塊中的帶寬是單向帶寬，而在AI芯片中一般習(xí)慣使用雙向帶寬。

(圖片來自https://blog.apnic.net/2023/08/10/large-language-models-the-hardware-connection/)

下表整理了每一代NVLink的指標(biāo)參數(shù)。

而PCIe每一代的參數(shù)如下表所示，

從單條lane的速率來看，NVLink整體比同一時期的PCIe的指標(biāo)高1倍左右，而總帶寬的優(yōu)勢更是明顯，NVLink是PCIe總帶寬的5倍左右。一直在超越，從未停止。

NVLink經(jīng)過近十年的發(fā)展，已經(jīng)成為Nvidia GPU芯片中的一個核心技術(shù)，是其生態(tài)系統(tǒng)中的重要一環(huán)，有效解決了GPU芯片之間高帶寬、低延遲的數(shù)據(jù)互聯(lián)難題，改變了傳統(tǒng)的計(jì)算架構(gòu)。但由于該技術(shù)是Nvidia獨(dú)有，其它AI芯片公司只能采用PCIe或者其它互聯(lián)協(xié)議。與此同時，Nvidia正在探索利用光互連實(shí)現(xiàn)GPU之間的連接，如下圖所示，硅光芯片與GPU共封裝在一起，兩顆GPU芯片間通過光纖連接。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

gpu

gpu

+關(guān)注

關(guān)注
28

文章
4729

瀏覽量
128890
PCIe

PCIe

+關(guān)注

關(guān)注
15

文章
1234

瀏覽量
82582
PHY

PHY

+關(guān)注

關(guān)注
2

文章
301

瀏覽量
51732

原文標(biāo)題：NVLink的演進(jìn)

文章出處：【微信號：算力基建，微信公眾號：算力基建】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級芯片

帶寬和1.8TB/s的NVLink帶寬，使處理能力翻倍，大幅增加內(nèi)存容量和帶寬，為處理大規(guī)模人工智能模型和復(fù)雜計(jì)算提供必要資源。針對大規(guī)模模型如GPT-MoE-1.8T，HGX B200的推理性

發(fā)表于 05-13 17:16

特斯拉V100 Nvlink是否支持v100卡的nvlink變種的GPU直通？

/4029/SYS-4029GP-TVRT.cfm）我們正試圖做pci將GPU直接傳輸?shù)絍M中但是當(dāng)我們通過pci設(shè)備并安裝驅(qū)動程序時，我們會從nvidia-nvlink模塊中獲得錯誤。是否支持v100卡的nvlink

發(fā)表于 09-12 16:25

java的IO演進(jìn)之路概述

第一章 java的IO演進(jìn)之路

發(fā)表于 07-24 16:53

英偉達(dá)GPU卡多卡互聯(lián)NVLink，系統(tǒng)累積的公差，是怎么解決的？是連接器吸收的？

英偉達(dá)不斷推出GPU卡，并且實(shí)現(xiàn)多卡互聯(lián)NVLink，實(shí)際整個系統(tǒng)會累積到一個較大的公差，而目前市面上已有的連接器只能吸收較少的公差，這個是怎么做到匹配的呢？

發(fā)表于 03-05 16:17

技嘉發(fā)布的NVLink連接器支持RGB燈光

10月3日消息隨著RTX 2080和RTX 2080 Ti顯卡的推出，各家廠商也推出了自家的NVLink連接器，已提供給發(fā)燒友使用，讓他們享受到最為強(qiáng)大的顯卡性能。之前華碩就公布了自家

發(fā)表于 10-10 17:07 ?875次閱讀

技嘉發(fā)布全新NVLink連接器：擁有RGB燈光

【大比特導(dǎo)讀】10月3日消息隨著RTX 2080和RTX 2080 Ti顯卡的推出，各家廠商也推出了自家的NVLink連接器，已提供給發(fā)燒友使用，讓他們享受到最為強(qiáng)大的顯卡性能。之前華碩就公布了

發(fā)表于 12-24 16:46 ?360次閱讀

RTX 3080 PCB上沒有NVLink連接器

查看兩張照片，立即彈出的一件事是RTX 3080 PCB上沒有NVLink連接器。另一方面，RTX 3090具有一個，考慮到其雙GPU支持，可以預(yù)期。

發(fā)表于 09-25 16:17 ?4237次閱讀

GTC2022大會亮點(diǎn)：NVIDIA宣布推出NVIDIA NVLink Switch系統(tǒng)

GTC2022大會亮點(diǎn)：NVIDIA宣布推出NVIDIA NVLink Switch系統(tǒng)，借助NVLink Switch系統(tǒng)，可以將其擴(kuò)展為一個巨大的擁有32個節(jié)點(diǎn)、256個GPU的DGX POD，都可借助4個端口光學(xué)收發(fā)器連接到NVL

發(fā)表于 03-24 15:15 ?3075次閱讀

什么是 NVLink？

NVLink 是加速系統(tǒng)中 GPU 和 CPU 處理器的高速互連技術(shù)，推動數(shù)據(jù)和計(jì)算加速得出可執(zhí)行結(jié)果。加速計(jì)算是一項(xiàng)曾經(jīng)只有政府研究實(shí)驗(yàn)室中才有的高性能計(jì)算能力。如今，它已成為主流技術(shù)。銀行

發(fā)表于 04-19 04:05 ?2791次閱讀

一文解析Nvlink的誕生和技術(shù)演進(jìn)歷程

Nvlink-C2C是個錯誤的技術(shù)路徑。我仿佛記得Nvlink-C2C的主架構(gòu)師Wei wei是我大學(xué)同學(xué) ？有這么個模糊印象。如果單純從技術(shù)的角度，Nvlink-C2C真的是一個恰到好處的設(shè)計(jì)，挺佩服的。增之一分則太長，減

發(fā)表于 07-03 11:50 ?5037次閱讀

什么是 NVLink?

什么是 NVLink?

發(fā)表于 10-27 16:10 ?800次閱讀

NVLink的演進(jìn)：從內(nèi)部互聯(lián)到超級網(wǎng)絡(luò)

NVLink是NVIDIA開發(fā)的一種高速、低延遲的互聯(lián)技術(shù)，旨在連接多個GPU以實(shí)現(xiàn)高性能并行計(jì)算。與傳統(tǒng)的PCIe總線相比，NVLink提供了更高的帶寬和更低的延遲，使得GPU之間可以更加高效地共享數(shù)據(jù)和通信。

發(fā)表于 04-13 11:22 ?1122次閱讀

全面解讀英偉達(dá)NVLink技術(shù)

NVLink是一種解決服務(wù)器內(nèi)GPU之間通信限制的協(xié)議。與傳統(tǒng)的PCIe交換機(jī)不同，NVLink帶寬有限，可以在服務(wù)器內(nèi)的GPU之間實(shí)現(xiàn)高速直接互連。第四代NVLink提供更高的帶寬，每條通道達(dá)到112Gbps，比PCIe Ge

發(fā)表于 04-22 11:01 ?1312次閱讀

科技巨頭組建“復(fù)仇者聯(lián)盟”，挑戰(zhàn)英偉達(dá)的NVLink技術(shù)

據(jù)報導(dǎo)，包括 AMD、谷歌、微軟、英特爾（Intel）、博通（Broadcom）和思科（Cisco）在內(nèi)的多家國際科技龍頭聯(lián)手，組成“復(fù)仇者聯(lián)盟”，欲挑戰(zhàn) NVIDIA 的 NVLink 技術(shù)。

發(fā)表于 05-31 11:54 ?618次閱讀

分布式通信的原理和實(shí)現(xiàn)高效分布式通信背后的技術(shù)NVLink的演進(jìn)

大型模型的大小已經(jīng)超出了單個 GPU 的范圍。所以就需要實(shí)現(xiàn)跨多個 GPU 的模型訓(xùn)練，這種訓(xùn)練方式就涉及到了分布式通信和 NVLink。當(dāng)談及分布式通信和 NVLink 時，我們進(jìn)入了一個引人入勝且不斷演進(jìn)的技術(shù)領(lǐng)域，下面我

發(fā)表于 11-18 09:39 ?415次閱讀