色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI時代,你需要了解的GPU互聯(lián)技術(shù):NVLink、IB、ROCE

sakobpqhz ? 來源:算力基建 ? 2023-12-13 16:26 ? 次閱讀

AI 時代 GPU 成為核心處理器,分布式訓(xùn)練訴求提升。GPU 采用并行計算方式,擅長處理大量、簡單的運(yùn)算,因此多適用于圖像圖形處理和 AI 推理。但是大模型復(fù)雜度日益提升,單卡 GPU 顯存有限,無法滿足訓(xùn)練需求,比如百度文心一言大模型有 2600 億個參數(shù),但是實際上一個 80G 顯存的 A800,算上訓(xùn)練中間的計算狀態(tài),只能存放 10-20 億參數(shù),存放 2600 億的模型就需要 100-200 塊 GPU;此外,后續(xù)大模型訓(xùn)練需要更多參數(shù)和更多計算,由此產(chǎn)生的 GPU 需求更為龐大。為適應(yīng)算力需求,需要聯(lián)合多張 GPU 甚至多臺服務(wù)器協(xié)同工作,分布式訓(xùn)練成為核心訓(xùn)練方式。

網(wǎng)絡(luò)連接在分布式系統(tǒng)中擔(dān)任重要角色。網(wǎng)絡(luò)在分布式系統(tǒng)中提供了連接作用,可以根據(jù)連接層級區(qū)分為單卡、多卡、多機(jī)互聯(lián),單卡內(nèi)的網(wǎng)絡(luò)為計算用的神經(jīng)網(wǎng),多卡之間的連接(即 GPU 互聯(lián))通常采用 PCIe 或各種高帶寬通信網(wǎng)絡(luò),多機(jī)之間的連接(即服務(wù)器互聯(lián))通常采用 RDMA 網(wǎng)絡(luò)。

總線是數(shù)據(jù)通信必備管道,PCIe 是最泛使用的總線協(xié)議。總線是服務(wù)器主板上不同硬件互相進(jìn)行數(shù)據(jù)通信的管道,對數(shù)據(jù)傳輸速度起到?jīng)Q定性作用,目前最普及的總線協(xié)議為英特爾 2001 年提出的 PCIe(PCI-Express)協(xié)議,PCIe 主要用于連接 CPU 與其他高速設(shè)備如 GPU、SSD、網(wǎng)卡、顯卡等,2003 年 PCIe1.0 版本發(fā)布,后續(xù)大致每過三年會更新一代,目前已經(jīng)更新到6.0版本,傳輸速率高達(dá)64GT/s,16通道的帶寬達(dá)到256GB/s,性能和可擴(kuò)展性不斷提高。

PCIe 總線樹形拓?fù)浜投说蕉藗鬏敺绞较拗屏诉B接數(shù)量和速度,PCIe Switch 誕生。PCIe采用端對端數(shù)據(jù)傳輸鏈路,PCIe 鏈路的兩端只能各接入一個設(shè)備,設(shè)備識別數(shù)量有限,無法滿足有大量設(shè)備連接或需要高速數(shù)據(jù)傳輸?shù)膱鼍埃虼?PCIe Switch 誕生。PCIe Switch 具備連接和交換雙重功能,可以讓一個 PCIe 端口識別和連接更多設(shè)備,解決通道數(shù)量不夠的問題,并可以將多條 PCIe 總線連接在一起,從而形成一個高速網(wǎng)絡(luò),實現(xiàn)多設(shè)備通信,簡言之 PCIe Switch 相當(dāng)于 PCIe 的拓展器。

f0b2d81e-9990-11ee-8b88-92fbcf53809c.png

GPU 互 聯(lián) 時 代 , PCIe 傳 輸 速 率 和 網(wǎng) 絡(luò) 延 遲 無 法 滿 足 需 求 ,NVLINK、CAPI、GenZ、CCIX、CXL 等“百家爭鳴”時代開啟。AIGC 的發(fā)展極大刺激算力需求的增加,GPU 多卡組合成為趨勢,GPU 互聯(lián)的帶寬通常需要在數(shù)百 GB/S以上,PCIe 的數(shù)據(jù)傳輸速率成為瓶頸,鏈路接口的串并轉(zhuǎn)換會網(wǎng)絡(luò)延時,影響 GPU 并行計算效率,還由于 GPU 發(fā)出的信號需要先傳遞到 PCIe Switch,PCIe Switch 涉及到數(shù)據(jù)的處理又會造成額外的網(wǎng)絡(luò)延時,此外 PCIe 總線與存儲器地址分離,每次訪問內(nèi)存會加重網(wǎng)絡(luò)延遲,因此 PCIe 協(xié)議在 GPU 多卡通信中效率并不高。為了將總線通信效率提升,降低延時,各家紛紛推出替代協(xié)議:

CAPI 協(xié)議:由 IBM 最早推出,后逐漸演化成 Open CAPI,本質(zhì)是現(xiàn)有高速 I/O 標(biāo)準(zhǔn)之上的應(yīng)用程序擴(kuò)展,添加了緩存一致性和更低延遲等內(nèi)容,但由于 IBM 服務(wù)器份額的持續(xù)下降,CAPI 協(xié)議缺少用戶基礎(chǔ),最終未能廣泛流傳。

GenZ 協(xié)議:GenZ 是不依賴于任何芯片平臺的開放性組織,眾多廠家參與其中包括AMD、ARM、IBM、Nvidia、Xilinx 等,GenZ 將總線協(xié)議拓展成交換式網(wǎng)絡(luò)并加入GenZSwitch 提高了拓展性。

CXL 協(xié)議(陸續(xù)兼并上述兩個協(xié)議):2019 年由 Intel 推出,與 CAPI 協(xié)議思路類似,2021 年底吸收 GenZ 協(xié)議共同發(fā)展,2022 年兼并 Open CAPI 協(xié)議,CXL 具備內(nèi)存接口,逐漸成長為設(shè)備互連標(biāo)準(zhǔn)的重要主導(dǎo)協(xié)議之一。

CCIX 協(xié)議:ARM 加入的另一個開放協(xié)議,功能類似 GenZ 但未被吸收兼并。

NVLINK 協(xié)議:英偉達(dá)提出的高速 GPU 互聯(lián)協(xié)議,對比傳統(tǒng) PCIe 總線協(xié)議,NVLINK主要在三個方面做出較大改變:1)支持網(wǎng)狀拓?fù)淠浚鉀Q通道有限問題;2)統(tǒng)一內(nèi)存,允許 GPU 共享公共內(nèi)存池,減少 GPU 之間復(fù)制數(shù)據(jù)的需要,從而提高效率;3)直接內(nèi)存訪問,不需要 CPU 參與,GPU 可直接讀取彼此的內(nèi)存,從而降低網(wǎng)絡(luò)延遲。此外,為解決 GPU 之間通訊不均衡問題,英偉達(dá)還引入 NVSwitch,一種類似交換機(jī) ASIC 的物理芯片,通過 NVLink 接口將多個 GPU 高速互聯(lián),創(chuàng)建高帶寬多節(jié)點 GPU 集群。2023 年 5 月 29 日,英偉達(dá)推出 AI 超級計算機(jī) DGX GH200,通過 NVLink 和 NVSwitch 連接 256 個 GH200 芯片,所有 GPU 連接成一個整體協(xié)同運(yùn)行,可訪問內(nèi)存突破 100TB。

f0c5f778-9990-11ee-8b88-92fbcf53809c.png

多機(jī)互聯(lián):IB 網(wǎng)絡(luò)與以太網(wǎng)絡(luò)并存

分布式訓(xùn)練下 RDMA 網(wǎng)絡(luò)成為最佳選擇,包含 IB 網(wǎng)絡(luò)和以太網(wǎng)絡(luò)。傳統(tǒng)的 TCP/IP 網(wǎng)絡(luò)通信是通過內(nèi)核發(fā)送消息,涉及較多數(shù)據(jù)移動和數(shù)據(jù)復(fù)制,不適用高性能計算、大數(shù)據(jù)分析等需要 IO 高并發(fā)、低時延的場景。RDMA 是一種計算機(jī)網(wǎng)絡(luò)技術(shù),可以直接遠(yuǎn)程訪問內(nèi)存數(shù)據(jù),無需操作系統(tǒng)內(nèi)核介入,不占用 CPU 資源,可以顯著提高數(shù)據(jù)傳輸?shù)男阅懿⑶医档脱舆t,因此更適配于大規(guī)模并行計算機(jī)集群的網(wǎng)絡(luò)需求。目前有三種 RDMA:Infiniband、RoCE、iWARP,后兩者是基于以太網(wǎng)的技術(shù):

f0e0d372-9990-11ee-8b88-92fbcf53809c.png

Infiniband:是專為 RDMA 設(shè)計的網(wǎng)絡(luò),從硬件級別保證可靠傳輸,具備更高的帶寬和更低的時延。但是成本高,需要配套 IB 網(wǎng)卡和 IB 交換機(jī)。

RoCE:基于以太網(wǎng)做 RDMA,可以使用普通的以太網(wǎng)交換機(jī),成本較低,但是需要支持 RoCE 的網(wǎng)卡。

iWARP:基于 TCP 的 RDMA 網(wǎng)絡(luò),利用 TCP 達(dá)到可靠傳輸。相比 RoCE,在大型組網(wǎng)的情況下,iWARP 的大量 TCP 連接會占用大量的內(nèi)存資源,對系統(tǒng)規(guī)格要求更高??梢允褂闷胀ǖ囊蕴W(wǎng)交換機(jī),但是需要支持 iWARP 的網(wǎng)卡。

f0ef8c96-9990-11ee-8b88-92fbcf53809c.png

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)傳輸
    +關(guān)注

    關(guān)注

    9

    文章

    1923

    瀏覽量

    64685
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4754

    瀏覽量

    129073
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31155

    瀏覽量

    269488

原文標(biāo)題:AI時代,你需要了解的GPU互聯(lián)技術(shù):NVLink、IB、ROCE

文章出處:【微信號:算力基建,微信公眾號:算力基建】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    GPU集群組網(wǎng)技術(shù)詳解

    ? 流行的GPU/TPU集群網(wǎng)絡(luò)組網(wǎng),包括:NVLink、InfiniBand、ROCE以太網(wǎng)Fabric、DDC網(wǎng)絡(luò)方案等,深入了解它們之間的連接方式以及如何在LLM訓(xùn)練中發(fā)揮作用
    的頭像 發(fā)表于 12-25 10:11 ?5268次閱讀
    <b class='flag-5'>GPU</b>集群組網(wǎng)<b class='flag-5'>技術(shù)</b>詳解

    AI訓(xùn)練,為什么需要GPU?

    隨著由ChatGPT引發(fā)的人工智能熱潮,GPU成為了AI大模型訓(xùn)練平臺的基石,甚至是決定性的算力底座。為什么GPU能力壓CPU,成為炙手可熱的主角呢?要回答這個問題,首先需要了解當(dāng)前人
    的頭像 發(fā)表于 04-24 08:05 ?1075次閱讀
    <b class='flag-5'>AI</b>訓(xùn)練,為什么<b class='flag-5'>需要</b><b class='flag-5'>GPU</b>?

    RoCEIB對比分析(一):協(xié)議棧層級篇

    AI 算力建設(shè)中, RDMA 技術(shù)是支持高吞吐、低延遲網(wǎng)絡(luò)通信的關(guān)鍵。目前,RDMA技術(shù)主要通過兩種方案實現(xiàn):Infiniband和RoCE(基于RDMA的以太網(wǎng)
    的頭像 發(fā)表于 11-15 13:58 ?1194次閱讀
    <b class='flag-5'>RoCE</b>與<b class='flag-5'>IB</b>對比分析(一):協(xié)議棧層級篇

    進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級芯片

    1.8TB的GPUGPU互連速度、InfiniBand網(wǎng)絡(luò)和NVIDIA Magnum IO?軟件的第五代NVLink技術(shù),GB200 NVL72性能顯著提升。 此外,GB200 N
    發(fā)表于 05-13 17:16

    吳霽虹:AI時代,是否會變成「數(shù)據(jù)奴隸」?

    什么是「數(shù)據(jù)奴隸」?AI時代創(chuàng)新者通過先進(jìn)算法、大數(shù)據(jù)等相關(guān)技術(shù),為城市管理、公安、醫(yī)療、客服等眾多領(lǐng)域注入了新鮮的活力,帶來了翻天覆地的變化。伴隨著AI
    發(fā)表于 06-27 20:42

    特斯拉V100 Nvlink是否支持v100卡的nvlink變種的GPU直通?

    /4029/SYS-4029GP-TVRT.cfm)我們正試圖做pci將GPU直接傳輸?shù)絍M中但是當(dāng)我們通過pci設(shè)備并安裝驅(qū)動程序時,我們會從nvidia-nvlink模塊中獲得錯誤。是否支持v100卡的nvlink
    發(fā)表于 09-12 16:25

    SAW和BAW濾波器需要了解這些

    SAW和BAW濾波器需要了解這些
    發(fā)表于 05-24 06:41

    為什么要了解電機(jī)的工作原理

    ,家里的電器基本都會癱瘓,所以即使不是電子行業(yè)從業(yè)人員,也有必要了解電機(jī),知道電機(jī)為什么能夠運(yùn)轉(zhuǎn)。本文力求用簡潔易懂的圖片和動畫演示,來說明電機(jī)的工作原理,相信看完本篇文章,電機(jī)就不再是那個,
    發(fā)表于 08-27 06:49

    英偉達(dá)GPU卡多卡互聯(lián)NVLink,系統(tǒng)累積的公差,是怎么解決的?是連接器吸收的?

    英偉達(dá)不斷推出GPU卡,并且實現(xiàn)多卡互聯(lián)NVLink,實際整個系統(tǒng)會累積到一個較大的公差,而目前市面上已有的連接器只能吸收較少的公差,這個是怎么做到匹配的呢?
    發(fā)表于 03-05 16:17

    需要了解的嵌入式Linux

    需要了解的嵌入式Linux 今天,Linux 正廣泛應(yīng)用于各種嵌入式設(shè)備的開發(fā)中,如數(shù)字電視、機(jī)頂盒、DVR播放器、xDSL/有線/PON調(diào)制解調(diào)器、家用路由器和網(wǎng)關(guān)。它尤其適
    發(fā)表于 01-18 16:19 ?711次閱讀
    <b class='flag-5'>你</b><b class='flag-5'>需要了解</b>的嵌入式Linux

    替換滾珠螺桿需要了解哪些參數(shù)?

    替換滾珠螺桿需要了解哪些參數(shù)?
    的頭像 發(fā)表于 09-08 17:47 ?904次閱讀
    替換滾珠螺桿<b class='flag-5'>需要了解</b>哪些參數(shù)?

    我們?yōu)槭裁?b class='flag-5'>需要了解一些先進(jìn)封裝?

    我們?yōu)槭裁?b class='flag-5'>需要了解一些先進(jìn)封裝?
    的頭像 發(fā)表于 11-23 16:32 ?594次閱讀
    我們?yōu)槭裁?b class='flag-5'>需要了解</b>一些先進(jìn)封裝?

    NVLink的演進(jìn):從內(nèi)部互聯(lián)到超級網(wǎng)絡(luò)

    NVLink是NVIDIA開發(fā)的一種高速、低延遲的互聯(lián)技術(shù),旨在連接多個GPU以實現(xiàn)高性能并行計算。與傳統(tǒng)的PCIe總線相比,NVLink
    的頭像 發(fā)表于 04-13 11:22 ?1162次閱讀
    <b class='flag-5'>NVLink</b>的演進(jìn):從內(nèi)部<b class='flag-5'>互聯(lián)</b>到超級網(wǎng)絡(luò)

    全面解讀英偉達(dá)NVLink技術(shù)

    NVLink是一種解決服務(wù)器內(nèi)GPU之間通信限制的協(xié)議。與傳統(tǒng)的PCIe交換機(jī)不同,NVLink帶寬有限,可以在服務(wù)器內(nèi)的GPU之間實現(xiàn)高速直接互連。第四代
    發(fā)表于 04-22 11:01 ?1378次閱讀
    全面解讀英偉達(dá)<b class='flag-5'>NVLink</b><b class='flag-5'>技術(shù)</b>

    RoCEIB對比分析(二):功能應(yīng)用篇

    在上一篇中,我們對RoCE、IB的協(xié)議棧層級進(jìn)行了詳細(xì)的對比分析,二者本質(zhì)沒有不同,但基于實際應(yīng)用的考量,RoCE在開放性、成本方面更勝一籌。本文我們將繼續(xù)分析RoCE
    的頭像 發(fā)表于 11-15 14:03 ?328次閱讀
    <b class='flag-5'>RoCE</b>與<b class='flag-5'>IB</b>對比分析(二):功能應(yīng)用篇
    主站蜘蛛池模板: 午夜不卡av免费| 妓女嫖客叫床粗话对白| 中文国产在线观看| 在线亚洲中文字幕36页| 在线视频久久只有精品第一日韩| 亚洲精品无码国产爽快A片百度| 晓雪老师我要进你里面好爽| 亚洲精品国产自在现线最新| 一二三四在线视频社区8| 中文字幕A片视频一区二区| 91精品免费久久久久久久久| 97国产视频| 国产精品VIDEOSSEX久久发布| 国产探花在线精品一区二区| 久久观看视频| 日韩精品一区二区三区AV在线观看| 午夜福利体检| 9420高清完整版在线电影免费观看| 超碰免费碰免费视频| 好好的曰com久久| 色久悠悠无码偷拍自怕| 亚洲精品AV中文字幕在线| ae58老司机福利| 久久水蜜桃亚洲AV无码精品偷窥| 日韩欧美一区二区中文字幕| 最新国产三级在线不卡视频| 国产骚妇BB网| 色橹橹欧美在线观看视频高清 | 这里只有精品网| 国产精品99久久久久久动态图| 免费一级毛片在线观看| 在线观看国产精美视频| 好男人在线高清WWW免费观看| 欧美人与禽zoz0性伦交app| 尤蜜网站在线进入免费| 激情床戏揉胸吃胸视频| 亚洲精品久久久无码| 国产毛A片啊久久久久久A| 天天看学生视频| 国产色精品久久人妻无码 | 和姐姐做插得很深|