色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

高性能、低延遲的InfiniBand式網絡并不是唯一的選擇

芯片半導體 ? 來源:半導體行業觀察 ? 2023-08-27 09:44 ? 次閱讀

正如我們喜歡指出的那樣,當談到高性能、低延遲的 InfiniBand 式網絡時,Nvidia 并不是唯一的選擇,自 20 世紀 90 年代末 InfiniBand 互連出現以來就一直不是唯一的選擇。三年前從英特爾收購了 Omni-Path 互連業務的Cornelis Networks 就是另一種選擇。雖然它跳過了 200 Gb/秒一代,但仍在銷售改進的 100 Gb/秒 Omni-Path Express 變體,并為未來的 400 Gb/秒一代奠定了基礎。

Cornelis Networks 的高管們從 SilverStorm 和 PathScale 的 InfiniBand 開始,最終成為 QLogic 的 TruScale InfiniBand 的基礎,而 QLogic 又成為來自 Mellanox Technologies 的 InfiniBand 的替代供應商。早在 2012 年 1 月,英特爾就以 1.25 億美元的價格從 QLogic 手中收購了 TruScale InfiniBand 業務——這似乎是很久以前的事了?三個月后又斥資 1.4 億美元從Cray 收購了“Gemini”XT 和“Aries”XC 互連業務,將它們整合起來創建 Omni-Path 互連。

從技術上講,這是 InfiniBand 主題的三種不同變體,而 Cornelis Networks 正在做的事情在許多方面代表了第四種變體。

InfiniBand 的最初目標是取代 PCI-Express、光纖通道,或許還有以太網,并創建融合結構。TruScale 變體采用了一種稱為 Performance Scale Messaging (PSM) 的技術,QLogic 當然認為該技術比 InfiniBand verbs approach更好,并且其創建者認為可以提供更好的擴展性。但 PSM 已有二十多年歷史,Cornelis Networks 正在基于 libfabric 驅動程序構建新的軟件堆棧,該驅動程序是 Linux 操作系統的一部分,并取代了 QLogic TruScale 和 Intel Omni-Path 中的 PSM 提供程序與Open Fabrics Interfaces 工作組的 OPX 提供商進行堆棧。

這個新堆棧經過開發,可以在 Cornelis Networks 從 Intel 購買的 100 Gb/秒 Omni-Path 硬件上運行(該公司稱之為 Omni-Path Express,縮寫為 OPX),并且將是未來 400 Gb 上唯一可用的堆棧/sec Omni-Path Express CN5000 系列目前正在開發中。

2ede39b2-4423-11ee-a2ef-92fbcf53809c.jpg

libfabric 庫是 OFI 標準的第一個實現,它是一個位于網絡接口卡和 OFI 提供程序驅動程序之上的層,位于 MPI、SHMEM、PGAS 和通常在 HPC 分布式計算系統上運行的其他內存共享協議之間和人工智能。它看起來像這樣:

以下是 Omni-Path Express 主機軟件堆棧現在的樣子,其中第二代 PSM2 提供程序和本機 OFI 提供程序并行運行:

2ef6c8ec-4423-11ee-a2ef-92fbcf53809c.jpg

您會注意到,原始 OpenFabrics Alliance Verbs 仍然可以在 Linux 內核模式下使用,以支持舊版協議和框架的 InfiniBand verbs 提供程序,但 PSM2 和 OFI 提供程序都在 Linux 用戶空間中運行,其MPI的各種實現也是如此——它們有很多。

在下一代 CN5000 平臺中,紫色的 PSM2 內容將消失,我們推測 Verbs 提供程序以及運行在 Linux 內核中的 OFA Verbs 代碼之上的內容也會消失。Cornelis Networks 軟件工程副總裁 Doug Fuller 本周在Hot Interconnects 30 會議上發表演講,他表示,OPX 和 Nvidia InfiniBand 之間的主要區別之一是 Cornelis Networks 使用的所有堆棧都將是開放的源并添加到內核的上游。

“我們的 Omni-Path OFI 驅動程序是 Linux 內核的一部分,”Fuller 在演講中解釋道。“我的意思是,我們在內核開發方面也首先處于上游。因此,我們所有的補丁都在上游合并,并且我們有來自 Linus 的火焰來證明這一點。然后我們合并。我們鼓勵它向下游合并并集成到各種 Linux 發行版中。因此,在大多數情況下,如果您啟動現代 Linux 發行版,您的驅動程序已經存在,無需安裝其他軟件。我們致力于上游優先開發,我們希望確保回饋我們使用的社區,并為用戶提供良好的用戶體驗。”

三年來我們一直希望看到的,以及 Fuller 向 Hot Interconnects 觀眾提供的,是備受期待的 Cornelis Network 硬件路線圖。話不多說,這里是:

2f1c2100-4423-11ee-a2ef-92fbcf53809c.jpg

HPC 中心、云構建商和超大規模企業都喜歡可預測的路線圖,這些路線圖使每一代的比特轉移成本越來越低,并且還增加了網絡規模,即可以通過合理的響應連接到網絡的端點數量時間。這些是 Cornelis Networks 最終公開投入的賭注,眾所周知,公司不會購買點產品,而是購買路線圖,因為我們都生活在未來。

通過 Omni-Path 100 系列,Cornelis Networks 正在轉售由英特爾創建的硬件,該硬件于 2015 年底開始在基于其“Knights”系列多核處理器的早期采用者 HPC 系統中推出。(我們認為 Cornelis 忘記將品牌的“Express”部分放入路線圖中。) 該產品系列包括 100 Gb/秒適配器、48 端口邊緣交換機、288 端口導向器交換機和 1,152 端口導向器交換機。Omni-Path 100 互連支持 3 米及更短的直連電纜 (DAC) 和 100 米或更短的有源光纜 (AOC)。交換機的基數在fat tree上以全二分帶寬支持多達 13,800 個節點,或以半二分帶寬支持 27,600 個節點,在網絡逐漸變細的情況下最多支持 36,800 個節點。

考慮到其聯合創始人多年來推出的產品的悠久歷史,憑借 Omni-Path CN5000 CN5000 系列(Cornelis Networks 稱之為第五代高性能互連),交換機和適配器中的 ASIC 正在發生變化高達 400 Gb/秒,這將是性能的巨大飛躍。將會有一個 48 端口邊緣交換機(看起來像一個普通的披薩盒機器,而不是英特爾在 Omni-Path 100 上做的那種時髦的形狀),并且將在導向器交換機上進行差異化,并與單個 576 端口機器一起使用。至于電纜,將支持 DAC 和 AOC,以及將銅電纜拉伸到 5 米或更短長度的有源銅電纜 (ACC),這比 DAC 長 2 米,從而提供更具創意的接線配置。

CN5000 系列將支持全二分帶寬樹和部分二分帶寬樹,例如 Omni-Path 100,還將支持 Dragonfly 和 Megafly(有時稱為 Dragonfly+)拓撲,并且單個集群中最多可擴展至 330,000 個節點。(我們不知道這樣的網絡中有多少層和跳數,但我們的目標是找出答案。)Cornelius Networks 正在添加基于遙測的動態自適應路由和擁塞控制,這聽起來可能基于一些想法是從 Cornelis Networks 通過英特爾獲得的 Cray“Aries”技術中挑選出來的。(同樣,我們會找到結果。)延遲(我們假設是從節點到節點)承諾低至 1 微秒以下,消息速率預計為每秒 12 億條。CN5000 導向器交換機將提供風冷和液冷選項。

以下是 CN5000 邊緣交換機的一些規格機械結構:

2f397138-4423-11ee-a2ef-92fbcf53809c.jpg

這些是 CN5000 導向器交換機的規格:

2f567242-4423-11ee-a2ef-92fbcf53809c.jpg

最后,主機結構適配器如下所示:

2f8ef8ba-4423-11ee-a2ef-92fbcf53809c.jpg

到 2026 年,Cornelis 路線圖將超越 Omni-Path CN6000,后者具有支持 800 Gb/秒的交換機和適配器 ASIC。交換機電纜選項的適配器在二等分帶寬、拓撲選項以及 330,000 個節點的規模方面保持不變。這里有趣的變化是使用 RISC-V 內核的 DPU,插入 CXL 端口,并且可能會執行一些集體操作卸載以及安全和存儲加速功能。某些結構功能將被卸載,并且可能在交換機和適配器中都有特定于結構的加速器。

隨著第七代產品將于 2028 年推出,Cornelis Networks 將把端口速度提高到 1.6 Tb/秒,并將 HyperX 拓撲添加到網絡幾何結構列表中,并對 DPU 核心以及結構和應用程序卸載進行增強。

我們已經有一段時間沒有看到 Nvidia 或 Mellanox 的 InfiniBand 路線圖了,而且肯定不會走那么遠。但節奏和減速帶可能會在某個時刻或多或少同步。






審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 以太網
    +關注

    關注

    40

    文章

    5419

    瀏覽量

    171598
  • 人工智能
    +關注

    關注

    1791

    文章

    47183

    瀏覽量

    238253
  • InfiniBand
    +關注

    關注

    1

    文章

    29

    瀏覽量

    9192
  • PSM
    PSM
    +關注

    關注

    1

    文章

    41

    瀏覽量

    13406
  • LINUX內核
    +關注

    關注

    1

    文章

    316

    瀏覽量

    21644

原文標題:InfiniBand的挑戰者,來勢洶洶

文章出處:【微信號:TenOne_TSMC,微信公眾號:芯片半導體】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    用ADS1299-FE評估版測試時,在測試的時候VREFP是-2.45,并不是設計所說的4.5v,為什么?

    在用ADS1299-FE評估版測試時 采用內部參考,雙電源供電模式 ,-2.5-2.5,但是在測試的時候 VREFP是-2.45,并不是設計所說的4.5v? 在提供的LABview測試時總得不到想看到的結果,想請問下是什么問題呢? 是10uF電容擊穿了?
    發表于 12-16 06:43

    不是,電容ESR寄生電阻并不是越好!

    、電源硬件文章精選華為海思軟硬件開發資料 原文標題:不是,電容ESR寄生電阻并不是越好
    的頭像 發表于 11-20 15:27 ?250次閱讀

    高性能連接器的選擇與應用

    連接器的選擇標準 電氣性能 :包括接觸電阻、絕緣電阻和抗電強度。高性能連接器應具有接觸電阻以減少信號損耗,高絕緣電阻以防止漏電,以及足夠的抗電強度以保證安全。 機械
    的頭像 發表于 11-07 09:30 ?271次閱讀

    InfiniBand網絡內計算的關鍵技術和應用

    InfiniBand高性能計算(HPC)和人工智能(AI)應用中發揮著關鍵作用,體現在它提供了高速、延遲網絡通信能力,以支持大規模數據
    的頭像 發表于 10-23 11:33 ?329次閱讀

    端到端InfiniBand網絡解決LLM訓練瓶頸

    的,這需要大量的計算資源和高速數據傳輸網絡。端到端InfiniBand(IB)網絡作為高性能計算和AI模型訓練的理想選擇,發揮著重要作用。在
    的頭像 發表于 10-23 11:26 ?380次閱讀
    端到端<b class='flag-5'>InfiniBand</b><b class='flag-5'>網絡</b>解決LLM訓練瓶頸

    InfiniBand與以太網的對比分析

    InfiniBand作為種先進的內網計算平臺,已成為驅動高性能計算(HPC)、人工智能(AI)以及超大規模云基礎設施演進的核心力量,其展現出無可比擬的性能優勢。專為滿足服務器級連接需
    的頭像 發表于 10-23 11:23 ?483次閱讀
    <b class='flag-5'>InfiniBand</b>與以太網的對比分析

    交互延遲音頻解碼器

    普通音頻解碼器在處理音頻時可能會引入較高的延遲,通常適合于音樂播放或錄音等場景。而交互延遲音頻解碼器則專為實時應用設計,延遲通常在10毫
    的頭像 發表于 09-28 11:15 ?237次閱讀
    交互<b class='flag-5'>式</b><b class='flag-5'>低</b><b class='flag-5'>延遲</b>音頻解碼器

    設計高性能EMI汽車電源

    電子發燒友網站提供《設計高性能EMI汽車電源.pdf》資料免費下載
    發表于 08-26 11:15 ?0次下載
    設計<b class='flag-5'>高性能</b>、<b class='flag-5'>低</b>EMI汽車電源

    INA333輸出為紋波電壓,并不是平滑的電壓,為什么?

    我最近在歐時購買了TI的INA333芯片,輸入的差分電壓為32MV,共模電壓為2.5V,VREF為2.5V,供電電壓為5V,增益設置為60,輸出為紋波電壓,并不是平滑的電壓,不知道是為什么。
    發表于 08-13 07:57

    深入探索InfiniBand網絡、HDR與IB技術

    InfiniBand和以太網之間的延遲對比可以分為兩個主要組成部分。首先,在交換機層面上,以太網交換機在網絡傳輸模型中作為第2層設備運行,通常采用MAC表查找尋址和存儲轉發機制(某些產品可能采用
    發表于 04-19 11:01 ?1600次閱讀
    深入探索<b class='flag-5'>InfiniBand</b><b class='flag-5'>網絡</b>、HDR與IB技術

    文詳解超算中的InfiniBand網絡、HDR與IB

    InfiniBand技術被認為是面向未來的高性能計算(HPC)標準,在超級計算機、存儲甚至LAN網絡的HPC連接方面享有很高的聲譽。
    的頭像 發表于 04-16 10:18 ?6503次閱讀
    <b class='flag-5'>一</b>文詳解超算中的<b class='flag-5'>InfiniBand</b><b class='flag-5'>網絡</b>、HDR與IB

    STM32L496 DMA收集到數據半產生中斷,但是仿真時發現并不是數據的半,為什么?

    在使用定時器觸發ADC+DMA,做數據采集發現,DMA收集到數據半產生中斷,但是仿真時發現并不是數據的半。
    發表于 04-12 06:46

    介紹高性能計算和數據中心網絡架構:InfiniBand(IB)

    InfiniBand(IB)是高性能計算和數據中心網絡架構,其設計目標是通過提供延遲、高帶
    的頭像 發表于 03-13 17:14 ?1537次閱讀

    將TC397的QSPI模塊的CPOL設置為1,為什么示波器顯示時鐘引腳輸出信號的空閑狀態并不是高電平?

    將TC397的QSPI模塊的CPOL設置為1,但是示波器顯示時鐘引腳輸出信號的空閑狀態并不是高電平,請問是為什么?在debug狀態發現其CPOL寄存器確實是?1 ? ?
    發表于 02-01 08:34

    如何通過DLP FPGA實現延時高性能的深度學習處理器設計呢?

    圖像識別和分析對于產品創新至關重要,但需要高工作負載,對服務質量要求嚴格。解決方案如GPU無法滿足延遲高性能要求。DLP FPGA是種可行的
    的頭像 發表于 12-27 09:13 ?1331次閱讀
    如何通過DLP FPGA實現<b class='flag-5'>低</b>延時<b class='flag-5'>高性能</b>的深度學習處理器設計呢?
    主站蜘蛛池模板: 欧美午夜精品A片一区二区HD| 凌馨baby| 亚洲熟女乱色一区二区三区| 精品欧美一区二区三区久久久| 91popny蜜桃臀| 日韩专区亚洲国产精品| 国产强奷糟蹋漂亮邻居在线观看| 亚洲区视频| 日本撒尿特写| 久久 这里只精品 免费| 成人精品视频99在线观看免费| 亚洲高清中文字幕| 欧美人xxxxx| 九九在线中文字幕无码| 极品少妇高潮XXXXX| 第一次玩老妇真实经历| 亚洲欧美高清在线精品一区| 亚洲mv在线观看| 亚洲精品嫩草研究院久久| 色多多污污下载| 蜜芽tv在线观看免费网站| 国产精品无码亚洲精品| AV午夜午夜快憣免费观看| 亚洲免费视频在线观看| 亚洲日韩中文字幕区| 永久adc视频年龄确认| 丝袜美女被啪啪不带套漫画| 美女脱了内裤张开腿让男人桶到爽| 考好老师让你做一次H| 国产亚洲精品线观看不卡| 被肉日常np高h| 中文字幕欧美一区| 亚洲免费综合色视频| 夜夜穞狠狠穞| 亚洲破处女| 最新2017年韩国伦理片在线| 一个人看的www视频动漫版| 校园纯肉H教室第一次| 日本一本免费线观看视频| 无码AV熟妇素人内射V在线| 日本午夜视频在线|