色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

應用NVIDIA Spectrum-X網絡構建新型主權AI云

NVIDIA英偉達 ? 來源: NVIDIA英偉達 ? 2024-07-26 18:58 ? 次閱讀

法國云服務提供商 Scaleway 正在基于 NVIDIA 的 Hopper GPUSpectrum-X 以太網網絡平臺構建區(qū)域性 GPU 集群,為用戶提供 AI 按需服務業(yè)務。

Scaleway 是法國的一家擁有高性能基礎設施的云服務提供商,創(chuàng)立于 1999 年,擁有 80+ 云產品及服務,為全球 25,000+ 客戶提供云服務,客戶包括 Mistral AI、Aternos、Hugging Face、Golem.ai 等。Scaleway 提供一站式的云服務,以開發(fā)創(chuàng)新解決方案并幫助用戶從零開始構建和擴展 AI 項目,目前 Scaleway 正在構建區(qū)域 AI 云,提供 GPU 基礎設施,用于大規(guī)模的 AI 模型訓練、推理及部署。

客戶挑戰(zhàn)

云 AI 工作負載需求正以前所未有的速度增長,同時生成式 AI 應用也在激增。為滿足客戶部署生成式 AI 應用程序、訓練基礎 AI 大模型的需求,云服務提供商面臨巨大挑戰(zhàn),需要構建 AI 云,使用加速計算技術和高性能網絡來支持 AI 業(yè)務。

Scaleway 的核心需求包括:

對于分布式 AI 訓練任務,單個任務的訓練時間由最慢的計算節(jié)點的運行時間決定,這使得尾部延遲至關重要。AI 云需要一個高吞吐、低延遲、低抖動、易擴展的高性能網絡,來確保 GPU 間快速、高效的通信,尤其是在大規(guī)模部署的場景下。

在多個 AI 任務同時運行的多租戶環(huán)境中,性能隔離對于保護一個租戶的 AI 任務免受其他租戶業(yè)務的影響是必不可少的。由此提出了對多租戶多任務場景下性能隔離的需求。

對于復雜的 AI 云環(huán)境,需要專門適用于 AI 網絡的監(jiān)控管理工具,提供細粒度的網絡可視化功能、同時具備網絡監(jiān)控和故障定位能力。

為實現(xiàn) AI 云數據中心的高效、快速部署,需要強大的網絡仿真及自動化平臺。

隨著云上用戶、數據、應用的快速增長,網絡安全威脅不容忽視,需要提供私有的、安全的零信任基礎設施,保障用戶的業(yè)務安全。

解決方案

Scaleway 采用了 NVIDIA 的 Hopper GPU 和 Spectrum-X 網絡平臺應對以上挑戰(zhàn)。

Scaleway 將 HGX Hopper GPU 服務器加入其 GPU 集群陣容中,以覆蓋廣泛的計算需求,利用 GPU 的速度和效率加速 AI 分布式工作負載。

對于 Scale-Out AI 網絡,Scaleway 采用了基于 BlueField-3 SuperNICSpectrum SN5600 交換機構建的 Spectrum-X 網絡平臺。NVIDIA 的 Spectrum-X 網絡平臺是全球首個專為 AI 構建的以太網端到端解決方案,與傳統(tǒng)以太網相比,其生成式 AI 訓練的網絡通信效率提高了 1.6 倍。

同時 Spectrum-X 部署將利用以下網絡軟件堆棧:

NVIDIA Air 用于 AI 網絡仿真,NVIDIA Air 是一個云托管的數據中心網絡仿真平臺,其行為類似于真實世界的生產環(huán)境。使用 NVIDIA Air 創(chuàng)建數據中心的數字孿生,可以驗證網絡配置、網絡功能以及自動化部署代碼,提升數據中心的部署效率。

NetQ 用于 AI 網絡監(jiān)控,通過高頻遙測技術監(jiān)控 AI 工作負載,NetQ 提供有關數據中心運行狀況的數據和統(tǒng)計信息,關聯(lián)配置和運行狀態(tài),并跟蹤狀態(tài)變化。基于遙測信息,NetQ 提供動態(tài)路由監(jiān)控,RoCE 流量計數器,交換機隊列直方圖等功能,以識別和應對網絡微突發(fā)、擁塞場景,方便網絡故障定位。

Cumulus Linux 用于軟件驅動的數據中心網絡自動化,Cumulus Linux 是創(chuàng)新的開放網絡操作系統(tǒng),支持 BGP/OSPF 路由協(xié)議,以太網虛擬專用網絡 EVPN,虛擬路由和轉發(fā)。

DOCA SDK 和庫用于增強 BlueField-3 SuperNIC 性能,DOCA SDK 提供行業(yè)標準的開放 API 和軟件框架,包括針對 RDMA、網絡、安全、存儲、數據路徑加速的 SDK,幫助開發(fā)者快速創(chuàng)建軟件定義、SuperNIC 加速的服務。

使用的 NVIDIA 產品

硬件:

NVIDIA HGX Hopper 服務器

NVIDIA Spectrum-4 SN5600 以太網交換機

NVIDIA BlueField-3 B3140H SuperNICs

軟件:

Cumulus Linux 網絡操作系統(tǒng)

NetQ 監(jiān)控管理平臺

NVIDIA Air 仿真平臺

DOCA SDK

實際效果

采用 NVIDIA 的整體解決方案后,極大地提升了 AI 計算能力,縮短了 AI 訓練時間,同時加速了 AI 解決方案的開發(fā)、部署和上市時間,有效提高了投資回報率。

Scaleway 客戶可以從幾個 GPU 擴展到幾千個 GPU,以適應任何 AI 用例

Spectrum-X 提供多租戶、多任務的 AI 環(huán)境所需的高性能和安全性, 借助動態(tài)路由、擁塞控制、全局共享緩沖區(qū)等多種機制,實現(xiàn)了多任務的性能隔離。

NetQ 提供對 AI 網絡健康狀況的深度可視性,具有 RoCE 流量計數器、事件和 WJH(What Just Happened)警報等豐富的儀表板,實現(xiàn) AI 網絡可視化、故障排除和驗證功能。

NVIDIA Air 和 Cumulus Linux 支持 API 原生網絡環(huán)境,該環(huán)境可集成到 DevOps 工具鏈中,實現(xiàn)了第 0 天、第 1 天 和第 2 天操作的無縫銜接。

NVIDIA 網絡高級副總裁 Gilad Shainer 表示:

“生成式 AI 等開創(chuàng)性技術的飛速發(fā)展,使每家企業(yè)都必須把網絡創(chuàng)新放在第一位,從而獲得競爭優(yōu)勢。NVIDIA Spectrum-X 是對以太網絡的一次革命,讓企業(yè)能夠充分利用其 AI 基礎設施的強大力量來改變其運營方式,甚至顛覆他們的行業(yè)。”

Scaleway 首席執(zhí)行官 Damien Lucas 表示:

“NVIDIA Spectrum-X 網絡技術為我們的‘GPU 集群按需服務’提供了更快的網絡連接和更高效的 GPU 通信,使我們的客戶能夠加速開發(fā)和部署他們的 AI 解決方案。”

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    4978

    瀏覽量

    102988
  • AI
    AI
    +關注

    關注

    87

    文章

    30728

    瀏覽量

    268887
  • 英偉達
    +關注

    關注

    22

    文章

    3770

    瀏覽量

    90989

原文標題:應用 NVIDIA Spectrum-X 網絡構建新型主權 AI 云

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    NVIDIA與軟銀集團合作加速日本主權AI計劃

    NVIDIA 宣布與軟銀集團開展一系列合作,旨在加速日本主權 AI 計劃,并進一步提升日本在全球的技術領先優(yōu)勢,同時為全球電信運營商開辟數十億美元的 AI 收入來源。
    的頭像 發(fā)表于 11-19 15:49 ?306次閱讀

    NVIDIA向開放計算項目捐贈Blackwell平臺設計

    近日,在美國加利福尼亞州舉行的 OCP 全球峰會上,NVIDIA 宣布已把 NVIDIA Blackwell 加速計算平臺的一些基礎元素捐贈給開放計算項目(OCP),并擴大 NVIDIA Sp
    的頭像 發(fā)表于 11-19 15:30 ?187次閱讀

    如何構建及優(yōu)化GPU網絡

    并從計算節(jié)點成本優(yōu)化、集群網絡與拓撲的選擇等方面論述如何構建及優(yōu)化GPU網絡
    的頭像 發(fā)表于 11-06 16:03 ?347次閱讀
    如何<b class='flag-5'>構建</b>及優(yōu)化GPU<b class='flag-5'>云</b><b class='flag-5'>網絡</b>

    NVIDIA SuperNIC推進現(xiàn)代AI基礎設施發(fā)展

    在生成式 AI 時代,加速網絡對于為大規(guī)模分布式 AI 工作負載構建高性能計算平臺至關重要。NVIDIA 在加速
    的頭像 發(fā)表于 11-06 13:59 ?231次閱讀

    NVIDIA助力xAI打造全球最大AI超級計算機

    NVIDIA 宣布,xAI 位于田納西州孟菲斯市的Colossus 超級計算機集群達到了 10 萬顆 NVIDIA Hopper GPU 的巨大規(guī)模。該集群使用了NVIDIA Spectru
    的頭像 發(fā)表于 10-30 11:38 ?357次閱讀

    NVIDIA Colossus超級計算機集群突破10萬顆Hopper GPU

    的強大實力。 Colossus集群不僅規(guī)模龐大,更采用了NVIDIA Spectrum-X以太網網絡平臺。該平臺專為多租戶、超大規(guī)模的AI工廠打造,提供了卓越的RDMA(遠程直接內存訪
    的頭像 發(fā)表于 10-30 10:29 ?296次閱讀

    NVIDIA 以太網加速 xAI 構建的全球最大 AI 超級計算機

    市的 Colossus 超級計算機集群達到了 10 萬顆 NVIDIA? Hopper? GPU 的巨大規(guī)模。該集群使用了 NVIDIA Spectrum-X? 以太網網絡平臺,該平臺
    發(fā)表于 10-30 09:33 ?142次閱讀
    <b class='flag-5'>NVIDIA</b> 以太網加速 xAI <b class='flag-5'>構建</b>的全球最大 <b class='flag-5'>AI</b> 超級計算機

    NVIDIA新增生成式AI就緒系統(tǒng)認證類別

    借助全新的 NVIDIA Spectrum-X Ready 和 NVIDIA IGX 認證,領先的制造業(yè)合作伙伴將提供高性能系統(tǒng),幫助客戶輕松部署 AI
    的頭像 發(fā)表于 10-10 09:44 ?360次閱讀

    簡單認識NVIDIA網絡平臺

    NVIDIA Spectrum-X800 平臺是業(yè)界第一代 800Gb/s 的以太網網絡平臺,包括了 NVIDIA Spectrum SN5
    的頭像 發(fā)表于 09-09 09:22 ?426次閱讀

    NVIDIA Spectrum-X 以太網網絡平臺已被業(yè)界廣泛使用

    服務提供商、GPU 提供商和企業(yè)用戶紛紛采用 Spectrum-XNVIDIA 網絡通過廣大系統(tǒng)制造商進入各個市場。 ?
    的頭像 發(fā)表于 06-03 18:20 ?964次閱讀

    NVIDIA AI Enterprise榮獲金獎

    NVIDIA AI Enterprise、GH200 Grace Hopper 超級芯片和 Spectrum-X 在 COMPUTEX 2024 獲得認可。
    的頭像 發(fā)表于 05-29 09:27 ?444次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> Enterprise榮獲金獎

    借助NVIDIA DOCA 2.7增強AI 數據中心和NVIDIA Spectrum-X

    NVIDIA DOCA 加速框架為開發(fā)者提供了豐富的庫、驅動和 API,以便為 NVIDIA BlueField DPU 和 SuperNIC 創(chuàng)建高性能的應用程序和服務。
    的頭像 發(fā)表于 05-29 09:22 ?486次閱讀

    NVIDIA Spectrum-X助力IBM為AI Cloud提供高性能底座

    在混合AI 的時代,企業(yè)和組織需要創(chuàng)建、分析和保存海量的數據,在分布式的應用環(huán)境中會形成各種各樣的數據孤島,導致復雜系統(tǒng)難以管理,成本不斷增加。
    的頭像 發(fā)表于 05-08 09:27 ?429次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>Spectrum-X</b>助力IBM為<b class='flag-5'>AI</b> Cloud提供高性能底座

    NVIDIA發(fā)布專為大規(guī)模AI量身訂制的全新網絡交換機-X800系列

    NVIDIA Quantum-X800 InfiniBand 網絡NVIDIA Spectrum?-
    的頭像 發(fā)表于 03-20 09:54 ?488次閱讀

    NVIDIA 發(fā)布全新交換機,全面優(yōu)化萬億參數級 GPU 計算和 AI 基礎設施

    NVIDIA Quantum-X800 InfiniBand 網絡,打造性能最強大的 AI 專用基礎設施 NVIDIA
    發(fā)表于 03-19 10:05 ?332次閱讀
    <b class='flag-5'>NVIDIA</b> 發(fā)布全新交換機,全面優(yōu)化萬億參數級 GPU 計算和 <b class='flag-5'>AI</b> 基礎設施
    主站蜘蛛池模板: 色裕插插插影视| 亚洲.欧美.中文字幕在线观看| 色偷偷亚洲男人天堂| 亚洲精品无码久久久久A片空| 97在线观看免费| 国产精品久久久久久影院| 久久久久久久久久久福利观看| 人妻换人妻AA视频| 亚洲中文字幕无码一去台湾| couo福利姬图库| 娇小XXXXX第一次出血| 欧美丝袜女同| 亚洲精品123区| 成人特级毛片| 久久亚洲A片COM人成A| 手机精品在线| 99国产这里只有精品视频| 国产小伙和50岁熟女23p| 欧美黄色xxx| 一品探花论坛| 国产精品一区二区AV交换| 尿孔 调教 扩张| 亚洲熟女丰满多毛XXXXX| 俄罗斯少女人体| 免费观看成人毛片| 亚洲精品无码葡京AV天堂| 俄罗斯美女破处| 妙玉被肉干高H潮文| 亚洲人成电影网站| 国产 日韩 欧美 高清 亚洲| 嗯呐啊唔高H兽交| 伊人久久中文大香线蕉综合| 国产精品久久久久久久伊一| 欧美zzo交| 最近中文字幕在线看免费完整版 | 亚洲精品国偷拍电影自产在线| 被六个男人躁到一夜同性| 久久久久久久伊人电影| 亚洲国产中文在线视频| 成人在线免费| 欧美麻豆一精品一AV一免费|