BlueField SuperNIC 是面向 AI 云數據中心的一種網絡加速器,可在 GPU 服務器之間提供可靠、無縫的連接。
生成式 AI 是快速變化的數字領域的新轉折。在此領域的一個突破性創新技術是一個新術語:BlueField SuperNIC。
什么是 BlueField SuperNIC?
BlueField SuperNIC 是一類新型網絡加速器,旨在為基于以太網的 AI 云上運行的超大規模 AI 工作負載提供強效助力。它為 GPU 到 GPU 通信提供快速的網絡連接,使用基于以太網的遠程直接內存訪問(RoCE)技術實現 400Gb/s 的速度。
BlueField SuperNIC 結合了以下獨特屬性:
-
高速數據包重排序可確保數據包的接收和處理順序與源端發送的順序相同。這可保持數據流的順序完整性。
-
使用實時遙測數據和網絡感知算法進行高級擁塞控制,以管理和預防 AI 網絡中的擁塞。
-
輸入/輸出 (I/O) 路徑上的可編程計算,可實現 AI 云數據中心網絡基礎設施的自定義和可擴展性。
-
節能高效的半高設計,可在有限的功率預算范圍內高效適應 AI 工作負載。
-
全棧 AI 優化,包括計算、網絡、存儲、系統軟件、通信庫和應用框架。
NVIDIA 最近推出了全球首款專為 AI 計算定制的 BlueField SuperNIC,基于 BlueField-3 網絡平臺。它是 NVIDIA Spectrum-X 平臺的一部分,與 Spectrum-4 以太網交換機系統無縫集成。
NVIDIA BlueField-3 SuperNIC 和 Spectrum-4 交換機系統共同構成專為優化 AI 工作負載而設計的加速計算架構。Spectrum-X 始終如一地提供極高網絡效率水平,遠超傳統的以太網環境。
NVIDIA DPU 和網卡產品副總裁 Yael Shenhav 表示:“AI 正在推動新一波的技術創新,BlueField-3 SuperNIC 是其中至關重要的一個齒輪。BlueField SuperNIC 可確保您的 AI 工作負載得到高效和快速的執行,必將成為實現 AI 計算未來的基礎組件。”
不斷發展的 AI 和網絡格局
AI 領域正在經歷一場地震級轉變,這要歸功于生成式 AI 和大語言模型,這些強大的技術釋放了新的可能性,使計算機能夠處理新任務。
AI 的成功很大程度上依賴于 GPU 加速計算來處理海量數據、訓練大型 AI 模型并實現實時推理。這種新的計算能力開辟了新的可能性,但也對以太網云網絡提出了挑戰。
傳統以太網是互聯網基礎設施的基礎技術,旨在提供廣泛的兼容性和連接松耦合的應用程序。它的設計并不是為了滿足現代 AI 工作負載的苛刻計算需求,這些工作負載涉及緊耦合的并行處理、快速數據傳輸和獨特的通信模式,所有這些都需要優化的網絡連接。
傳統網絡接口卡(NIC)為通用計算、通用數據傳輸和互操作性而設計,并沒有為 AI 工作負載計算強度帶來的獨特挑戰進行優化設計。
標準網卡(NIC)缺乏必要的特性和功能來實現高效的數據傳輸、低延遲和對 AI 任務至關重要的確定性能。而 BlueField SuperNIC 則專為現代 AI 工作負載而構建。
AI 計算環境中的 BlueField SuperNIC 優勢
數據處理器(DPU)提供豐富的高級功能,可提供高吞吐量、低延遲的網絡連接等。自 2020 年推出以來,DPU 在云計算領域越來越受歡迎,主要是因為其能夠卸載、加速和隔離數據中心基礎設施處理。
盡管 DPU 和 BlueField SuperNIC 具有一系列相同的特性和功能,但 BlueField SuperNIC 針對 AI 加速網絡進行了獨特的優化。下圖顯示了它們的對比情況:

分布式 AI 訓練和推理通信流很大程度上取決于網絡帶寬的可用性。BlueField SuperNIC 以其獨特的設計而引人注目,其擴展比 DPU 更有效,每個 GPU 可提供驚人的 400Gb/s 網絡帶寬。
系統內 GPU 與 BlueField SuperNIC 的 1:1 配比可以顯著提高 AI 工作負載效率,從而提高企業的生產力和卓越成果。
BlueField SuperNIC 的唯一目的是加速 AI 云計算的網絡。因此,它比 DPU 消耗更少的計算能力,而 DPU 需要大量計算資源來卸載主機 CPU 中的應用程序。
計算需求的降低也轉化為功耗的降低,這在包含多達 8 個 BlueField SuperNIC 的系統中尤為重要。
BlueField SuperNIC 的其他顯著特性包括其專用的 AI 網絡功能。當與為 AI 優化的 NVIDIA Spectrum-4 交換機緊密集成時,它提供了自適應路由、亂序數據包處理和優化的擁塞控制。這些高級功能有助于加速以太網 AI 云環境。
革新 AI 云計算
NVIDIA BlueField-3 SuperNIC 具有多項優勢,是 AI 基礎設施就緒的關鍵:
-
AI 工作負載峰值效率:BlueField-3 SuperNIC 專為網絡密集型大規模并行計算而構建,是 AI 工作負載的理想選擇。它可確保 AI 任務高效運行,消除通信瓶頸。
-
一致且可預測的性能:在同時處理大量任務的多租戶數據中心,BlueField-3 SuperNIC 可確保每個作業和租戶的性能都是隔離的、可預測的,并且不受其他網絡活動的影響。
-
安全的多租戶云基礎設施:安全是重中之重,尤其是在處理敏感信息的數據中心。BlueField-3 SuperNIC 保持極高的安全級別,使多個租戶能夠共存,同時保持數據和處理隔離。
-
可擴展的網絡基礎設施:BlueField-3 SuperNIC 的范圍并不受限,它高度靈活,可適應各種其他網絡基礎設施需求。
-
廣泛的服務器制造商支持:BlueField-3 SuperNIC 無縫適用于大多數企業級服務器,無需額外供電,為數據中心實現高效節能。
掃描下方二維碼,閱讀白皮書,詳細了解 NVIDIA BlueField-3 SuperNIC,包括它們如何跨 NVIDIA 數據中心平臺進行集成:新一代網絡,迎接新一波 AI 浪潮。

更多精彩內容 利用 NVIDIA DOCA Flow 實現 DPU 加速數據包轉向邏輯
使用 NVIDIA BlueField DPU 加速 Suricata IDS / IPS
使用 NVIDIA BlueField-3 DPU 驅動下一波應用程序

GTC 2024 將于 2024 年 3 月 18 至 21 日在美國加州圣何塞會議中心舉行,線上大會也將同期開放。掃描下方海報二維碼,立即注冊 GTC 大會。
原文標題:什么是 BlueField SuperNIC?
文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
-
英偉達
+關注
關注
22文章
3872瀏覽量
92444
原文標題:什么是 BlueField SuperNIC?
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
DBF系列多倍頻感應耐壓裝置產品說明
富士通合并兩個SAP系統,簡化其在德國的業務結構
NVIDIA網絡安全AI平臺助力保護關鍵基礎設施
利用NVIDIA DPF引領DPU加速云計算的未來

在NVIDIA BlueField-3 DPU上運行WEKA客戶端的實際優勢

NVIDIA DOCA-OFED的主要特性
NVIDIA SuperNIC推進現代AI基礎設施發展
簡單認識NVIDIA網絡平臺
英偉達Blackwell可支持10萬億參數模型AI訓練,實時大語言模型推理
NVIDIA BlueField-3 DPU助力思科提高工作負載安全性和運營效率
借助NVIDIA DOCA 2.7增強AI 云數據中心和NVIDIA Spectrum-X
進一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片
Nvidia的AI芯片路線圖分析與解讀

NVIDIA推出X800網絡交換機平臺,實現800Gb/s端到端吞吐量
NVIDIA 發布全新交換機,全面優化萬億參數級 GPU 計算和 AI 基礎設施

評論