NVIDIA DOCA 加速框架為開發者提供了豐富的庫、驅動和 API,以便為 NVIDIA BlueField DPU 和 SuperNIC 創建高性能的應用程序和服務。DOCA 2.7是一個全面且功能豐富的版本,進一步拓展了 DOCA 軟件框架的范圍和價值,它提供了幾個新的庫、一站式應用和功能齊全的服務。
DOCA 2.7 擴展了 BlueField DPU 在數據中心內卸載、加速和隔離網絡、存儲、安全和管理基礎設施方面所發揮的作用。該版本還進一步增強了 AI 云數據中心,并加速了 NVIDIA Spectrum-X 網絡平臺,為 AI 工作負載提供了卓越的性能。
本文將詳細介紹該版本的以下亮點:
借助 BlueField-3 SuperNIC 支持 Spectrum-X RA 1.0.1
DOCA PCC、DOCA Flow 和 OVS DOCA 增強功能
更新的 AI 云流量加密 – IPsec 功能的發布、PSP 功能的支持(測試版)
新的 DOCA 庫
DOCA 服務增強功能
新增的 DOCA 管理服務(DMS)
借助 BlueField-3 SuperNIC 的
NVIDIA Spectrum-X RA 1.0.1
DOCA 2.7 為以太網 AI 云部署啟用了NVIDIA Spectrum-X 1.0.1(SPC-X 1.0.1)參考架構。此架構經過嚴格測試,并優化了 BlueField SuperNIC 和 Spectrum SN5600 交換機的功能,可加速和管理 AI 集群中的東西向以太網流量。
適用于 BlueField-3 SuperNIC 的 DOCA 2.7 的新功能包括:
使用自動態路由和 DOCA 可編程擁塞控制(PCC)的無損 RoCE
DOCA-PCC 針對在 SPC-X 1.0.1 上運行的 AI 工作負載進行了優化
BlueField SuperNIC 默認為 NIC 模式
目前,此架構正在被多個 AI 云 CSP 廣泛采用。
DOCA-PCC
DOCA PCC 庫提供了高級編程接口,使您能夠實現自己定制的擁塞控制(CC)算法。該庫利用 NVIDIA BlueField-3 SuperNIC 加速來管理 CC,并提供可簡化硬件復雜性的 API,從而使您能夠專注于 CC 算法的功能實現。
DOCA PCC 還提供了開發最佳解決方案的靈活性,以處理和避免集群中的網絡擁塞。每個網絡都是不同的,并非所有網絡都可以使用標準的現有擁塞控制解決方案。定制的擁塞控制對于 AI 工作流程至關重要,能夠實現性能隔離、提高公平性和持續的低時延,同時防止在無損網絡上發生丟包。
DOCA 2.7 提供了一系列旨在優化擁塞控制的功能。這些功能有助于監控網絡性能、診斷問題和收集遙測數據。例如,在發生擁塞相關事件時,可以使用 Notification Point (NP)可編程性觸發警報或操作。DOCA 2.7 還支持多個探針數據包,用于監控和遙測的數據包,以及增強網絡可見性。
雖然這些功能不僅限于擁塞控制,但它們有助于診斷與擁塞相關的問題并改善整體網絡運行狀況。此外,通過監控 Spectrum 交換機可以獲得的其他遙測信息,例如端口速度容量信息可以降低端口超額認購的可能性。跟蹤網卡(端點)端口發送/接收(Tx/Rx)的字節有助于揭示擁塞的模式。
VirtIO-net 設備
DOCA 2.7 現在可為BlueField-3 DPU提供高達 2000 個功能 VirtIO-net 設備。此能力非常適合需要許多可用的低容量和低使用率活動設備(例如,需要網頁訪問多個端點)的情況。采用公共云/私有云的 CSP 和企業可以使用此功能來幫助擴展多租戶環境。
DOCA Flow
DOCA Flow 提供了構建塊來簡化軟件定義網絡和軟件定義安全相關的網絡應用程序開發,從而將這些功能卸載、加速和隔離到 BlueField-3 DPU。作為用于卸載和加速網絡轉向流水線的轉向庫,DOCA Flow 實現了軟件定義網絡(SDN)服務的快速流水線可編程性。
DOCA 2.7 新增的 DOCA Flow 功能包括:
DOCA 連接跟蹤(CT),可提高流水線的性能、效率和靈活性
用于調試的 DOCA Flow 流水線可視化 (Alpha)
LPM 管道增強,支持基于 VLAN 的流量
作為 DOCA 開發的核心,對 DOCA Flow 的變更專注于提高功能性能和用戶體驗,借助 DOCA-FLOW 應用程序實現更大規模和更好的性能,并為 DOCA-FLOW 開發者提供調試和性能工具。
OVS DOCA
OVS DOCA是一款針對 NVIDIA 網絡服務進行高度優化的虛擬交換機。這是一種非常高效的設計,可使用 NVIDIA 網卡或 DPU 提升新一代性能和擴展性。OVS DOCA 基于 Open vSwitch,提供相同的北向 API、OpenFlow、CLI 和數據接口,確保成為 OVS 的直接替代方案。
OVS DOCA 能夠更快地實現 NVIDIA 未來的創新網絡功能。作為一項提供源代碼的可定制服務,OVS DOCA 為 HBN 和其他適用于以太網交換的 NVIDIA 服務提供支持。
DOCA 2.7 包含多項增強功能,可進一步優化 OVS-DOCA。例如,DOCA 使您能夠統一多個端口的代表口(representor),從而提供更好的資源利用率和擴展性。這意味著通過統一的代表口,可以更高效地管理更多端口,從而減少開銷并簡化配置。反過來,處理多個端口的單個代表口有助于實現更好的可擴展性。這對于大規模部署至關重要。
此外,發卡(hairpin)卸載功能可優化同一主機上虛擬機(VM)或容器之間的流量。這消除了將流量從外部路由到物理主機的需求,降低了時延,并促進了更快的數據交換,從而最終提高整體系統性能。
DOCA 2.7 的另一項新功能名為慢速路徑計量(Slow Path Metering),可監視和控制非加速流量。這提高了安全性和資源優化,并為管理員提供了細粒度的控制,以便為特定類型的流量設置策略,從而定制網絡行為。
DOCA 基于主機的網絡
HBN是一項 DOCA 服務,使網絡架構師能夠完全基于三層(L3)協議來設計網絡。這使得路由能夠通過使用 DPU 作為 BGP 路由器,并在網絡的服務器端(而不是在交換機上)運行。HBN 支持的 BGP EVPN 擴展可將 L3 底層網絡擴展到具有 Overlay 二層(L2)和三層(L3)隔離網絡的多租戶環境。
HBN 解決方案將一組網絡功能封裝在一個容器內,而容器本身則封裝為一個在 DPU 上運行的服務 Pod。這對裸金屬 CSP、電信公司和企業客戶非常有用。
DOCA 2.7 中的 HBN 新增功能包括:
對單端口 BlueField-3 SuperNIC 的支持
為本地 VRF 路由泄漏提供正式發布(GA)級支持
用于對稱 EVPN 路由泄露的 EVPN 下游 VNI(DVNI)
具有 VRF-Lite 的 3 層 VLAN 子接口
BlueField 上行鏈路上的網絡到網絡的發夾路由支持
對二層(L2)VXLAN 上的有狀態 ACL 的正式發布(GA)級支持
在面向主機接口上對 VLAN trunk 的初始支持
此更新通過單端口 BlueField SuperNIC 啟用 GPU E/W 網絡架構用例,提供了多項直接優勢。
DOCA 2.7 功能不僅提高了隔離租戶的共享服務和互聯網訪問的可擴展性和效率,而且還使 BlueField DPU 能夠用作 EVPN overlay 網關。這為多租戶云提供了外部連接。
DOCA SNAP 零拷貝靜態加密
在 BlueField-3 上的DOCA SNAP v4 服務中添加了在線 AES-XTS 卸載功能。AES-XTS 是一種事實上的加密算法,用于保護存儲設備上靜態數據的機密性。現在,SNAP 可以在硬件中加速 AES-XTS 加密,從而優化和改進加密過程,同時降低 CPU 開銷。
基于 AES-XTS 的 SNAP 靜態數據加密,現已對零復制的 SPDK API 和 SNAP RPC 可用,這意味著可以對存儲的數據進行加密和解密,而無需在內存中復制額外的副本。典型客戶包括尋求使用新一代 DDR、LPDDR、GDDR 和 HBM 內存接口來提高性能的客戶。
DOCA 2.7 新增的 DOCA SNAP 功能包括:
BlueField-3 支持 SNAP v4 服務
使用 SPDK API 為每個命名空間提供不同的加密密鑰
支持 NVMe-oF RDMA/RoCE
與作為旁路的其他標準和非標準協議相集成
DOCA Firefly
DOCA Firefly 服務利用 NVIDIA DPU 的硬件加速提供精確的時間同步服務。DOCA Firefly 現在包括行業特定的配置文件,以改善用戶體驗并簡化部署。除了現有的媒體行業配置文件外,DOCA 2.7 現在還提供電信行業配置文件,包括行業特定的功能和定制的性能參數。
這項服務已為電信、媒體和娛樂及金融服務等眾多行業客戶所采用。目前,它用于推動 MSG-Sphere 的嚴格計時要求。
AI 云流量加密和解密
DOCA 2.7 包括 DOCA IPsec 的修訂版(現已正式發布),以及引入了 DOCA PSP 功能。
在 BlueField DPU 上運行的 DOCA 可以通過多種方式改進 IPsec 流程,同時加速網絡流量的加密和解密。在此版本的新增中,DOCA Flow 現在可以支持所有 IPsec 模式和選項,同時提供 IPsec 協議的全面加速。
其他功能包括:
IPsec 正式發布
多線程支持
提高插入率
刪除 DOCA IPsec 庫并將其功能合并到 DOCA Flow 的 API 更新中
PSP是 Google 發布的一種新的網絡安全協議。此版本是首個支持 PSP 的版本(技術預覽版),通過 DOCA Flow 和在線 PSP 封裝及硬件中的加密/解密來全面加速 PSP 協議。與 IPsec 相比,PSP 特別適合在大規模 AI 云中使用。
這些功能的示例用例包括:
北南向 AI 云網絡加密
東西向 AI 云 GPU 到 GPU 流量
非 AI 云節點到節點加密
DOCA UROM 和 DOCA DevEmu
新的DOCA UROM庫和服務支持卸載高性能計算(HPC)和 AI 工作負載。具體來說,HPC 的計算由主機執行,同時 HPC 的通信由 BlueField DPU 加速和卸載。這有助于優化 CPU 利用率,為 AI 訓練和推理以及 HPC 應用程序提供性能提升。
DOCA 設備仿真庫(DOCA DevEmu)使您能夠在 BlueField DPU 上仿真自定義設備,并從主機通過 PCI 連接到該設備。這提供了幾個優勢,其中最重要的優勢就是可以訪問與卸載或加速相關的其他功能,但無需主機應用程序直接使用 DOCA API。
適用于 DPU 的 DOCA 通信通道
DOCA 通信通道(Comm Channel)在不受信任的主機客戶端應用程序和 BlueField 軟件服務之間提供增強的硬件隔離通信。它支持創新的安全和存儲卸載服務。
DOCA 管理服務
DOCA 管理服務是一項 DOCA 2.7 新增的 DOCA 服務,可使用標準配置接口(API/CLI)簡化 BlueField 的啟動后配備和配置。
主要優勢:
為所有工具提供相同的 API,無需了解所有工具及其不同的語法。
無需深入了解低級硬件細節,即可配置 NVIDIA 網卡。
使用行業標準配置接口(CLI 和 API)和數據模型(例如 gRPC/gNMI 和 OpenConfig),以確保更好的互操作性和易于集成。
通過專為與外部自動化系統和工具無縫集成而設計的強大 API,簡化 DPU 管理任務的自動化。
總結
NVIDIA DOCA 框架能夠利用行業標準 API 在 BlueField 網絡平臺上快速創建和管理應用程序和服務。借助 DOCA,開發者可以利用 NVIDIA BlueField DPU 和 SuperNIC 的強大功能,實現突破性的網絡、安全和存儲性能。
DOCA 2.7 中的新功能在 AI 云數據中心中通過 BlueField DPU 和 SuperNIC 提供的功能和優勢來擴展其更廣泛的價值。最近的增強功能不僅有助于為 AI 工作負載提供卓越的性能,而且還增加了擴展的安全和網絡功能。這些改進相結合,為開發者提供了一個強大的平臺。DOCA 2.7 還通過 BlueField-3 SuperNIC 支持 NVIDIA Spectrum-X 參考架構。
-
以太網
+關注
關注
40文章
5507瀏覽量
173570 -
NVIDIA
+關注
關注
14文章
5160瀏覽量
104896 -
VLAN
+關注
關注
1文章
282瀏覽量
35996 -
DPU
+關注
關注
0文章
378瀏覽量
24426
原文標題:借助 NVIDIA DOCA 2.7 增強 AI 云數據中心和 NVIDIA Spectrum-X
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
NVIDIA推出全新硅光網絡交換機
NVIDIA DOCA 2.9版本的亮點解析

NVIDIA向開放計算項目捐贈Blackwell平臺設計
NVIDIA DOCA-OFED的主要特性
NVIDIA助力xAI打造全球最大AI超級計算機
NVIDIA 以太網加速 xAI 構建的全球最大 AI 超級計算機

NVIDIA新增生成式AI就緒系統認證類別
NVIDIA 在 Hot Chips 大會展示提升數據中心性能和能效的創新技術

IB Verbs和NVIDIA DOCA GPUNetIO性能測試

借助NVIDIA NIM加速AI應用部署

應用NVIDIA Spectrum-X網絡構建新型主權AI云
NVIDIA Spectrum-X 以太網網絡平臺已被業界廣泛使用
NVIDIA為新工業革命打造 AI 工廠和數據中心
NVIDIA AI Enterprise榮獲金獎

評論