隨著網絡速度的提高,向現代分布式工作負載的轉變增加了基礎設施服務的開銷,從而減少了為業務提供動力的應用程序可用的 CPU 資源。通過部署 DPU(數據處理器)來卸載和加速這些基礎設施服務,可以提供更高的性能、更低的 CPU 利用率和更高的能效。
許多現代工作負載都是分布式的,這意味著它們不再只適用于一臺服務器。相反,它們在多臺服務器上同時運行,以實現更高的可擴展性和可用性。此類工作負載包括 Web 和電子商務應用程序,如 NoSQL 數據庫、分析、人工智能和鍵值存儲,如 Redis。
許多公司都在 vSphere Enterprise Workload Platform(企業工作負載平臺)上運行這些分布式工作負載。隨著應用程序的不同部分在虛擬機(VM)和主機之間進行通信,vSphere 必須將越來越多的 CPU 資源用于管理數據移動和基礎架構工作負載,如網絡。
在 CPU 以外的 DPU 上運行網絡和安全基礎設施服務,可釋放 CPU 核心用于業務應用程序,并顯著減少 CPU 緩存污染和上下文切換等問題,從而打造一個高效的系統。
vSphere 軟件
基于 DPU 的 vSphere(以前稱為 Project Monterey)已隨 vSphere 8 一同發布。它與 NVIDIA BlueField DPU 一起,使應用程序工作負載流量能夠通過虛擬機監控程序(Hypervisor)實現網絡快速路徑。在直通模式下運行 BlueField DPU 可以將網絡處理卸載并隔離到 DPU。這將顯著提高應用程序的性能。
圖 1:vSphere 分布式服務引擎(Distributed Services Engine)架構
為了測試這一理論,NVIDIA 和 VMware 聯合展示了在 DPU 上運行的 vSphere 8 是如何提高可擴展性、效率和性能的。
Redis 鍵值存儲數據庫
由于 Redis 作為多模型 NoSQL 數據庫服務器和緩存引擎而廣受歡迎,兩家公司的工程專家選擇在 NVIDIA 實驗室中使用 BlueField DPU 在 vSphere 8 上測試 Redis。
Redis 是 Remote Dictionary Server(遠程字典服務器)的縮寫,是一種快速、開源、內存中的鍵值數據存儲。Redis 超越了其他 NoSQL 數據庫,可提供現代應用程序所需的高級功能,包括內置復制的各種數據結構,通過 Redis Sentinel 提供高可用性的能力,以及使用 Redis 集群(Cluster)進行自動分區。
測試的指標包括以下內容:
-
每秒處理事務量(TPS)
-
平均應用程序延遲
-
網絡吞吐量
-
用于網絡的服務器 CPU 利用率
-
能效
Redis 基準測試
測試包括運行多個工作負載,網絡設置使用 Geneve 疊加網絡(Overlay Networking)以及 VMware NSX 和 NSX 分布式防火墻。測試比較了三種網絡選項:
-
增強型數據路徑(Enhanced datapath- EDP)標準,具有常規網卡,而無 DPU 卸載
-
具有部分 DPU 卸載的 EDP 標準(默認模式)
-
EDP 標準,具有完全 DPU 卸載和加速
圖 2:在 vSphere 上測試 Redis 的服務器和網絡設置
DPU 卸載并隔離網絡處理,通過使用 DPU 上的加速器和緩存實現網絡處理。這可以釋放主機上的緩存以用于應用程序邏輯,從而在吞吐量和延遲方面顯著提升了應用程序性能。有兩種使用 DPU 的方法:
-
加速模式(Accelerated mode):在不丟失 vSphere 所支持的工作負載移動服務的情況下,通過實現類似 SR-IOV 的高網絡性能來獲得最佳結果。
-
默認模式(Default mode):為網絡處理提供基于 DPU 的卸載和加速,但也會在主機上產生一些 CPU 開銷。它不會釋放如 UPTv2 模式那么多的核心。
基準測試結果
針對白皮書進行的測試在 NSX 上使用了網絡加速,并使用了四層分布式防火墻的重疊網絡。在 80 個 Redis 實例中使用完全 DPU 加速(具有 UPTv2 的 EDP 標準)實現了近 2000 萬的 TPS。
在默認 DPU 卸載模式下,我們也實現了其中的很大一部分(1774 萬 TPS)。使用標準的 ConnectX-5 網卡,在沒有任何 DPU 卸載或加速的情況下,我們在僅運行 30 個 Redis 實例的情況下達到了 1275 萬 TPS 左右的峰值。
圖 3:DPU 卸載并加速以提高 TPS
我們還觀察到,與使用普通網卡相比,使用 DPU 卸載和 DPU 完全加速時,應用程序延遲顯著降低。與使用普通網卡相比,使用 DPU 卸載和加速 VMware ESXi 網絡可實現更低的延遲。隨著 Redis 實例數量的增加,DPU 的延遲優勢更加顯著。
圖 4:與使用普通網卡相比,將 DPU 與 VMware ESXi 結合使用可降低延遲
在吞吐量和帶寬方面,我們發現使用 DPU 卸載時,吞吐量高于標準網卡。DPU 完全加速顯示了最高吞吐量。由于 CPU 核心無法再處理任何額外的網絡任務,標準網卡的吞吐量穩定在 30 個實例。隨著 Redis 實例數量的增加,DPU 卸載和完全加速模式繼續提高吞吐量。
DPU 的功耗對于 10 至 30 個實例略低,對于 40 至 80 個實例略高。然而,服務器使用 DPU 完成了相當多的工作,從而提高了能效。
使用 DPU 卸載仍然會消耗一些 x86 處理周期,但消耗得要小得多,因為部分網絡處理已從 CPU 轉移到了 DPU。這樣可以大幅提高能效。當使用重疊網絡和 EDP 標準時,與普通網卡相比,完全 DPU 加速在每百萬 TPS 使用的功耗減少了 6% - 40% 。
通過減少 ESXi 網絡所需的 CPU 核心數量,DPU 可以釋放這些核心以運行更多的虛擬機和應用程序。這使得更多的工作負載可以在相同數量的服務器上運行。您還可以使用更少的服務器來支持相同工作負載,而這些工作負載以前是在沒有 DPU 卸載的情況下運行的。
價值主張
基準測試結果表明,與未啟用 DPU 的主機相比,啟用 BlueField DPU 的主機可以實現更好的事務延遲,同時使用的 CPU 核心數量也減少了 20% 。啟用 DPU 的主機將吞吐量提高了 30% 以上,事務延遲減少了 25% 以上。
DPU 完全加速還提高了能效,使每次事務的功耗減少了 35%,每瓦特的性能提高了 50%。該基準測試證明,在 BlueField DPU 上運行 vSphere 分布式服務引擎可以使數據中心將 Redis 服務器的數量減少 14 - 18%。
最大限度地提高投資回報率
由于在 DPU 加速(UPTv2)模式下保存了 CPU 核心,而在 DPU 卸載(默認)模式下保存了較少的 CPU 核心,因此您可以減少 4 - 15 個 CPU 核心來支持相同的 Redis 工作負載。假設每個 ESX 主機的工作負載為 30 – 80 個 Redis 實例,這能夠將服務器數量減少 14 – 18%。購買更少的服務器和支付更少的數據中心基礎設施可以節省資本性支出。此外,還可節省了運營性支出,因為服務器數量的減少會消耗更少的電力,以及相關的配電和冷卻電力也會減少。
對于最初需要 1 萬臺服務器的基于 vSphere 的 Redis 部署,一個簡單的 TCO 分析可以看出,如果 BlueField DPU 完全加速模式將所需的服務器數量減少 14 - 18% ,則將在 3 年內節省 830 萬至 1060 萬美元。其中大約一半來自于節省的資本性支出(減少服務器),一半來自于節省運營性支出(減少電力消耗以及相關的冷卻和配電成本降低)。
如果您僅部署少量 ESX 主機,Redis 服務器仍然可以從提高的應用程序性能中獲益。隨著應用程序需求的增長,加速的服務器可能會推遲購買或升級服務器,從而避免未來的成本。
這些特定的結果和成本節省僅適用于使用 25G DPU 的情況,因為我們受到在此處測試的最大規模下加速模式下 DPU 的線速限制。
使用 VMware VSphere 8 和
NVIDIA BlueField DPU 加速 Redis 性能
Accelerating Redis performance using VMware vSphere 8 and NVIDIA BlueField DPU(使用 VMware vSphere 8 和 NVIDIA BlueField DPU 加速 Redis 性能)白皮書記錄了測試和結果。該白皮書揭示了如何使用 vSphere 與 BlueField DPU 的硬件加速網絡卸載來顯著提高應用程序性能,提供更高的吞吐量,并實現更快的響應時間。
它還展示了卸載到 DPU 如何釋放服務器 CPU 核心來運行應用程序并提高運營效率。DPU 卸載和加速還降低了每個應用程序事務的耗電量,從而提高數據中心的效率,并通過降低耗電量顯著節省成本。
圖 5:提高主機服務器的能效
通過 NVIDIA LaunchPad
在 BlueField DPU 上體驗 VMware
為了體驗 BlueField DPU 的優勢,NVIDIA 提供了 LaunchPad,這是一個非常適合展示優勢的演示區。您可以申請測試在 vSphere 和 BlueField 上運行的各種應用程序和庫,而無需在數據中心購買和部署硬件。
LaunchPad 包括多個精心策劃的實驗,可以引導您完成在多個用例中運行的部署和性能基準測試,包括使用 BlueField DPU 的 vSphere 上的 Redis。
本實驗將指導您逐步完成在 vSphere 8 環境中安裝、配置和部署 Redis 的過程。您可以通過本實驗比較有 BlueField DPU 加速和沒有 BlueField DPU 加速的 Redis 測試,以驗證性能提升。
LaunchPad 為開發者、設計師和 IT 專業人員提供了快速訪問所需硬件和工具的機會,以熟悉新技術并確定他們如何從 DPU 加速中受益。企業團隊可以使用 LaunchPad 加速創建和部署現代數據密集型應用程序。在 LaunchPad 上進行快速測試和原型設計后,可以為其生產工作流部署相同的完整堆棧。
總結
DPU 已經廣泛部署在超大規模數據中心中,以處理基礎設施功能,并為創收工作負載釋放 CPU 資源。每個安裝了 vSphere 分布式服務引擎和 BlueField DPU 的節點都可以使用 DPU 卸載來提高性能。它為企業提供了一個有效的解決方案,以解決新工作負載給服務器帶來的壓力。
NVIDIA 與 VMware 及 NVIDIA LaunchPad 實驗室的測試結果顯示,在 VMware 服務器中添加 DPU 可以降低 TCO,同時改善整體工作負載處理。將基礎設施進程卸載到 DPU,可在 CPU 和基礎設施之間增加隔離,從而提高整體安全性。
觀看下方視頻
了解更多關于 NVIDIA BlueField DPU 的信息!
掃描下方二維碼,或點擊 “閱讀原文” 嘗試LaunchPad,測試在 vSphere 和 BlueField 上運行的各種應用程序和庫。
?
NVIDIA BlueField DPU 往期內容 借助 NVIDIA DPU 和 NVIDIA DOCA 為人工智能時代的數據中心帶來變革
GTC23 | Oracle 云基礎設施 (OCI) 選擇 NVIDIA BlueField 數據中心加速平臺
NVIDIA 人工智能開講 | BlueField DPU 如何幫助企業提升數據中心能效
白皮書發布 | 看 NVIDIA BlueField DPU 如何讓數據中心變得更加環保
原文標題:使用 VMware vSphere 8 和 NVIDIA BlueField DPU 加速 Redis 性能
文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
-
英偉達
+關注
關注
22文章
3795瀏覽量
91314
原文標題:使用 VMware vSphere 8 和 NVIDIA BlueField DPU 加速 Redis 性能
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論