近日,Nvidia召開了秋季GTC并發布了一系列新的芯片和硬件。從GTC發布的產品來看,我們認為Nvidia最近一系列的動作都是在加強數據中心服務器市場的布局。雖然Nvidia占據了人工智能加數據中心的風口,但是我們仍然認為Nvidia在打入數據中心的道路上有不少挑戰需要克服。
Nvidia在數據中心的新產品:DPU
在GTC上,Nvidia著重介紹的一個產品是它在數據中心網絡領域的新產品:Data Processing Unit(數據處理器,DPU)。DPU把ARM處理器核、VLIW矢量計算引擎和智能網卡的功能集成在了一起,主要應用在分布式存儲、網絡計算和網絡安全領域。
在數據中心的分布式計算中,存儲和網絡都需要大量的處理器資源。對于存儲,在數據中心中大量存儲是分布式的,每個服務器可以訪問的存儲空間遠遠不僅限于本地的硬盤,這一方面大大增加了分布式存儲的靈活性,但是另一方面這類分布式數據存儲系統的訪問會需要額外的軟件處理來完成,而傳統上這類分布式存儲的軟件處理會使用CPU來完成。
除了分布式存儲之外,數據中心服務器之間的網絡互聯也有一套底層軟件系統,這套軟件需要能完成網絡互聯協議,除此之外還需要能跑一套數據中心必備的網絡安全系統。傳統上,這些處理也會跑在CPU上,而隨著智能網卡(SmartNIC)的逐漸普及,智能網卡正在網絡安全和網絡協議處理方面緩慢地取代CPU。
Nvidia的DPU事實上可以看做是SmartNIC的增強版本,一方面加強了SmartNIC對于網絡協議和網絡安全的處理能力,另一方面整合并加強了分布式存儲的處理能力,從而讓DPU能在這兩個領域更多地替代CPU。
事實上,Nvidia這次著重介紹的DPU是由它于近年收購的Mellanox內部孵化的。該產品最初的定位就是增強型智能網卡,其第一代產品BlueShield 1已經于去年發布了,只是由于是試水產品因此比較低調。Nvidia內部應該是看到了數據中心中網絡和存儲相關處理的機會,因此給第二代BlueShield項目傾注了更多資源,同時也提出了DPU的概念。Nvidia這樣的操作有點像20多年前由它提出的GPU——在Nvidia提出GPU之前,大多數公司對于同類產品的概念一直是顯示加速卡,而Nvidia認為顯示卡不僅僅是一種附屬于CPU的顯示加速,而且在計算機系統中能擔負起和CPU接近甚至更重要任務,因此提出了GPU的概念。這次Nvidia提出DPU這個新概念,可以看出Nvidia對于網絡數據處理領域的重視。而在未來,Nvidia計劃繼續推進BlueShield DPU產品線,一方面增強其網絡互連處理能力,另一方面還計劃加強其AI處理能力,從另一個維度增加產品的功能性。
DPU+ARM是Nvidia替代中低端x86的切入點
自從Nvidia開始收購ARM之后,我們看到Nvidia已經在多個場合顯示了其利用ARM處理器進一步占領數據中心服務器市場的決心,而DPU則是Nvidia最新的一個布局。
回顧Nvidia在數據中心市場的策略,最初Nvidia的立足點在于其在人工智能領域無與倫比的優勢,其GPU配合CUDA生態成功地抓住了數據中心最大的增量市場,即人工智能計算。
而在此之后,Nvidia顯然已經不滿足于抓住增量市場,更希望能切入數據中心的存量市場,即設法用自己的芯片產品去取代Intel(以及AMD)主導的x86 CPU。目前,唯一能與x86 CPU性能和生態屬于同一數量級的唯有ARM,而這也是Nvidia決定收購ARM的重要原因。一旦Nvidia正式完成收購ARM,那么集成了ARM核的DPU將成為Nvidia打入數據中心存量市場取代x86 CPU的第一個切入點。如前所述,傳統上會使用低端x86處理器來完成數據中心中網絡協議處理、網絡安全和存儲控制等任務,而使用DPU之后,就不再需要再使用CPU來處理這些任務了。從另一個角度來看,事實上就是Nvidia的DPU在數據中心的網絡協議處理、網絡安全和存儲控制市場取代了低端x86 CPU。
事實上,Nvidia選擇使用DPU來打這個市場,而不是推出ARM核直接和低端x86 CPU競爭是一個明智之舉。首先,智能網卡和智能存儲領域CPU逐漸被取代是大勢所趨,Nvidia在這個領域同時也有Mellanox的技術積累,可以說是順勢而為。此外,DPU在網絡和存儲領域從概念上來說是CPU的下一代產品,所以說雖然DPU中的ARM核性能未必比同一代對標的低端x86 CPU更強,但是整體來說由于在DPU SoC上集成了專用的處理加速模塊,因此總體性能一定是超過x86 CPU的。因此,Nvidia雖然第一步想要取代的是低端x86 CPU,但是其推出的對標產品并不低端,這從市場定位上來說也很討巧。
Nvidia在中高端數據中心處理器市場仍然面臨挑戰
DPU為Nvidia替代低端x86 CPU打開了道路,但是在中高端數據中心處理器市場,Nvidia如何把握市場仍然是一個未知數,也面臨不少挑戰。
首先,在中高端市場,目前Nvidia的GPU和x86處理器是標準配置,或者說Nvidia的產品和x86處理器仍然處于互補的關系。如果想要完全吃下高端市場,即使用Nvidia的GPU加Nvidia基于ARM架構的處理器做高端服務器,目前來看還需要在ARM處理器的性能上更進一步。我們知道,ARM基于RISC的架構能占領移動市場主要是依靠能效比,而在服務器市場,尤其是高端服務器市場,能效比的重要程度較弱,主要還是需要看性能。從技術上來說,Intel和AMD在高性能服務器處理器領域一直是領導者,也有數十年的經驗積累,而ARM架構做高性能處理器的時間并不久,而直到今天基于ARM架構尚沒有公開發售且成功的服務器端高性能處理器。當然,隨著未來人工智能重要性提升,或許在一些應用場景GPU比起CPU來說要更重要,Nvidia因此可以推出圍繞人工智能的GPU+ARM處理器中高端服務器產品,但是這樣的搭配能實現多高的性能尚不清楚,而且很明顯如果ARM處理器的性能相比x86越弱,那么這樣組合的服務器的使用場景就越狹窄。
除此之外,Nvidia在中高端數據中心處理器可能遇到的另一個挑戰是客戶自研芯片。亞馬遜為AWS已經發布了基于ARM核的自研處理器Graviton。云提供商對于自身的需求最清楚,因此自研芯片非常合乎情理,而且有機會能為自身的云服務提供差異化競爭的能力。如果谷歌等其它云服務商也跟進使用ARM架構自研芯片,那么這些云廠商就會成為Nvidia的客戶同時也是競爭對手。Nvidia如何在客戶自研芯片和x86之間找到一個中高端服務器處理器的切入點,我們還需拭目以待。
責任編輯:tzh
-
處理器
+關注
關注
68文章
19259瀏覽量
229653 -
芯片
+關注
關注
455文章
50714瀏覽量
423158 -
ARM
+關注
關注
134文章
9084瀏覽量
367390 -
cpu
+關注
關注
68文章
10854瀏覽量
211587
發布評論請先 登錄
相關推薦
評論