近日,中科馭數重磅發布第三代DPU芯片K2-Pro,是國內首顆面向量產的全功能芯片!
K2-Pro采用自主研發的Kernel Processing Unit架構,集網絡、存儲、安全及計算等多業務卸載功能于一體,包處理速率翻倍至80Mpps,最高支持200G網絡帶寬,具備高度可編程性,確保了系統的靈活擴展性,為數據中心的業務增長和算力擴容提供堅實基礎。在處理復雜任務時,K2-Pro相比上一代芯片能耗降低30%。
作為一款純國產的高性能解決方案, K2-Pro以其全面性能的均衡與卓越,成為數據中心戰場上的“六邊形戰士”,可廣泛適用于云計算、智能計算、及高性能計算等領域,也為數據中心的算力升級提供了全新解題思路。同時,K2-Pro也必將成為推動DPU芯片進入大規模量產的標桿之作。
自研KPU架構和KISA指令集
用創新的體系結構理論指導復雜的芯片架構設計
對于中科馭數來說,DPU的研發之路上,架構創新不是可選項,而是必選項。中科馭數在芯片研發領域持續深耕,從底層架構入手,致力于解決DPU芯片面臨的高帶寬、低延遲及復雜業務需求挑戰的決心。
KPU架構——專用計算代表性架構
自主研發KPU芯片架構是中科馭數多年體系結構研究的結晶,基于軟件定義硬件的技術路線,創新性地提出了面向專用計算統一計算架構KPU。該架構采用異構計算核作為基本單位,根據上層應用的具體需求定制化設計,具有軟件可定義、超高并行處理能力、超強處理性能三大優勢,配合數據流驅動的運算激活機制,確保了系統靈活性與高效運行的完美平衡,為DPU芯片設計打造新標桿。
KISA指令集——業界首個DPU指令集架構
以此為基礎,中科馭數進一步推出了首個專為DPU設計的指令集架構——KISA,旨在解決專用計算領域編程范式的碎片化問題。不同于傳統的CPU指令集,KISA緊密貼合DPU的特性,強調數據處理而非控制流,高計算密度型而非低計算密度型,采用數據流而非字節作為基本操作單元。更重要的是,KISA首次在指令集層次支持敏捷異構,用一套統一的指令實現了多種異構處理核進行管理調度。
目前,KISA指令集涵蓋了KISA基礎架構、以及面向DPU專用處理擴展指令,包含包解析、轉發指令、以及表查詢指令等。基于KISA已經覆蓋25大類應用場景,累計數百個用例,得到非常充分驗證。
KISA指令集的推出,將軟件定義技術路線向著更加可落地、可執行的方向推進了一大步,系統性地解決了領域專用計算的編程范式混雜的難題,讓開發變得更加簡單高效,讓每一行代碼直達DPU算力。
實用制勝,量產為王
K2-Pro何以稱為數據中心的“六邊形戰士”?
基于以上兩大底層技術創新,不僅打破了傳統DPU設計,更推動了DPU芯片向更高性能、更強靈活性和更低功耗方向發展。相較于單一性能的極致追求,中科馭數在DPU設計上秉持全面卓越的理念,致力于打造“全能冠軍”而非“單項冠軍”。
因此,K2-Pro在立項之初就把“實用制勝,量產為王”作為研發目標,確保技術創新與市場需求緊密結合。歷經深度優化以及融合了對數據中心未來中心場景的深入理解,K2-Pro最終實現以下六個方面的極致優化:
K2-Pro是先進、好用的網絡芯片
對于DPU來說,首先是一個網卡,才能再談進一步拓展其復雜業務的處理能力。為此,中科馭數團隊在基礎網絡功能上苦下工夫,將K2-Pro打造成綜合能力強悍的網卡芯片。
一方面,在實現基礎網絡卸載功能上,K2-Pro集成了高通量DMA以及硬件虛擬化技術,并通過豐富的軟件顯著增強了運維能力,這一進步在國產網卡領域中尤為突出,直接對標國外主流產品。
另一方面,K2-Pro著重在網絡延時、高階包處理能力上做了增強。通過優化設計,K2-Pro將端到端網絡延遲控制在1.2微秒以下,處理帶寬達到200Gbps,做到業界領先水平,成功填補了國內低延遲網卡市場的空白。
同時,結合其可編程的包處理引擎,K2-Pro打破了傳統網絡處理局限于二層包的框架,賦予用戶更高的靈活性去執行包解析和深度數據分析任務,根據自身需求設計特定的安全策略、流量優化方案等等,讓用戶在硬件層面實現個性化配置,極大提升了數據中心網絡的智能化和定制化程度。
K2-Pro是高通量數據處理芯片
K2-Pro芯片,作為一款面向數據中心的高性能數據處理核心,其優勢在于如何高效且有序地管理復雜多變的基礎設施層服務。
DPU業務里面有非常鮮明的特點:一是業務類型繁多且性質各異,涵蓋網絡、存儲及各類用戶特定應用,每種業務不僅要求精確解析,還需定制化處理邏輯,加之不同業務的處理時延各異,極易引發處理順序混亂等難題。二是并發級別極高,應對千萬級別的數據流、管理動輒數百上千的虛擬機,是數據中心面臨的運營常態。三是對延遲高度敏感,與GPU的批處理加速模式不同,DPU要求在嚴格的時間窗口內完成任務,任何延誤都將導致數據丟失。
鑒于此,K2-Pro的高通量數據處理能力成為其核心競爭力,其背后的關鍵技術在于精細的流調度與隔離機制。經過深入研究與優化,K2-Pro從流的精準識別到并發處理能力均實現了顯著提升,確保在極端并發場景下仍能維持高水平性能,幾乎不受流量洪峰影響。最終做到了在承載千萬級并發流、服務上千租戶、處理千萬級流表及數十種不同租戶配置的復雜業務之下,穩定輸出200Gbps數據吞吐率及40Mpps包處理能力的領先性能,讓數據處理更加“游刃有余”。
K2-Pro是強業務卸載芯片
在復雜的云服務環境中,尤其是面對如服務網格這類高控制復雜度的業務,現有DPU技術往往難以有效承擔,其業務卸載效率低下,通常不足20%。業界普遍采取的應對策略是增強控制層面的資源配置,極端時甚至采用服務器級CPU來維系控制功能。但這不僅未能從根本上改善服務質量和降低延遲問題,反而可能導致資源浪費。
基于上述挑戰,中科馭數團隊一直認為DPU必須輕控制,而非盲目追求與CPU相匹敵的控制能力。在此理念指導下,K2-Pro在設計上實現了多項關鍵技術突破,包括但不限于精密的流調度技術、高效數據交互協議,以及專門設計的網絡卸載、表項卸載、存儲卸載、RDMA卸載等重要引擎,將原本在DPU上難以卸載的業務比例從低于20%顯著提升至90%以上,大幅減輕了控制面的壓力。
服務治理場景下,K2-Pro也實現了量級的躍遷,將原先400us以上的治理延時降到了30us以內,顯著優于當前市場上的解決方案,為確保高性能、低延遲的云服務環境提供了強大的技術支持。
K2-Pro是靈活可擴展處理芯片
雖然DPU出現時間不長,但是它的潛力在加速顯現。隨著更多業務向DPU轉移,以及協議迭代和任務類型的增加,DPU的擴展能力成為關鍵。因此,K2-Pro芯片在三個維度上實現了獨特性的可擴展性設計,讓業務與同構算力、異構算力靈活擴展:
可編程與卸載能力:K2-Pro自身不僅配備了高性能的可編程引擎,還融入了協議分析引擎(PPP)與通用算法引擎(CAE),確保了對不斷演進的協議和復雜算法的有效支持。中科馭數在金融領域做過一個嘗試,通過全面卸載特定的金融通信協議和業務算法至DPU,性能相比現有方案提升了十倍以上,刷新了行業認知。
芯片級聯與算力自由擴展:為滿足日益增長的算力需求,中科馭數創新設計了DPU間的高速互聯技術,支持芯片級聯,使多個DPU能夠無縫串聯,實現DPU算力自由擴展。這一方案與行業標準接軌,為大規模數據中心的算力部署提供了高效路徑。舉例而言,通過多芯互聯,能夠輕松部署高性能的NAT網關解決方案,為數據中心的網絡架構升級和業務擴展打開了新的可能性。
開放的外接算力集成策略:K2-Pro還致力于與其他類型算力芯片的協同工作,提供了多元化的集成方案,既展現了DPU在構建綜合性解決方案中的靈活性,也預示著未來將有更多跨領域的創新合作案例涌現,進一步拓寬DPU的應用邊界。如中科馭數在與安全芯片廠商的合作中,共同打造了處理能力達到百Gbps級別的安全解決方案。
K2-Pro是穩如磐石的“管理”芯片
DPU在一般認知中常被視作輔助或“副手”角色,負責任務卸載,然而實際上,它在數據中心扮演著更為關鍵的主角身份。DPU不僅參與虛機的生命周期管理、資源調配等核心任務,還必須保證全天候穩定運行,是數據中心最中心的處理核心。
中科馭數對穩定性給予了高度重視,對K2-Pro進行了深度優化:納秒至毫秒級的分級異常恢復機制確保快速響應;系統與核心間的異常隔離設計,即使內部模擬攻防,也能維持運行不中斷。配備的實時狀態監測系統,對芯片內每個數據包、每個子系統的狀態進行不間斷監測,及時發現并預警潛在問題,實現了芯片內每個環節的全天候精準監控。截至目前,這種級別的監測精細度和系統穩定性在同類DPU產品中尚屬罕見。
K2-Pro是極致能效比的網絡芯片
能耗考驗也是DPU在設計時面臨著的又一大難題。盡管DPU承擔的任務遠超傳統網卡,但在服務器架構中,其安裝位置和功耗預算仍舊受限,類似于網卡的配置要求。鑒于此,中科馭數團隊深知,要想實現DPU的廣泛應用,必須在能效比上取得突破。
中科馭數不僅采用了諸多成熟的低功耗技術,更從應用層面進行了深度優化,通過精細的電源管理策略,實現了在不影響性能的前提下,對芯片面積和運行頻率的精準調控,這一過程雖充滿挑戰,近乎苛刻,卻也體現了團隊對技術極限的不懈追求。最終,DPU在多種應用場景下展現出了顯著的能效優勢,相比上一代功耗降低30%,與國際DPU產品相比也有更為出色的能效表現,為DPU的大規模部署奠定了堅實的能效基礎。
中科馭數高級副總裁、CTO盧文巖博士表示,正是我們堅持自主研發,突破技術壁壘,我們才能開發出自主知識產權的KPU架構與KISA指令集,為DPU領域貢獻了我們的創新成果;正是這份對六個關鍵領域“死磕到底”的決心,我們才能在造“芯”路上厚積薄發,見證這個數據中心“六邊形戰士”的誕生;也正是我們堅持技術與市場的緊密結合,將量產與應用視為同等重要,我們才能見證K2-Pro成為了一款真正可落地、可推廣的高性能DPU芯片。相信K2-Pro的問世,將會是數據中心算力技術革新的重要里程碑。期待見到它走向各行各業,未來在數據中心乘風揚帆,在算力征途上破浪前行!
審核編輯 黃宇
-
芯片
+關注
關注
456文章
50886瀏覽量
424180 -
DPU
+關注
關注
0文章
364瀏覽量
24202 -
算力
+關注
關注
1文章
985瀏覽量
14838
發布評論請先 登錄
相關推薦
評論