4月19日,在以“重構世界 奔赴未來”為主題的2024中國生成式AI大會上,中科馭數作為DPU新型算力基礎設施代表,受邀出席了中國智算中心創新論壇,發表了題為《以網絡為中心的AI算力底座構建之路》主題演講,勾勒出在通往AGI之路上,DPU技術賦能下一代AI算力基礎設施中的關鍵作用。
算力是當前人工智能領域發展的關鍵,是AI時代的“面包”。要訓練百萬億參數超大預訓練模型,算力基礎設施架構優化是提升算力的首要步驟。當前,DPU算力基礎已經發展迭代了4到5年,算力領域對DPU的期望和需求已經涵蓋計算、網絡、存儲、安全等多個領域。
中科馭數旨在通過DPU將計算加速、存儲加速、網絡加速、安全加速及云原生加速等基礎設施層深度整合,構建高性能、高集成的AI服務基礎架構。公司已基于此打造出涵蓋云原生DPU軟硬一體加速、RDMA/RoCE AI計算網絡、NVMe-oF高性能存儲、靈活存算分離架構、DPU硬件級安全隔離以及數據中心資源池化與統一調度的豐富產品矩陣與解決方案,不僅僅能夠助力AI算力底座的整體性能提升,也為用戶提供了更高效更完整的基礎設施解決方案,有力支撐各類AI應用的快速發展。
以中科馭數自研FLEXFLOW-2100R RDMA加速DPU卡為例,該加速卡產品能夠將高性能、穩定性、便捷性和通用性融為一體,提供2x100GbE網口的連接能力,支持RoCEv2的硬件卸載能力以及無損網絡能力,為國產化業務場景提供微秒級時延和百G帶寬的RDMA網絡環境,為用戶提供靈活和高性能的網絡解決方案。同時,適配市面上所有主流支持無損網絡的交換機,以及國內外主流服務器和操作系統,可以快速接入現有RDMA網絡環境。經實測,KPU FLEXFLOW-2100R在4K以下小文件send、read、write測試場景中,時延數據均在5us以下,最低可達3us,優于國內外主流RDMA智能網卡性能水準。
需要看到的是,隨著AI向更多領域滲透,對基礎設施的需求將更加多元化、智能化。同樣,DPU的成功落地和使用需要經過精心設計和打磨,以滿足整個基礎設施領域的多樣需求。中科馭數將繼續秉持著技術創新和開放合作的理念,歡迎服務器廠商、CPU/GPU廠商、操作系統廠商等上下游合作伙伴加入馭數DPU生態,共同推動AI算力底座的發展。
審核編輯:劉清
-
交換機
+關注
關注
21文章
2637瀏覽量
99528 -
DPU
+關注
關注
0文章
357瀏覽量
24169 -
人工智能
+關注
關注
1791文章
47183瀏覽量
238245 -
RDMA
+關注
關注
0文章
77瀏覽量
8945 -
生成式AI
+關注
關注
0文章
502瀏覽量
471
原文標題:通往AGI路上,DPU將如何構建生成式AI時代的堅實算力基石?
文章出處:【微信號:yusurtech,微信公眾號:馭數科技】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論