2020年10月26日,燧原科技正式推出搭載燧原科技云燧T10的PCIe Gen4全互聯AI高算力訓練系統。該系統目前為國內第一套基于PCIe Gen4的全互聯AI高算力訓練系統,不僅使配備云燧T10的機內PCIe帶寬得以全面提升,同時結合燧原科技GCU-LARE技術可實現系統高性能互聯。
Supermicro 4U A+ 服務器(搭載8張云燧T10)
技術革新,GCU-LARE實現高性能互聯
PCIe Gen4全互聯AI高算力訓練系統由燧原科技與Supermicro合作研發,其中,燧原科技云燧系列產品PCIe Gen4的高帶寬和GCU-LARE智能互聯特點,在此研發中發揮了關鍵作用。
以該系統的創新技術——GCU-LARE來說,燧原科技GCU-LARE智能互聯技術為系統提供了最大提供雙向200GB/s的互聯帶寬。在2D Torus 6x6節點連接方式中,若采用GCU-LARE互聯,一個機柜內3臺8卡服務器,垂直方向環6個節點,水平方向用2張RDMA/RoCE網卡,通過類似可擴展的連接方式,可以實現千卡級別高線性度互聯,其線性加速比可達86%以上,遠超業內水平,故而實現其高性能互聯特色。
2D Torus 6x6節點示意圖(144張云燧T10)
精準攻克,強強聯手解決算力瓶頸
燧原科技產品部資深總監鄧輝表示,隨著AI模型的復雜化和大型化,AI算力需求成指數級增長。其中,運算集群和CPU的通信帶寬,以及運算加速卡節點之間scale out時的高性能、低延遲、智能化互聯成為高算力集群的瓶頸。
此次燧原科技正式推出的PCIe Gen4全互聯AI高算力訓練系統,便著重解決通信帶寬與運算加速卡節點之間的高性能、低延遲、智能化互聯問題。
PCIe Gen4連接拓撲
燧原科技通過直接連接PCIe Gen4 x16 CPU至云燧T10,使得Supermicro新的4U A+ Server 4124GS-TNR系統支持最多可8張云燧T10 PCIe AI加速卡,而單機8張云燧T10支持4卡作為一個節點的HCM(HybridCube Mesh)互聯拓撲,節點內通過GCU-LARE橋接卡實現4卡間點對點全互聯,節點之間通過GCU-LARE高速線纜實現互聯,總互聯帶寬高達800GB/s。最終,該系統無需任何PCIe Switch,便可實現最低延遲、最高帶寬和最大限度的加速。
GCU-LARE互聯HCM拓撲(單機8卡)
此外,該系統還支持最多兩個額外高性能PCIe Gen4擴展槽,且支持單個PCIe Gen4 x8以及最多2個用于RDMA高速網卡提供最高200Gb/s的高性能網絡連接,用于實現最先進的2D Torus的高性能AI訓練集群互聯拓撲。
多方攻克,具有強大算力與超高加速的PCIe Gen4全互聯AI高算力訓練系統搭載燧原科技云燧T10,應運而生。該系統加速了計算和網絡性能,極大的豐富和提升了整個AI高算力訓練系統互聯拓撲和帶寬,為客戶帶來強大的產品性能和可擴展性,使其擁有前所未有的速度為最復雜的Al網絡進行訓練。
系統落地,彰顯訓練芯片實力
燧原科技正是認可Supermicro在全球企業服務器先進解決方案上的突出地位,并與其創新性、革命性的研發特理念不謀而合,故而憑借其獨創的GCU-LARE互聯技術與Supermicro展開合作,成功地推出了中國第一套PCIe Gen4的多卡AI服務器訓練系統,解決了大型AI訓練系統互聯接口的瓶頸和規模部署的門檻。此次合作的成功還為雙方后期深入合作奠定了良好基礎,讓未來更多基于多卡互聯的AI模型訓練系統逐一實現。
對于燧原科技而言,這款搭載云燧T10的中國第一套PCIe Gen4全互聯AI高算力訓練系統成功推出,是對其研發方向的極致肯定,同時也彰顯了燧原科技在訓練芯片領域的技術實力與企業地位。
燧原科技創始人兼COO張亞林認為,能與全球企業服務器先進解決方案的倡導者和領先者Supermicro保持前瞻性技術上的一致,并展開深入合作,最后成功落地合作成果,是燧原科技走向國際舞臺的標志性一步,代表我國訓練芯片行業曙光在即,前景遠大。
未來,AI訓練芯片的算力需求將以每三個月增長一倍的驚人速度增長,而AI應用率到2025年將達80%。急速變化的AI訓練芯片技術、產量需求為該領域企業帶來了嚴峻考驗,燧原科技必將全力踐行其研發戰略,全面攻克數據分析、深度學習和深度學習推理等多方難題,為真正的算力普惠和應用落地創造價值和鋪平道路。
原文標題:燧原科技上線AI高算力訓練系統PCIe Gen4
文章出處:【微信公眾號:燧原科技Enflame】歡迎添加關注!文章轉載請注明出處。
責任編輯:haq
-
芯片
+關注
關注
455文章
50714瀏覽量
423158 -
服務器
+關注
關注
12文章
9123瀏覽量
85329 -
AI
+關注
關注
87文章
30728瀏覽量
268892
原文標題:燧原科技上線AI高算力訓練系統PCIe Gen4
文章出處:【微信號:gh_1222367b8780,微信公眾號:燧原科技Enflame】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論