5月9日,在2023年云網智聯大會主論壇,中國移動研究院攜手中國信通院、騰訊、鵬城實驗室、清華大學、華為、中興、銳捷、新華三、中信科、思博倫、Intel、Marvell、盛科等十余家合作伙伴,聯合發布《全調度以太網技術架構(GSE)白皮書》,中國移動研究院副院長段曉東、信通院總工敖立及其余合作伙伴代表共同出席發布儀式。
全調度以太網技術架構白皮書發布儀式
《全調度以太網技術架構白皮書》旨在推動面向未來智算中心的新型全調度以太網技術方案,希望能夠助力產業突破智算中心網絡性能瓶頸,打造無阻塞、高帶寬、超低時延的新型智算中心網絡,助力AIGC等高性能業務快速發展。
智算業務普遍采用分布式并行計算進行訓練,而并行模式均需要多個計算設備間進行多次集合通信操作,AI訓練中通常采用同步模式,多機多卡間完成集合通信操作后才可進行訓練的下一輪迭代或計算。在這個過程中,不管是拉取數據樣本還是計算節點間進行模型參數同步,都需要高性能、低時延的網絡。智算中心網絡作為底層通信連接底座,成為智算中心提升算力性能的關鍵因素。
隨著智算業務的發展,智算中心的數據流更加復雜多變,現有基于流的負載分擔技術很容易會造成哈希路徑上負載不均,導致網絡有效帶寬低、時延抖動大,一旦網絡性能不佳,就會影響AI訓練的質量和速度。面向未來智算中心規模建設和AI大模型發展及部署需求,如何打造無阻塞、高帶寬、超低時延的高性能網絡成為提升算力水平的關鍵,也成為當前國內外數據中心網絡領域創新焦點。
中國移動研究院主導提出的全調度以太網技術架構,在最大限度兼容現有以太網標準的前提下,將高性能計算需求融入以太網。創新性提出報文容器(PKTC)概念,以及從“流”分發到“報文容器”分發轉變、從“推”流到“拉”流轉變、從“局部決策”到“全局調度”轉變三大核心理念,構建出全網流量有序調度、鏈路帶寬高效利用、網絡狀態精確感知的高性能網絡。徹底解決了傳統網絡技術負載不均,公平調度難、擁塞控制能力不足等技術難題,為智算中心高性能網絡發展奠定了基礎。
為推動GSE架構完善和產業支持,中國移動聯合信通院、騰訊、清華大學、鵬程實驗室、華為、中興、銳捷、新華三、中信科、Intel、Marvell、盛科、思博倫等國內外公有云、設備商、芯片商、測試儀表商等共同研究了該技術方案的技術特性,初步達成了產業共識。
后續中國移動將繼續完善技術方案,加快國際國內標準化進程,加速推動產業生態成熟,形成完整的生態鏈,推動商用進程。
審核編輯 :李倩
-
以太網
+關注
關注
40文章
5432瀏覽量
171883 -
數據中心
+關注
關注
16文章
4792瀏覽量
72182 -
AI
+關注
關注
87文章
31000瀏覽量
269333
原文標題:以太網一小步,AI網絡一大步(附白皮書下載)
文章出處:【微信號:SDNLAB,微信公眾號:SDNLAB】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論