本月,NVIDIA創(chuàng)始人兼CEO黃仁勛在COMPUTEX 2024發(fā)表了主題演講,宣布NVIDIA Spectrum-X以太網(wǎng)網(wǎng)絡(luò)平臺已被業(yè)界廣泛使用,并且將進一步加快新品發(fā)布計劃。
本期Kiwi Talks將從利好以太網(wǎng)發(fā)展的幾個因素出發(fā)淺析一下以太網(wǎng)的發(fā)展走勢...
云廠商從訓(xùn)練側(cè)逐步過渡到推理側(cè)
隨著AI大模型變得更精簡、可在設(shè)備上運行并專注于推理任務(wù),芯片制造商的市場重心將轉(zhuǎn)向推理,即模型應(yīng)用。展望產(chǎn)業(yè)發(fā)展趨勢,AI算力負載有望逐步從訓(xùn)練向推理端遷移,從而降低AI芯片門檻。不可否認英偉達的InfiniBand確實有優(yōu)勢。目前很多AI集群都部署了InfiniBand網(wǎng)絡(luò),這是因為其低延遲、擁塞控制機制等特性。
盡管InfiniBand在AI訓(xùn)練集群中很受歡迎,但AI推理服務(wù)器通常通過以太網(wǎng)與主網(wǎng)絡(luò)互連。隨著推理能力成為AI工作負載的更大一部分,大多數(shù)AI推理服務(wù)器都將通過以太網(wǎng)連接。可預(yù)見的是越來越多的基于以太網(wǎng)的生態(tài)部署的出現(xiàn)在一定程度上是為了響應(yīng)云廠商從訓(xùn)練側(cè)向推理側(cè)轉(zhuǎn)移的需求。
以太網(wǎng)交換機市場的增速需求
據(jù)IDC統(tǒng)計,2023年全球交換機行業(yè)市場規(guī)模達到3698.6億元,同比增長18.5%,且預(yù)計未來5年的增速穩(wěn)定在5%左右,預(yù)計2028年規(guī)模將達到4373.0億元。隨著大模型的廣泛應(yīng)用和網(wǎng)絡(luò)技術(shù)的不斷進步,交換機在算力互聯(lián)、數(shù)據(jù)傳輸方面的價值將進一步提升,促進數(shù)據(jù)中心交換機市場空間持續(xù)增長。交換機市場展現(xiàn)出了蓬勃的增長態(tài)勢和快速的技術(shù)迭代。
就在近期博通的業(yè)績會上該公司強調(diào)以太網(wǎng)占據(jù)AI算力集群主力,表示當(dāng)前最大的8個AI算力集群中有7個采用博通以太網(wǎng)方案,預(yù)計明年所有的大規(guī)模GPU算力集群均會采用以太網(wǎng)方案,并將今年網(wǎng)絡(luò)業(yè)務(wù)營收指引上修至同比增長40%。
博通的強勢業(yè)績以及熱烈的市場反應(yīng),體現(xiàn)以太網(wǎng)或?qū)⒃谖磥碛?xùn)推一體趨勢下更受云廠商等青睞,并充分受益 AI 集群部署,刷新市場對IB&以太網(wǎng)之爭認知。
相關(guān)機構(gòu)預(yù)計從2025年底或2026年開始,以太網(wǎng)標(biāo)準(zhǔn)的增強將解決AI集群擴展問題。從那時起,以太網(wǎng)將在AI訓(xùn)練集群中獲得更多應(yīng)用,并將成為InfiniBand的有力競爭者。
全面擁抱以太網(wǎng),更開放的生態(tài)
人工智能和高性能計算工作負載給網(wǎng)絡(luò)帶來了新的挑戰(zhàn),例如需要更高的規(guī)模、更高的帶寬密度、多路徑、對擁塞的快速反應(yīng)以及各單獨流的進展之間的相互依賴性(其中尾延遲是關(guān)鍵指標(biāo))。
超以太網(wǎng)聯(lián)盟 (Ultra Ethernet Consortium,UEC) 由 AMD、Arista、Broadcom、Cisco、Eviden、HPE、Intel、Meta 和 Microsoft 等行業(yè)領(lǐng)導(dǎo)者組成,旨在尋求通過“全行業(yè)合作”,構(gòu)建一個完整的基于以太網(wǎng)的通信堆棧架構(gòu)。超以太聯(lián)盟旨在提高網(wǎng)絡(luò)吞吐量、降低延遲,增強網(wǎng)絡(luò)的可靠性和穩(wěn)定性,既保持以太網(wǎng)的成本效益和普及性,又保持超級計算互連所需的性能。
奇異摩爾也在近期加入了UEC 超以太網(wǎng)聯(lián)盟,賦能生態(tài)系統(tǒng)聯(lián)合創(chuàng)新,共同改造并增強網(wǎng)絡(luò)設(shè)備端對AI和HPC大規(guī)模部署的靈活性,從而進一步提升以太網(wǎng)的性能。
英偉達黃仁勛此前在業(yè)績發(fā)布會上坦言Spectrum-X為英偉達網(wǎng)絡(luò)技術(shù)開辟一個全新的市場,使以太網(wǎng)數(shù)據(jù)中心能夠適應(yīng)大規(guī)模的人工智能,公司預(yù)計Spectrum-X將在一年內(nèi)躍升為價值數(shù)十億美元的產(chǎn)品線。英偉達也采取了以太網(wǎng)與InfiniBand并行的經(jīng)營策略,以爭取更多的市場份額。
另一巨頭AMD全面擁抱“開放”理念,服務(wù)器采用標(biāo)準(zhǔn)化設(shè)計,可以兼容任何客戶的集群。在網(wǎng)絡(luò)方面,內(nèi)部互聯(lián)的Infinity Fabric協(xié)議將開放給合作的交換機廠商與戰(zhàn)略伙伴。同時,在跨服務(wù)器的顯卡連接上,AMD旗幟鮮明地指出“Ethernet is the answer”,以太網(wǎng)成為AMD用于構(gòu)建集群的協(xié)議。
國內(nèi)智算中心生態(tài)全面推進以太網(wǎng)建設(shè)
國內(nèi)中國移動牽頭“全調(diào)度以太網(wǎng)(GSE)推進計劃”,基于逐包的以太網(wǎng)轉(zhuǎn)發(fā)和全局調(diào)度機制,突破傳統(tǒng)無損以太性能瓶頸,中國移動于2024年開展GSE中試,加速GSE關(guān)鍵技術(shù)和產(chǎn)業(yè)成熟,為標(biāo)準(zhǔn)開放的新型智算互聯(lián)貢獻中國方案。
GSE 面向無損、高帶寬、超低時延等高性能網(wǎng)絡(luò)需求業(yè)務(wù)場景,兼容以太網(wǎng)生態(tài)鏈,通過采用全調(diào)度轉(zhuǎn)發(fā)機制、基于 PKTC 的負載均衡技術(shù)、基于 DGSQ 的全調(diào)度技術(shù)、精細的反壓機制、無感知自愈機制、集中管理及分布式控制等技術(shù),實現(xiàn)低時延、無阻塞、高帶寬的新型智算中心網(wǎng)絡(luò)。
近日,在天津舉行的“2024晶上系統(tǒng)生態(tài)大會”上,中國工程院院士孫凝暉公布了中國首個高通量以太網(wǎng)聯(lián)盟的最新進展。該聯(lián)盟由阿里云和中國科學(xué)院計算技術(shù)研究所聯(lián)合發(fā)起,目前已有北京大學(xué)、平頭哥、盛科、騰訊、字節(jié)跳動、曙光等40余家單位率先加入。高通量以太網(wǎng)聯(lián)盟將在今年9月發(fā)布國內(nèi)首個高通量以太網(wǎng)協(xié)議1.0,提出面向智算場景的網(wǎng)絡(luò)方案解決方案,同時首次完整提出了針對集合通信的在網(wǎng)計算解決方案。
促進以太網(wǎng)生態(tài),奇異摩爾在行動
奇異摩爾的一系列產(chǎn)品解決方案是全面基于Chiplet &RDMA技術(shù),包括為AI網(wǎng)絡(luò)提供的面向高帶寬域南向網(wǎng)絡(luò)的NDSA-G2G以及面向服務(wù)器集群通信北向網(wǎng)絡(luò)NDSA-SNIC產(chǎn)品系列;
南向網(wǎng)絡(luò)GPU/NPU互聯(lián)通信
NDSA-G2G提供復(fù)用以太網(wǎng)基礎(chǔ)設(shè)施,基于RoCE RDMA技術(shù)的800G高速芯粒/芯片,旨在實現(xiàn)高性能GPU/NPU間高帶寬域的互聯(lián)(TB級)。
北向網(wǎng)絡(luò)服務(wù)器集群間通信
NDSA-SNIC智能網(wǎng)卡同樣基于RoCE RDMA技術(shù),擁抱以太網(wǎng)基礎(chǔ)設(shè)施,以800G帶寬的高性能,助力AI智算網(wǎng)絡(luò)實現(xiàn)服務(wù)器集群間的高速互聯(lián)。
熱潮洶涌的人工智能科技正持續(xù)對云數(shù)據(jù)中心、邊緣計算等領(lǐng)域帶來一代又一代的變革。以太網(wǎng)技術(shù)的崛起預(yù)示著它將逐步取代InfiniBand,成為支撐AI技術(shù)服務(wù)千行百業(yè)的主流選擇。奇異摩爾正在通過加入國內(nèi)外chiplet&以太網(wǎng)標(biāo)準(zhǔn)組織、聯(lián)合產(chǎn)業(yè)鏈上下游生態(tài)合作、從而共同打造一個更開放,更包容的AI網(wǎng)絡(luò)生態(tài)。
-
以太網(wǎng)
+關(guān)注
關(guān)注
40文章
5455瀏覽量
172290 -
交換機
+關(guān)注
關(guān)注
21文章
2653瀏覽量
99926 -
奇異摩爾
+關(guān)注
關(guān)注
0文章
49瀏覽量
3455
原文標(biāo)題:Kiwi Talks | 全面擁抱以太網(wǎng) “Ethernet is the answer”
文章出處:【微信號:奇異摩爾,微信公眾號:奇異摩爾】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論