流媒體、監(jiān)視和監(jiān)控數(shù)據(jù)、聯(lián)網(wǎng)傳感器、社交媒體、在線協(xié)作、遠程學習、增強和虛擬現(xiàn)實、在線游戲……隨著無窮無盡的在線應(yīng)用不斷涌現(xiàn),在線數(shù)據(jù)量出現(xiàn)激增。預計在未來 10 年中,數(shù)據(jù)流量的年增長率將超過 400 倍(圖 1)。這種數(shù)據(jù)流量的快速增長,將對數(shù)據(jù)接口 IP 提出更高要求,需要其在速度和延遲方面,尤其是云基礎(chǔ)架構(gòu)中都有顯著改善。本文將解釋在數(shù)據(jù)中心內(nèi)、數(shù)據(jù)中心之間、服務(wù)器內(nèi)以及 SoC 內(nèi)等,加速數(shù)據(jù)傳輸和管理的技術(shù)發(fā)展。
圖 1:2030 年之前的總體數(shù)據(jù)流量預測。來源:《人工智能對于電子和半導體行業(yè)的影響》,IBS,2020 年 4 月。
數(shù)據(jù)中心內(nèi)部和數(shù)據(jù)中心之間的長距離數(shù)據(jù)移動
當今,大多數(shù)大型數(shù)據(jù)中心都使用 100Gbps 以太網(wǎng)基礎(chǔ)架構(gòu),數(shù)據(jù)跨越長距離(例如,在機架和數(shù)據(jù)中心之間)進行傳輸。長距離傳輸架構(gòu)通常需要使用 4 個 25 Gbps 或 28 Gbps NRZ SerDes 連接通道。然而,隨著數(shù)據(jù)量的增長,需要速度更快的基礎(chǔ)架構(gòu)來維持數(shù)據(jù)傳輸。使用支持 PAM-4 編碼的 56 Gbps 和 112 Gbps SerDes IP,在目前正在部署的超大規(guī)模數(shù)據(jù)中心中,可實現(xiàn) 400Gbps 的以太網(wǎng)連接,并在未來會實現(xiàn)高達 800Gbps 的連接速度(圖 2)。主要的以太網(wǎng)交換機供應(yīng)商已經(jīng)在開發(fā)基于 112G SerDes IP 的 800Gbps 交換機,計劃在未來幾年內(nèi)推出 1.6Tbps 以太網(wǎng)(使用更快的新一代 SerDes),以滿足數(shù)據(jù)量不斷增長帶來的需求。
機架內(nèi)服務(wù)器之間的數(shù)據(jù)通信,由頂層 (ToR) 交換機和網(wǎng)絡(luò)接口卡 (NIC) 管理。過去幾年,云數(shù)據(jù)中心在該級別最常用的接口速度為 25Gbps。但是,隨著基礎(chǔ)架構(gòu)速度提高到 400Gbps,機架內(nèi)的以太網(wǎng)速度也提高到了 100Gbps。
隨著數(shù)據(jù)速率的提高,接口功耗(通常以“皮焦耳/位”為測量單位)和面積變得越來越重要。物理接口 (PHY) IP 具有明顯的優(yōu)勢,可最大限度地減少能耗,同時在所需距離內(nèi)可靠地提供數(shù)據(jù),從而可最大限度地降低基礎(chǔ)架構(gòu)的功耗和散熱成本。節(jié)省空間的硅 PHY 解決方案可最大限度地降低 SoC 成本,從而為 SoC 供應(yīng)商提高盈利能力。
圖 2:超大規(guī)模數(shù)據(jù)中心基礎(chǔ)架構(gòu)逐漸轉(zhuǎn)向采用 400+GbE
服務(wù)器內(nèi)部的數(shù)據(jù)傳輸
所有數(shù)據(jù)到達服務(wù)器后,就需要利用高速接口,在服務(wù)器內(nèi)部的設(shè)備之間高效移動這些數(shù)據(jù)。例如,當數(shù)據(jù)以 100Gbps 的速度到達 NIC 時,必須將其快速移動到存儲器、系統(tǒng)內(nèi)存,也可能移動到圖形或 AI 加速器,以進行處理。PCI Express (PCIe)、Computer Express Link (CXL) 和類似協(xié)議在這一方面具有優(yōu)勢。為了應(yīng)對流量的快速增長,PCI-SIG 于 2019 年發(fā)布了 PCIe 5.0,帶寬比上一代產(chǎn)品翻倍,并力爭在 2021 年發(fā)布 PCIe 6.0,再次使 PCIe 數(shù)據(jù)速率翻倍,達到 64 GT/s(每個 x16 卡的速率高達 128GB/s)(圖 3)。
圖 3:PCI Express 每個通道的帶寬升級過程。來源:PCWorld
近來,由計算系統(tǒng)生成和處理的數(shù)據(jù)量(尤其是非結(jié)構(gòu)化數(shù)據(jù))持續(xù)增長,已促使了新架構(gòu)的產(chǎn)生,新架構(gòu)通常采用加速器來加快數(shù)據(jù)處理。將數(shù)據(jù)從一個處理器域復制到另一個處理器域是一個資源密集型過程,這會顯著增加數(shù)據(jù)處理的延遲。緩存相干解決方案讓處理器和加速器共享內(nèi)存,而無需將數(shù)據(jù)從一個內(nèi)存空間復制到另一個內(nèi)存空間,從而節(jié)省了復制數(shù)據(jù)所需的內(nèi)存資源和時間。
CXL 是一種緩存相干協(xié)議,利用 PCIe 的數(shù)據(jù)速率和 PCIe 物理層,使 CPU 和加速器能夠訪問彼此的內(nèi)存。在多個設(shè)備都需要訪問同一個數(shù)據(jù)集時,集成 CXL 協(xié)議可有效減少必須具有非相干協(xié)議的數(shù)據(jù)副本數(shù),從而減少系統(tǒng)內(nèi)所需的傳輸次數(shù)。減少數(shù)據(jù)副本數(shù),有助于降低系統(tǒng)中大量已預留的內(nèi)存和 IO 接口的負載。
與其他外設(shè)互連相比,用于高性能計算工作負載的 CXL 可顯著降低延遲。由于 cxl.cache 和 cxl.mem 事務(wù)的延遲僅為 50-80 納秒,因而在 PCIe 延遲中,CXL 延遲僅占一小部分。此外,CXL 通過使用資源共享提高性能并降低復雜性,這也降低了總體系統(tǒng)成本。
SoC 內(nèi)的 USR/XSR 數(shù)據(jù)移動
許多現(xiàn)代服務(wù)器 SoC 利用在單個 package 內(nèi)放置多個 Die,在符合設(shè)計和制造約束的范圍內(nèi)提供所需的性能。因此,需要高速 die-to-die (D2D) 通信以在芯片內(nèi)的 Die 之間傳遞大型數(shù)據(jù)集。超短距離/極短距離 (USR/XSR) SerDes 可實現(xiàn)這一傳遞,當前設(shè)計使用 112Gbps SerDes,并且在未來幾年內(nèi)可能會達到更高的速度。
使用 D2D 接口技術(shù)的多芯片模塊可處理多種用例。所有 D2D 用例都縮短了開發(fā)時間,并降低了開發(fā)和制造成本。有些情況使用多個異構(gòu) Die(即“小芯片”),它們利用可重復使用的功能組件,每個組件都使用最適合其特定功能的制造技術(shù)構(gòu)建。其他情況通過創(chuàng)建大型高性能 SoC 著重提高靈活性,此類 SoC 使用更小的同質(zhì)構(gòu)建模塊來提高良率和可擴展性。
圖 4:舉例展示 Die 間互連用例
總結(jié)
云數(shù)據(jù)的快速增長推動了對于更快、更高效接口的需求,以將云基礎(chǔ)架構(gòu)內(nèi)的數(shù)據(jù)從網(wǎng)絡(luò)和系統(tǒng)向下傳輸?shù)叫酒墧?shù)據(jù)通信中。新推出和正在開發(fā)的接口技術(shù)(包括 400Gbps 和更快的以太網(wǎng)、PCIe 6.0 和 CXL 外設(shè)互連技術(shù),以及用于 Die 間通信的新型高速 SerDes)可實現(xiàn)必要的基礎(chǔ)架構(gòu)改善,以支持不斷提高的云數(shù)據(jù)需求。
新思科技的 DesignWare? 高速 SerDes 和以太網(wǎng) IP 支持實現(xiàn)新一代數(shù)據(jù)中心網(wǎng)絡(luò)解決方案。DesignWare PCIe IP 是一種穩(wěn)定成熟的技術(shù),在 90% 的領(lǐng)先的半導體公司得到應(yīng)用,為實現(xiàn) DesignWare CXL IP 奠定了基礎(chǔ)。DesignWare 112G USR/XSR SerDes IP 為多 Die SoC 提供低成本、節(jié)能的 die-to-die 接口。新思科技提供經(jīng)過硅驗證且品類齊全的 DesignWare 接口 IP 產(chǎn)品組合,同時提供開發(fā)高速、低功耗、高度可靠的 SoC 所需的設(shè)計和驗證工具,以支持當今和未來云基礎(chǔ)架構(gòu)不斷提高的數(shù)據(jù)移動需求。
-
接口
+關(guān)注
關(guān)注
33文章
8612瀏覽量
151286 -
soc
+關(guān)注
關(guān)注
38文章
4173瀏覽量
218381
發(fā)布評論請先 登錄
相關(guān)推薦
評論