電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)在數(shù)據(jù)中心市場(chǎng),DDR5和CXL內(nèi)存正在成為廣泛采用的主流趨勢(shì)。預(yù)計(jì)2024年到2029年CXL內(nèi)存的采用將達(dá)到212%的年復(fù)合增長率。如今,現(xiàn)有出貨的半數(shù)服務(wù)器已經(jīng)支持CXL,預(yù)計(jì)未來幾年越來越多的服務(wù)器將實(shí)現(xiàn)對(duì)CXL的支持。
基于這一趨勢(shì),AMD宣布推出第二代AMD Versal Premium 系列,這款自適應(yīng)SoC平臺(tái)旨在面向各種工作負(fù)載提供最高水平系統(tǒng)加速。第二代 Versal Premium 系列將成為FPGA 行業(yè)首款在硬IP中采用 CXL3.1與 PCIe Gen6 并支持LPDDR5的器件。CXL 3.1 和 LPDDR5X 能助力更快速地釋放更多內(nèi)存,以滿足數(shù)據(jù)中心、通信以及測(cè)試測(cè)量市場(chǎng)中數(shù)據(jù)密集型應(yīng)用日益增長的實(shí)時(shí)處理和存儲(chǔ)需求。
近日,AMD自適應(yīng)與嵌入式計(jì)算事業(yè)部( AECG ) Versal產(chǎn)品營銷總監(jiān)Manuel Uhm,和高級(jí)產(chǎn)品線經(jīng)理Mike Rather與媒體交流,分享了第二代AMD Versal Premium系列自適應(yīng)SoC的特點(diǎn)細(xì)節(jié)和應(yīng)用趨勢(shì)等等。
創(chuàng)新設(shè)計(jì)
第二代AMD Versal Premium系列產(chǎn)品,基于第一代產(chǎn)品進(jìn)行了復(fù)用設(shè)計(jì),但針對(duì)I/O、收發(fā)器以及存儲(chǔ)/內(nèi)存的控制器、主機(jī)接口都做了創(chuàng)新。
AMD高管分析,DSP的計(jì)算密度方面,實(shí)現(xiàn)了更高的每平方毫米的DSP算力。另外引入了一個(gè)新的收發(fā)器GTM2,GTM2能夠支持的數(shù)據(jù)速率從1.25 Gb/s到128 Gb/s,同時(shí)還支持NRZ和PAM4編碼。保留了非常熟悉的設(shè)計(jì)流程,開發(fā)者可以使用GTM2,同時(shí)還確保全過程的可靠性。在I/O方面,增加對(duì)于高速M(fèi)IPI C-PHY和D-PHY接口的支持。第二代新加入的LDPC解碼器的模塊適用于高通量的解碼。
加速主機(jī)連接
第二代 Versal Premium 器件支持業(yè)界最快的主機(jī)接口CXL 3.1和PCIe Gen6,可實(shí)現(xiàn)行業(yè)領(lǐng)先的高帶寬主機(jī)CPU到加速器連接。
AMD高管表示,與主機(jī)連接使用的PCIe Gen 6和CXL 3.1都是64Gb/s的速率。與支持 PCIe Gen4或Gen5的FPGA 相比,PCIe Gen6 能提供2至4倍的線速率,而運(yùn)行 PCIe Gen6 的 CXL 3.1 在類似時(shí)延下則能提供使用CXL 2.1 器件的雙倍帶寬,以及增強(qiáng)的架構(gòu)和一致性功能。
在Versal Premium自適應(yīng)SoC和AMD EPYC CPU之間能夠形成非常好的協(xié)同。PCIe Express能夠提供Versal Premium和CPU之間非常高性能的連接,這可以用于卸載計(jì)算、網(wǎng)絡(luò)以及存儲(chǔ)工作負(fù)載。也能擁有非常連貫的接口,這樣Versal Premium和EPYC處理器就能夠共享內(nèi)存空間,從而減少擱置內(nèi)存。再加上PCIe IDE以及內(nèi)存DRAM的加密,數(shù)據(jù)能夠做到端到端的安全性。
釋放更多內(nèi)存
第二代 AMD Versal Premium 系列自適應(yīng)SoC能以至高8533 Mb/s的最快速LPDDR5存儲(chǔ)器連接加速存儲(chǔ)器帶寬,帶來更快速的數(shù)據(jù)傳輸和實(shí)時(shí)響應(yīng)。與采用 LPDDR4/5 存儲(chǔ)器的同類器件相比,這種超快的增強(qiáng)型DDR存儲(chǔ)器可將主機(jī)連接速度提升至高2.7倍。
第二代產(chǎn)品在DDR5和LPDDR5上支持的數(shù)據(jù)速率,是第一代產(chǎn)品支持的DDR4和LPDDR4的2倍。而且DDR5和LPDDR5相比DDR4和LPDDR4,消耗的功率有20%到30%的下降。
AMD高管表示,第一代Versal Premium系列產(chǎn)品關(guān)注的是在高安全性、高通量和帶寬的情況下加速網(wǎng)絡(luò)。第二代AMD Versal Premium除了像第一代那樣加速400G或者800G的網(wǎng)絡(luò)之外,增加了支持CXL內(nèi)存的分享和池化,因?yàn)槲覀儼l(fā)現(xiàn)在數(shù)據(jù)中心需要越來越多的內(nèi)存來支持大語言模型。
也可以說,第二代AMD Versal Premium助力計(jì)算,是通過更好地管理系統(tǒng)的內(nèi)存,這正是現(xiàn)在人工智能模型以及各種數(shù)據(jù)集成最需要的。
支持CXL 3.1存儲(chǔ)器擴(kuò)展模塊方面,專門針對(duì)CXL 3.1規(guī)范設(shè)計(jì)的存儲(chǔ)接口,可以和各家供應(yīng)商的DRAM實(shí)現(xiàn)兼容。至高 256x8.533 Gb/s 的 LPDDR5X存儲(chǔ)器帶寬,至高 16x 64 Gb/s 的 PCle Gen6 帶寬,使得總外部存儲(chǔ)器帶寬超過500 GB/S。
增強(qiáng)數(shù)據(jù)安全
在不斷變化的安全形勢(shì)下,增強(qiáng)數(shù)據(jù)安全性正變得日益重要。增強(qiáng)的安全功能有助于第二代 Versal Premium 系列在傳輸和靜態(tài)狀態(tài)下均可快速、安全地傳輸數(shù)據(jù)。其是業(yè)界首款在硬 IP 中提供集成 PCIe完整性和數(shù)據(jù)加密( IDE )支持的 FPGA 器件。硬核 DDR 內(nèi)存控制器內(nèi)置的內(nèi)聯(lián)加密可助力保護(hù)靜態(tài)數(shù)據(jù),而 400G 高速加密引擎則能幫助器件以至高 2 倍的線速率保護(hù)用戶數(shù)據(jù),從而實(shí)現(xiàn)更快速的安全數(shù)據(jù)事務(wù)。有了PCIe IDE加上高速加密引擎、DDR內(nèi)聯(lián)加密與ECC,數(shù)據(jù)無論是在傳輸中、靜態(tài)中、還是使用中都非常的安全。
應(yīng)用
在給出的應(yīng)用案例中,第二代產(chǎn)品能夠擴(kuò)大數(shù)據(jù)中心的CXL應(yīng)用范圍,CXL 3.1采用PCIe Gen 6協(xié)議,可以利用NUMA輕松與現(xiàn)有的軟件集成。
操作模式方面,能夠支持CXL.io、CXL.mem、CXL.cache。器件模式方面,第二代 Versal Premium 可以作為內(nèi)存的控制器,也可以使用主機(jī)模式,連接CXL擴(kuò)展模塊。在用例方面,支持多主機(jī)單邏輯設(shè)備(MH-SLD)架構(gòu)和系統(tǒng)可組合性。
自適應(yīng)網(wǎng)絡(luò)用于GPU集群和橫向擴(kuò)展方面,很多客戶都會(huì)購買并部署GPU集群,而標(biāo)準(zhǔn)的網(wǎng)絡(luò)接口卻未必能夠支持在這樣情境下GPU的性能和靈活性。而第二代AMD Versal Premium能夠提供很高的帶寬和靈活性,實(shí)現(xiàn)這方面的應(yīng)用需求?!斑@個(gè)應(yīng)用我們?cè)赩irtex UltraScale+ 和第一代Versal Premium也都支持過,但是現(xiàn)在第二代AMD Versal Premium系列能夠在單個(gè)網(wǎng)絡(luò)適配器上支持2個(gè)400G接口?!盇MD高管說道。
在測(cè)試與測(cè)量領(lǐng)域,開發(fā)PCIe Gen 7器件時(shí)測(cè)試儀器需求128 Gb/s的收發(fā)器,這些應(yīng)用非常重視芯片上的DSP引擎以及內(nèi)存帶寬和其他的接口能力。另外第二代AMD Versal Premium系列支持測(cè)試設(shè)備需要的C-PHY和D-PHY等協(xié)議。
工具和量產(chǎn)時(shí)間
AMD也在不斷地改善Vivado的開發(fā)環(huán)境,通過采用新的P&R算法,并且改善多線程的性能,增強(qiáng)的增量流,從而減少編譯時(shí)間。引入了用于頂層設(shè)計(jì)的RTL流程,以及用于GTM2的RTL流程等。改善QoR與易用性,通過工具引導(dǎo)的時(shí)序收斂,改進(jìn)的DFX流程,以及分段配置以便加快CPU啟動(dòng)時(shí)間和PCIe的喚醒。
第二代AMD Versal Premium系列產(chǎn)品表顯示有4種產(chǎn)品。從140萬邏輯單元到330萬邏輯單元不等,從3300到7600的DSP引擎不等,GTM2收發(fā)器從32個(gè)到72個(gè)不等,片上內(nèi)存、100G/600G以太網(wǎng)MAC、400G高速加密引擎、LDPC解碼器等也各有不同。
第二代AMD Versal Premium系列已經(jīng)向開發(fā)者提供早期文檔,AMD將于2024年第四季度提供功率估算工具,2025年下半年提供全套的AMD Vivado工具。2026年上半年將提供芯片的樣片以及開發(fā)套件,2026年中實(shí)現(xiàn)芯片量產(chǎn)。
-
AI
+關(guān)注
關(guān)注
87文章
30728瀏覽量
268886
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論