除了Zen CPU架構(gòu)和RDNA客戶端GPU架構(gòu)的更新,AMD最近還更新了他們的CDNA服務(wù)器GPU架構(gòu)和相關(guān)的Instinct產(chǎn)品路線圖。在接下來的兩年里,CPU和客戶端GPU的發(fā)展可以說是一帆風(fēng)順,而AMD則打算大幅調(diào)整其服務(wù)器端GPU產(chǎn)品。
讓我們先從AMD的服務(wù)器GPU架構(gòu)路線圖開始。繼AMD公司目前的CDNA 2架構(gòu)之后,MI200系列Instinct加速器將采用CDNA 3架構(gòu)。與AMD的其他路線圖不同的是,該公司此次并沒有提供兩年的路線圖。同時(shí),服務(wù)器GPU路線圖只推出到2023年,AMD的下一個(gè)服務(wù)器GPU架構(gòu)將于明年推出。
我們對(duì)CDNA 3的第一次了解發(fā)現(xiàn)了很多細(xì)節(jié)。AMD透漏了從架構(gòu)到有關(guān)產(chǎn)品的一些基本信息——由CPU和GPU小芯片組成的數(shù)據(jù)中心APU。
綜上所述,基于CDNA 3架構(gòu)的GPU將建立在5納米工藝上。就像之前的基于CDNA 2的MI200加速器一樣,它將依賴小芯片將內(nèi)存、緩存和處理器內(nèi)核全部組合在一個(gè)封裝中。值得注意的是,AMD稱之為“3D芯片”設(shè)計(jì),這意味著不僅小芯片堆疊在基板上,而且其他芯片也將堆疊在小芯片之上,就像AMD為Zen 3 CPU設(shè)計(jì)的V-Cache一樣。
這種比較在這里特別適用,因?yàn)锳MD將把它的無限緩存技術(shù)引入到CDNA 3架構(gòu)中。而且,就像上面的V-Cache的例子一樣,從AMD的設(shè)計(jì)來看,他們會(huì)將緩存和邏輯堆疊成獨(dú)立的芯片,而不是像他們的客戶端GPU那樣將其集成到一個(gè)整體芯片中。由于這種堆疊的特性,CDNA 3的無限緩存芯片將位于處理器芯片之下,AMD似乎將非常耗電的邏輯芯片放在堆棧的頂部,以便有效冷卻。
CDNA 3也將采用AMD的第四代無限架構(gòu)。對(duì)于GPU來說,IA4與AMD的芯片創(chuàng)新是攜手并進(jìn)的。具體來說,它將使2.5D/3D堆疊芯片與IA一起使用,使一個(gè)包內(nèi)的所有芯片共享一個(gè)統(tǒng)一的、完全一致的存儲(chǔ)子系統(tǒng)。這相對(duì)IA3和目前的MI200加速器是一個(gè)巨大的飛躍,雖然提供了內(nèi)存一致性,但沒有統(tǒng)一的內(nèi)存地址空間。因此,盡管MI200加速器本質(zhì)上在一個(gè)封裝中充當(dāng)兩個(gè)GPU,但I(xiàn)A4將讓CDNA 3/MI300加速器作為單個(gè)芯片運(yùn)行。
AMD的圖表還顯示,HBM內(nèi)存再次在這里使用。AMD沒有具體說明HBM的版本,但考慮到2023年的時(shí)間框架,很有可能會(huì)是HBM3。
在架構(gòu)上,AMD也將采取一些措施來改善其高性能加速器的AI性能。據(jù)該公司稱,他們正在增加對(duì)新的混合精確數(shù)學(xué)格式的支持。雖然還沒有明確說明,但AMD在AI工作負(fù)載中的每瓦性能提升超過5倍,這強(qiáng)烈暗示AMD正在為CNDA 3顯著改造和擴(kuò)展其矩陣內(nèi)核,因?yàn)?倍的性能遠(yuǎn)遠(yuǎn)超過了單是芯片改進(jìn)所能提供的性能。
MI300: AMD的第一款分塊數(shù)據(jù)中心APU
但是AMD不會(huì)止步于僅僅建造一個(gè)更大的GPU,他們也不會(huì)僅僅為了讓GPU在共享內(nèi)存池中工作而統(tǒng)一多芯片架構(gòu)的內(nèi)存池。相反,AMD的野心遠(yuǎn)不止于此。有了高性能的CPU和GPU核心,AMD在集成方面邁出了下一步,正在構(gòu)建一個(gè)分體式的數(shù)據(jù)中心APU——一種將CPU和GPU核心結(jié)合到單個(gè)封裝中的芯片。
數(shù)據(jù)中心APU目前的代號(hào)是MI300,AMD已經(jīng)為之努力了一段時(shí)間。MI200和Infinity Architecture 3允許AMD CPU和GPU在一個(gè)連貫的內(nèi)存架構(gòu)下一起工作,下一步是在封裝和內(nèi)存架構(gòu)方面將CPU和GPU進(jìn)一步結(jié)合在一起。
對(duì)于內(nèi)存問題來說,統(tǒng)一的架構(gòu)給MI300帶來了幾個(gè)主要的好處。從性能的角度來看,這通過消除冗余的內(nèi)存拷貝來改善問題;處理器不再需要將數(shù)據(jù)復(fù)制到自己專用的內(nèi)存池來訪問/修改數(shù)據(jù)。統(tǒng)一的內(nèi)存池還意味著不需要第二個(gè)內(nèi)存芯片池——在這種情況下,通常是連接到CPU的DRAM。
MI300將把CDNA 3GPU小芯片和Zen 4 CPU小芯片組合到一個(gè)處理器封裝中。反過來,這兩個(gè)處理器池將共享封裝HBM內(nèi)存。而且,大概還有無限緩存。
如前所述,AMD將大量利用小芯片來實(shí)現(xiàn)這一目標(biāo)。CPU內(nèi)核、GPU內(nèi)核、Infinity Cache和HBM都是不同的小芯片,其中一些將相互堆疊。因此,這將是不同于AMD之前制造的任何其他芯片的芯片,這將是AMD將芯片集成到他們的產(chǎn)品設(shè)計(jì)中所付出的最大努力。
與此同時(shí),AMD非常明確地表示,他們正在內(nèi)存帶寬和應(yīng)用延遲方面爭(zhēng)奪市場(chǎng)領(lǐng)導(dǎo)地位。如果AMD能做到這一點(diǎn),對(duì)公司來說將是一個(gè)重大的成就。話雖如此,他們并不是第一家將HBM與CPU內(nèi)核配對(duì)的公司,英特爾的Sapphire Rapids Xeon同樣使用了這種方法,所以我們將拭目以待MI300如何在這方面獲得優(yōu)勢(shì)。
至于更具體的AI性能問題,AMD聲稱APU將提供優(yōu)于MI250X加速器8倍的訓(xùn)練性能。這進(jìn)一步證明,與MI200系列相比,AMD將對(duì)其GPU矩陣內(nèi)核進(jìn)行一些重大改進(jìn)。
總體而言,AMD的服務(wù)器GPU發(fā)展軌跡與英特爾和英偉達(dá)在過去幾個(gè)月里公布的非常相似。這三家公司都在致力于CPU+GPU產(chǎn)品的結(jié)合;NVIDIA推出了Grace Hopper (Grace + H100),Intel推出了Falcon Shores xpu (CPU + GPU混合搭配),現(xiàn)在MI300在單個(gè)封裝上同時(shí)使用了CPU和GPU芯片。在這三種情況下,這些技術(shù)的目標(biāo)都是將最好的CPU和最好的GPU結(jié)合起來,以應(yīng)對(duì)不受兩者約束的工作負(fù)載。就AMD而言,該公司相信他們擁有最好的CPU和最好的GPU。
在接下來的幾個(gè)月里,我們有望看到更多關(guān)于CDNA 3和MI300的信息。
審核編輯 :李倩
-
amd
+關(guān)注
關(guān)注
25文章
5516瀏覽量
135018 -
gpu
+關(guān)注
關(guān)注
28文章
4830瀏覽量
129778 -
服務(wù)器
+關(guān)注
關(guān)注
12文章
9425瀏覽量
86494
原文標(biāo)題:GPU+CPU=AMD MI300數(shù)據(jù)中心APU!
文章出處:【微信號(hào):SSDFans,微信公眾號(hào):SSDFans】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
英特爾數(shù)據(jù)中心CPU銷量降至14年最低
AMD數(shù)據(jù)中心業(yè)務(wù)收入超越Intel

怎樣保障數(shù)據(jù)中心不間斷電源不斷電 提供可靠安全的供配電#數(shù)據(jù)中心
新加坡電信與日立深化合作,共推數(shù)據(jù)中心與GPU云技術(shù)

在數(shù)據(jù)中心使用智能負(fù)載組是個(gè)好主意#負(fù)載 #負(fù)載組

數(shù)據(jù)中心布線標(biāo)準(zhǔn)有什么
英偉達(dá)數(shù)據(jù)中心GPU出貨量飆升,市場(chǎng)份額持續(xù)領(lǐng)跑
英偉達(dá)去年數(shù)據(jù)中心GPU出貨量占比約98%
蘋果正在開發(fā)用于數(shù)據(jù)中心的AI芯片
蘋果正在研發(fā)全新數(shù)據(jù)中心AI芯片
數(shù)據(jù)中心布線光纜設(shè)計(jì)方案



評(píng)論