今年一月份,AMD在CES展會上揭開了一款名為 MI300X 的巨型數(shù)據(jù)中心芯片的面紗,作為即將來臨的新品的預(yù)告。如今,該芯片已經(jīng)正式亮相,這也意味著我們終于可以看到 AMD 為其巨無霸級數(shù)據(jù)中心/AI加速器GPU提供的首次基準(zhǔn)測試數(shù)據(jù)。果不其然,AMD 宣稱,無論你從哪個指標(biāo)去比較,MI300X 都可以擊敗英偉達(dá)的旗艦產(chǎn)品 H100 GPU。AMD 此前在 AI 領(lǐng)域并未有太大動作,現(xiàn)在 AI 巨頭之戰(zhàn)正式打響。
本周,AMD 在其 "推動 AI" 活動上發(fā)布了 MI300X GPU,并正式向英偉達(dá)的 H100 發(fā)起挑戰(zhàn)。AMD 宣稱,它的 MI300X GPU 在諸多方面優(yōu)于英偉達(dá)的 GPU,堪稱全球最快的AI加速器。例如,一份幻燈片顯示,與H100相比,MI300X提供了2.4倍的內(nèi)存容量,1.6倍的內(nèi)存帶寬,以及在FP8和FP16計算操作中分別提供了1.3倍的TFLOPS。在實際應(yīng)用中,這也意味著 MI300X 在特定任務(wù)中的速度會比 H100 快1.6倍。
AMD 首席執(zhí)行官 Lisa Su 舉例說,在運行Bloom "吞吐量"(使用1760億參數(shù))的服務(wù)器平臺中,8塊MI300X芯片比HGX服務(wù)器中的8塊H100快60%,在"延遲提升"上,使用70億參數(shù)的Llama 2測試中也提高了40%。在單芯片對比中,AMD聲稱MI300X在FlashAttention-2和Llama 2等特定應(yīng)用中依然有高達(dá)20%的速度優(yōu)勢。Su還表示,在直接的LLM培訓(xùn)中,8塊MI300X GPU與HGX服務(wù)器中的H100持平,但是在推理性能上領(lǐng)先。
除了MI300X,AMD還宣布了其下一代軟件套件,以與英偉達(dá)的CUDA平臺競爭。該套件被命名為ROCm 6,并已更新以支持最新的大規(guī)模語言模型和AI應(yīng)用。更新后的套件提供了許多性能提升的改進(jìn),將提升AI相關(guān)任務(wù)的性能,但我們還需要等待基準(zhǔn)測試結(jié)果,看看它在實際應(yīng)用中的表現(xiàn)如何。
如今,AMD已正式步入高性能計算(HPC)領(lǐng)域,并攜正規(guī)的數(shù)據(jù)中心GPU,觀察其與英偉達(dá)主導(dǎo)地位的角逐將會相當(dāng)有趣。這場戰(zhàn)斗類似于游戲GPU領(lǐng)域中的角逐,英偉達(dá)已占據(jù)了絕大多數(shù)市場份額,AMD 正為爭奪剩余的市場而戰(zhàn)。然而,MI300X對英偉達(dá)的H100構(gòu)成了有力的競爭,甚至微軟的首席技術(shù)官最近都表示,他認(rèn)為AMD最終在這個市場上將非常有競爭力。然而,AMD真正面臨的挑戰(zhàn)是克服英偉達(dá)憑借CUDA在軟件上的主導(dǎo)地位,這的確是一項艱巨的任務(wù)。
-
amd
+關(guān)注
關(guān)注
25文章
5466瀏覽量
134095 -
AI
+關(guān)注
關(guān)注
87文章
30728瀏覽量
268889 -
英偉達(dá)
+關(guān)注
關(guān)注
22文章
3770瀏覽量
90989 -
H100
+關(guān)注
關(guān)注
0文章
31瀏覽量
287
發(fā)布評論請先 登錄
相關(guān)推薦
評論