繼英特爾發(fā)布全新一代AI加速芯片Gaudi 3后,近日宣布將專為中國市場推出特別版本—HL-328及HL-388兩款硬件產(chǎn)品。這兩款硬件均兼容OAM相容夾層卡與PCle加速卡兩種形式。
據(jù)官方透露,Gaudi 3的白皮書中詳細描述了這兩款硬件的上市時間表,分別是6月24日的HL-328以及9月24日的HL-388。
在硬件規(guī)格方面,中國版Gaudi 3與原版保持一致,同樣具備96MB SRAM片上存儲、128GB HBM2e高帶寬存儲,帶寬高達3.7TB/s,并配備PCIe 5.0 x16接口和解碼標準。然而,受美國對AI芯片出口管制規(guī)定影響,該款芯片的綜合運算性能(TPP)需控制在4800以下方可出口至中國,這意味著中國版Gaudi 3的16位性能不得超過150 TFLOPS。
據(jù)英特爾數(shù)據(jù)顯示,Gaudi 3在FP16/BF16計算模式下可實現(xiàn)1835 TFLOPS,較之英偉達H100在大模型訓練速度提升40%,推理效率提高50%。
顯而易見,為了符合出口規(guī)定,中國版Gaudi 3必須大幅度降低AI性能。為此,中國版Gaudi 3可能會減少核心數(shù)量(原版包含8個矩陣數(shù)學引擎和64個張量內(nèi)核)和降低工作頻率。
-
英特爾
+關注
關注
61文章
9949瀏覽量
171694 -
存儲
+關注
關注
13文章
4296瀏覽量
85800 -
sram
+關注
關注
6文章
767瀏覽量
114675
發(fā)布評論請先 登錄
相關推薦
評論