英特爾近期震撼發布了專為AI工作負載設計的Gaudi3加速器,這款新芯片雖在速度上不及英偉達熱門型號H100與H200 GPU,但英特爾巧妙地將競爭優勢聚焦于其更為親民的價格與總擁有成本(TCO)上。
Gaudi3處理器采用雙芯片設計,內置強大的計算單元,包括64個張量處理器核心(TPC,配備256x256 MAC結構并集成FP32累加器)、8個高效的矩陣乘法引擎(MME,支持256位寬矢量處理)以及高達96MB的片上SRAM緩存,提供驚人的19.2TB/s帶寬。此外,它還集成了24個200GbE網絡接口和14個媒體引擎,后者能夠高效處理多種視頻編解碼格式,如H.265、H.264、JPEG和VP9,為視覺處理應用增添強大助力。內存方面,Gaudi3搭載了128GB HBM2E內存,通過八個內存堆棧實現高達3.67TB/s的帶寬,確保數據處理的高效流暢。
相較于前代產品Gaudi2,Gaudi3在架構上進行了顯著優化,盡管在TPC和MME數量上有所精簡,但它專注于提升特定精度下的計算能力,僅支持FP8矩陣運算及BFloat16矩陣和矢量運算,這一調整旨在更好地滿足當前AI工作負載的需求。
在性能表現上,Gaudi3提供了高達1856 TFLOPS的BF16/FP8矩陣運算能力,以及28.7 TFLOPS的BF16矢量運算能力,同時其熱設計功耗(TDP)約為600W。盡管在某些指標上略遜于英偉達H100,但英特爾強調,Gaudi3在實際應用中的性價比優勢將尤為突出。
英特爾為Gaudi3制定了明確的市場定位,旨在與AMD的Instinct MI300系列及英偉達的H100、B100/B200等高端芯片展開競爭。據英特爾透露,基于8個Gaudi3芯片的加速器套件定價為125,000美元,單芯片成本約為15,625美元,相較于英偉達H100的30,678美元售價,展現了顯著的價格優勢。然而,面對可能具備更強性能的英偉達Blackwell架構GPU(如B100/B200),英特爾能否持續保持其競爭優勢,仍需市場進一步驗證。
英特爾執行副總裁Justin Hotard表示:“AI需求的激增正驅動數據中心領域的深刻變革,行業迫切需要更多元化的硬件、軟件及開發工具選擇。通過推出搭載P核與Gaudi3 AI加速器的Xeon 6,英特爾正積極構建一個開放的生態系統,助力客戶以更高的性能、效率和安全性應對各種工作負載。”
目前,Gaudi3 AI加速器已通過IBM Cloud及英特爾Tiber開發者云平臺提供服務,并計劃于今年第四季度通過戴爾、慧與(HPE)和Supermicro等合作伙伴全面上市,其中戴爾和Supermicro的部分系統將于10月開始出貨,而Supermicro的設備則將于12月抵達市場。
-
英特爾
+關注
關注
61文章
9949瀏覽量
171692 -
加速器
+關注
關注
2文章
796瀏覽量
37838 -
AI
+關注
關注
87文章
30728瀏覽量
268886
發布評論請先 登錄
相關推薦
評論