在2021年英特爾架構(gòu)日上,英特爾公司高級副總裁兼加速計算系統(tǒng)和圖形事業(yè)部總經(jīng)理Raja Koduri宣布,英特爾在高性能計算領(lǐng)域?qū)崿F(xiàn)了三大突破。
“Sapphire Rapids是我們的下一代至強可擴展處理器。它能夠提供卓越的開箱即用的性能,為數(shù)據(jù)中心內(nèi)廣泛的工作負(fù)載和部署模式帶來增強功能。” 英特爾首席數(shù)據(jù)中心架構(gòu)師Sailesh表示,“Sapphire Rapids的基本架構(gòu)旨在實現(xiàn)彈性計算模型(如容器化微服務(wù))的突破性性能,以及在所有形式的以數(shù)據(jù)為中心的計算中快速擴展 AI 的使用。此外,Sapphire Rapids還提升了最先進(jìn)的內(nèi)存和I/O技術(shù)。”
“Sapphire Rapids和Ponte Vecchio都是超異構(gòu)計算的芯片,采用了不同的處理架構(gòu)設(shè)計,Sapphire Rapids里面核的種類沒有Ponte Vecchio多,相對簡單一些,聚焦服務(wù)器和云計算領(lǐng)域的計算需求,采用45微米制程,EMIB的封裝集成就可以;Ponte Vecchio更加激進(jìn),面對高端的超算中心,這個領(lǐng)域?qū)τ谛酒摹⒀舆t、計算能力要求很高,集成度就更高,基于臺積電先進(jìn)的N5制程工藝技術(shù),設(shè)計均被集成于Foveros封裝中,為提高功率和互連密度形成有源芯片的3D堆疊。我們和其他競爭對手的差別,主要在于我們有不同的技術(shù)架構(gòu)應(yīng)對不同的需求。” 英特爾中國研究院副總裁、英特爾中國研究院院長宋繼強解釋了高性能計算領(lǐng)域,英特爾兩款主要產(chǎn)品的技術(shù)優(yōu)勢和路線。
Sapphire Rapids:它結(jié)合了英特爾的性能核與全新加速器引擎,樹立了下一代數(shù)據(jù)中心處理器的標(biāo)準(zhǔn)。Sapphire Rapids的核心是一個模塊化的分區(qū)SoC架構(gòu),得益于英特爾的EMIB多晶片互連封裝技術(shù)和先進(jìn)網(wǎng)格架構(gòu),它具有顯著的可擴展性,同時仍保持單晶片CPU接口的優(yōu)勢。
Sapphire Rapids的核心是一個分區(qū)塊、模塊化的SoC架構(gòu),采用英特爾的嵌入式多芯片互連橋接(EMIB)封裝技術(shù),在保持單晶片CPU接口優(yōu)勢的同時,具有顯著的可擴展性。Sapphire Rapids提供了一個單一、平衡的統(tǒng)一內(nèi)存訪問架構(gòu),每個線程均可完全訪問緩存、內(nèi)存和I/O等所有單元上的全部資源,由此實現(xiàn)整個SoC具有一致的低時延和高橫向帶寬。
Sapphire Rapids基于Intel 7制程工藝技術(shù),采用英特爾全新的性能核微架構(gòu),該架構(gòu)旨在提高速度,突破低時延和單線程應(yīng)用性能的極限。
基礎(chǔ)設(shè)施處理器(IPU):Mount Evans是英特爾首款專用ASIC IPU,以及全新的基于FPGA的IPU參考平臺——Oak Springs Canyon。通過基于英特爾IPU的架構(gòu),云服務(wù)提供商(CSPs)可以通過把基礎(chǔ)設(shè)施任務(wù)從CPU轉(zhuǎn)移到IPU,從而讓數(shù)據(jù)中心收益更大化。把基礎(chǔ)設(shè)施任務(wù)轉(zhuǎn)移到IPU,能夠讓云服務(wù)提供商(CSPs)可以把所有的服務(wù)器CPU租給客戶。
Ponte Vecchio基于Xe HPC微架構(gòu),提供業(yè)界領(lǐng)先的每秒浮點運算次數(shù)(FLOPs)和計算密度,以加速AI、HPC和高級分析工作負(fù)載。它是基于Intel 7制程工藝的大型芯片,針對Foveros技術(shù)進(jìn)行了優(yōu)化。
Ponte Vecchio是英特爾迄今為止最復(fù)雜的SoC,也是我們踐行IDM 2.0戰(zhàn)略的絕佳示例,它采用多種先進(jìn)的半導(dǎo)體制程工藝、英特爾變革性的EMIB技術(shù)以及Foveros 3D封裝技術(shù)。這是我們實現(xiàn)堪比登月難度創(chuàng)新后的一款產(chǎn)品,它包含1000億個晶體管,提供業(yè)界領(lǐng)先的浮點運算和計算密度,以加速人工智能、高性能計算和高級分析工作負(fù)載。在架構(gòu)日上,英特爾展示了早期的Ponte Vecchio芯片就已經(jīng)顯示出領(lǐng)先的性能,在一個流行的AI基準(zhǔn)測試上創(chuàng)造了推理和訓(xùn)練吞吐量的行業(yè)紀(jì)錄。
英特爾的A0芯片已經(jīng)實現(xiàn)了超過每秒45萬億次浮點運算的FP32吞吐量,超過5 TBps的持續(xù)內(nèi)存結(jié)構(gòu)帶寬以及超過 2 TBps的連接帶寬。如Xe架構(gòu)一樣,Ponte Vecchio將由oneAPI支持,后者是英特爾一個開放、基于標(biāo)準(zhǔn)、跨架構(gòu)、跨供應(yīng)商的統(tǒng)一軟件堆棧。
自從2020年12月發(fā)布第一個版本以來,超過20萬名開發(fā)者在獲得Xe HPC之前就已經(jīng)安裝了英特爾的oneAPI產(chǎn)品。多個領(lǐng)域的獨立軟件開發(fā)商已經(jīng)推出了超過300個采用oneAPI統(tǒng)一編程模型的應(yīng)用軟件。而且,英特爾有80多個支持Xe HPC的關(guān)鍵HPC應(yīng)用軟件、AI框架和中間件,它們利用oneAPI快速移植當(dāng)前基于CPU或CUDA的GPU實施。
回望過去一年,科技處于所有人如何溝通、工作、娛樂和應(yīng)對新冠肺炎疫情的核心。事實證明,強大的計算能力至關(guān)重要。展望未來,我們面臨龐大的算力需求,預(yù)計到2025年將是1000x(千倍級)的提升,而四年內(nèi)增加1,000倍相當(dāng)于摩爾定律的5次方。
英特爾CEO帕特·基辛格也是一位架構(gòu)師,他說:“我們面臨艱巨的計算挑戰(zhàn),一定要通過變革性的架構(gòu)和平臺來解決……正是英特爾才華橫溢的架構(gòu)師和工程師們,讓這些技術(shù)‘魔法’得以成真。”
本文為原創(chuàng)文章,作者章鷹,微信號zy1052625525,轉(zhuǎn)載請注明以上來源。如需入群交流,請?zhí)砑游⑿舉lecfans999,投稿發(fā)郵件到huangjingjing@elecfans.com.
-
英特爾
+關(guān)注
關(guān)注
61文章
9978瀏覽量
171858 -
臺積電
+關(guān)注
關(guān)注
44文章
5647瀏覽量
166596 -
超算
+關(guān)注
關(guān)注
1文章
115瀏覽量
9091
發(fā)布評論請先 登錄
相關(guān)推薦
評論