英特爾公司高級副總裁兼加速計算系統和圖形事業部總經理 Raja M. Koduri
英特爾推出兩大x86 CPU內核、兩大數據中心SoC、兩款獨立GPU,以及變革性的客戶端多核性能混合架構
架構是硬件和軟件的“煉金術”。它融合特定計算引擎所需的先進晶體管,通過領先的封裝技術將它們連接,集成高帶寬和低功耗緩存,在封裝中為混合計算集群配備高容量、高帶寬內存和低時延、可擴展互連,并確保所有軟件無縫地加速。披露面向新產品的架構創新,是英特爾架構師在每年架構日上的期許,今年舉辦的第三屆英特爾架構日令人十分興奮。
今天,英特爾公布了英特爾?架構在近年來重大的改變和創新。 這包括:第一次深入介紹了英特爾首個性能混合架構Alder Lake,其搭載兩款新一代x86內核以及智能英特爾?硬件線程調度器;英特爾全新引領行業標準的數據中心架構Sapphire Rapids,其搭載全新的性能核以及多種加速器引擎;英特爾全新的獨立游戲圖形處理器(GPU)架構;英特爾全新的基礎設施處理器(IPU)以及超凡的數據中心GPU架構Ponte Vecchio,其具備英特爾迄今為止最高的計算密度。
架構突破為英特爾的下一波領先產品奠定基礎,率先推出的是Alder Lake。隨著從臺式機到數據中心的工作負載愈發龐大、愈發復雜、愈發多樣,英特爾在架構日上展示的突破展現了架構將如何滿足對更高計算性能的需求。
架構師們奮力而行,結合英特爾獨特、豐富的標量、矢量、矩陣和空間計算引擎,打造混合計算架構,為客戶的高需求工作負載提供非線性處理能力。
能效核:一個高度可擴展的x86微架構,它能滿足客戶從低功耗移動應用到多核微服務的全方位計算需求。對比英特爾迄今為止最多產的CPU微架構——Skylake,能效核可在相同功耗下提升40%的單線程性能,或者在提供同樣性能時,功耗僅為Skylake的40%不到。1就吞吐量性能而言,與運行四個線程的兩個Skylake內核相比,四個能效核在性能提升80%的同時功耗更低,或者在提供相同吞吐量性能時,功耗降低80%。1
性能核:它不僅是英特爾迄今為止性能最高的CPU內核,而且在CPU架構性能方面實現階梯式提升,推動未來十年的計算發展。它是一個更寬、更深、更智能的架構,展現出更高的并行性,提高執行并行性,降低時延,提升通用性能。它還幫助支持大數據集和大型代碼體積的應用程序。與第11代酷睿架構(Cypress Cove內核)相比,相同頻率下,性能核在一系列工作負載上平均提升了約19%。1
針對數據中心處理器和機器學習的發展趨勢,性能核提供了專用硬件,包括新的英特爾高級矩陣擴展(AMX)來執行矩陣乘法運算,以獲得數量級的性能——AI加速提升約8倍。這是為軟件易用性而設計,利用了x86編程模型。
英特爾硬件線程調度器:這是英特爾開發的獨特調度方法,旨在確保將能效核和性能核無縫銜接在一起,從開始就動態、智能地分配工作負載,從而優化系統以在真實場景中實現更高的性能和效率。智能直接置于內核,英特爾硬件線程調度器與操作系統無縫配合,在合適的時間把合適的線程分配給合適的內核。
Alder Lake:它重構了多核架構,是英特爾首個搭載全新英特爾硬件線程調度器的性能混合架構。它是英特爾最智能的客戶端SoC架構,結合了能效核和性能核,適用于從移動端到臺式機的產品,并通過多種業界領先的I/O和內存而引領行業變革。基于Alder Lake的產品將在今年開始出貨。
XeHPG和Alchemist SoC:一款全新的獨立顯卡微架構,專為游戲和創作工作負載提供發燒友級別的性能。XeHPG微架構采用新的Xe內核,聚焦計算、可編程、可擴展,并全面支持DirectX 12 Ultimate。Xe內核中的全新矩陣引擎(XeMatrix eXtensions,XMX)能夠加速AI工作負載,比如XeSS,是一項全新升頻技術(upscaling technology),可以實現高性能、高保真游戲體驗。基于XeHPG的Alchemist SoC(之前代號為DG2)將于2022年第一季度上市,并采用新的品牌名英特爾?銳炫?。
Sapphire Rapids:它結合了英特爾的性能核與全新加速器引擎,樹立了下一代數據中心處理器的標準。Sapphire Rapids的核心是一個模塊化的分區SoC架構,得益于英特爾的EMIB多晶片互連封裝技術和先進網格架構,它具有顯著的可擴展性,同時仍保持單晶片CPU接口的優勢。
基礎設施處理器(IPU):Mount Evans是英特爾首款專用ASIC IPU,以及全新的基于FPGA的IPU參考平臺——Oak Springs Canyon。通過基于英特爾IPU的架構,云服務提供商(CSPs)可以通過把基礎設施任務從CPU轉移到IPU,從而讓數據中心收益更大化。把基礎設施任務轉移到IPU,能夠讓云服務提供商(CSPs)可以把所有的服務器CPU租給客戶。
XeHPC, Ponte Vecchio:Ponte Vecchio是英特爾迄今為止最復雜的SoC,也是英特爾踐行IDM 2.0戰略的絕佳示例,它采用多種先進的半導體制程工藝、英特爾變革性的EMIB技術以及Foveros 3D封裝技術。這是英特爾實現堪比登月難度創新后的一款產品,它包含1000億個晶體管,提供業界領先的浮點運算和計算密度,以加速人工智能、高性能計算和高級分析工作負載。在架構日上,英特爾展示了早期的Ponte Vecchio芯片就已經顯示出領先的性能,在一個流行的AI基準測試上創造了推理和訓練吞吐量的行業紀錄。1英特爾的A0芯片已經實現了超過每秒45萬億次浮點運算的FP32吞吐量,超過5 TBps的持續內存結構帶寬以及超過 2 TBps的連接帶寬。如Xe架構一樣,Ponte Vecchio將由oneAPI支持,后者是英特爾一個開放、基于標準、跨架構、跨供應商的統一軟件堆棧。
回望過去一年,科技處于所有人如何溝通、工作、娛樂和應對新冠肺炎疫情的核心。事實證明,強大的計算能力至關重要。展望未來,我們面臨龐大的算力需求,預計到2025年將是1000x(千倍級)的提升,而四年內增加1,000倍相當于摩爾定律的5次方。
英特爾CEO帕特·基辛格也是一位架構師,他說:“我們面臨艱巨的計算挑戰,一定要通過變革性的架構和平臺來解決……正是英特爾才華橫溢的架構師和工程師們,讓這些技術‘魔法’得以成真。”
世界正依賴架構師和工程師來解決艱巨無比的計算問題,以造福人類。這就是為什么英特爾的戰略和執行不斷加速以滿足所需,疾步前行。
fqj
-
英特爾
+關注
關注
61文章
9953瀏覽量
171700 -
計算
+關注
關注
2文章
449瀏覽量
38790
發布評論請先 登錄
相關推薦
評論