圖:英特爾公司高級副總裁兼加速計算系統(tǒng)和圖形事業(yè)部總經(jīng)理Raja Koduri
為什么英特爾會如此看中高性能計算?Gartner的調(diào)查揭示,2020年全球半導(dǎo)體市場的總價值達到4500億美元,其中計算市場擁有2390億美元,大約占到整個市場的一半以上,涵蓋微處理器、控制器、專用集成電路和FPGA等關(guān)鍵技術(shù)。2021年這個市場還在高速增長,作為全球半導(dǎo)體領(lǐng)域最大的IDM廠商,英特爾的混合計算架構(gòu)、先進工藝、封裝能力和IDM2.0規(guī)劃都為在這一市場展現(xiàn)領(lǐng)導(dǎo)者地位做了最好的背書。
針對PC端的計算需求,到繪圖處理的計算需求,英特爾在架構(gòu)日活動當(dāng)天給出了一系列的解決方案。
英特爾公司高級副總裁兼加速計算系統(tǒng)和圖形事業(yè)部總經(jīng)理Raja Koduri攜手多位英特爾架構(gòu)師,全面介紹了兩種全新x86內(nèi)核架構(gòu)的詳情;英特爾首個性能混合架構(gòu),代號“Alder Lake”,以及智能的英特爾硬件線程調(diào)度器。對全球數(shù)十億的PC用戶來說,Alder Lake是全新的高性能混合架構(gòu)客戶端CPU,它用兩款不同的x86內(nèi)核和革命性的硬件線程調(diào)度器徹底革新了英特爾的多核架構(gòu)。
x86性能核,是英特爾迄今為止性能最高的CPU內(nèi)核,搭載內(nèi)置AI加速技術(shù),實現(xiàn)了更快、更寬、更智能、更深,面向最高性能和通用計算而設(shè)計,在單線程應(yīng)用中突破了低時延極限。全新的x86能效核,為規(guī)模化處理而設(shè)計,旨在推動每瓦多核性能突破極限。相比目前的第11代英特爾酷睿處理器架構(gòu)(Cypress Cove),在通用性能的ISO頻率下,針對大范圍的工作負載實現(xiàn)了平均約19%的改進。
x86能效核,旨在面對當(dāng)今多任務(wù)場景,提高吞吐量效率并提供可擴展多線程性能。該架構(gòu)致力通過低電壓能效核降低整體功率消耗,為更高頻率運行提供功率熱空間。這也讓能效核提升性能,以滿足更多動態(tài)任務(wù)負載。相比英特爾最多產(chǎn)的CPU內(nèi)核Skylake,在單線程性能下,能效核能夠在相同功耗下實現(xiàn)40%的性能提升。
英特爾中國研究院副總裁、英特爾中國研究院院長宋繼強表示,對于半導(dǎo)體產(chǎn)品考察,PPA(性能、功耗和面積)已經(jīng)成為三個非常重要的指標。Alder Lake(第12代酷睿)相對于第11代酷睿架構(gòu),達到同樣的性能,新架構(gòu)只需要40%的能耗,2.5倍的能效比。
Alder Lake基于 Intel 7制程工藝打造而成,支持最新內(nèi)存和最快I/O。Alder Lake將提供驚人的性能,支持從超便攜式筆記本,到發(fā)燒級,到商用臺式機的所有客戶端設(shè)備,它采用了單一、高度可擴展的SoC架構(gòu),提供三類產(chǎn)品設(shè)計形態(tài):
?高性能、雙芯片、插座式的臺式機處理器 ,具有領(lǐng)先性能和能效。支持高規(guī)格的內(nèi)存和I/O
?高性能筆記本處理器,采用BGA 封裝,并加入圖像單元,更大的 Xe 顯卡和Thunderbolt 4 連接
?輕薄、低功耗的筆記本處理器,采用高密度的封裝,配置優(yōu)化的I/O和電能傳輸
在高端顯卡領(lǐng)域,目前是兩家瓜分主要市場,英特爾向高端獨立顯卡市場發(fā)起了攻勢。這次架構(gòu)日,英特爾公布了打造獨立顯卡新品牌“Intel Arc”使用的繪圖處理芯片,公開與臺積電合作的新細節(jié),將使用臺積電的5納米、7納米和6納米制程,打造獨立顯卡新品牌“Intel Arc”使用的繪圖處理芯片,包括新芯片Ponte Vecchio與繪圖芯片Alchemist。
“PC 游戲玩家已達到 15 億人。我們當(dāng)前致力于為游戲玩家和創(chuàng)作者提供更好的體驗,不僅包括硬件方面的創(chuàng)新和豐富選擇,還有開放可用的軟件和工具。”英特爾發(fā)言人Arik指出。
Xe HPG是一款全新的獨立顯卡微架構(gòu),專為游戲和創(chuàng)作工作負載提供發(fā)燒級的高性能。Xe HPG微架構(gòu)為Alchemist系列SoC提供動力,首批相關(guān)產(chǎn)品將于2022年第一季度上市,并采用新的品牌名——英特爾銳炫。 Xe HPG微架構(gòu)采用全新的Xe內(nèi)核,是一款聚焦計算、可編程且可擴展的元件,沒有AI加速能力。客戶端顯卡路線圖包括 Alchemist(此前稱之為DG2)、Battlemage、Celestial和Druid SoC。
XeSS 利用Alchemist的內(nèi)置XMX AI加速,帶來了一種可實現(xiàn)高性能和高保真視覺的全新升頻技術(shù)。其使用深度學(xué)習(xí)來合成非常接近原生高分辨率渲染質(zhì)量的圖像。憑借XeSS,那些只能在低畫質(zhì)設(shè)置或低分辨率下玩的游戲也能在更高畫質(zhì)設(shè)置和分辨率下順利運行。現(xiàn)場,英特爾展示了 4k 實時渲染演示,實際上,引擎渲染較小的 1080p 渲染目標,XeSS 再將其放大到 4k與原生 4k 渲染相比,并沒有明顯的質(zhì)量損失。使用 XeSS 從 1080p 放大升級到 4k,可提供與原生 4k 渲染相同水平的畫質(zhì)。
為了解決大小核調(diào)度問題,Intel發(fā)明了新的“Thread Director”(線程調(diào)度器),并與微軟全力合作,搭配Windows 11的任務(wù)調(diào)度器,將合適的負載分配給不同核心、線程。
12代酷睿都嵌入了一個微控制器,負責(zé)監(jiān)視每個線程的性質(zhì)和性能需求,衡量其載入、存儲、分支、內(nèi)存訪問延遲、指令類型等,然后報告給Windows 11系統(tǒng)調(diào)度器,由后者結(jié)合運行環(huán)境,將此線程分配到最合適的核心。
Intel宣稱,該技術(shù)可以在最短30微秒的時間里確定一個線程的性質(zhì)、歸屬,而傳統(tǒng)的系統(tǒng)調(diào)度器需要上百甚至幾百微秒,還可能分配錯誤。另外,Thread Director還會針對性地優(yōu)化頻率,尤其是在移動端,保證效率的同時還能提高能效,而且可以在微秒級別調(diào)整頻率。
本文為原創(chuàng)文章,作者章鷹,微信號zy1052625525,轉(zhuǎn)載請注明以上來源。如需入群交流,請?zhí)砑游⑿舉lecfans999,投稿發(fā)郵件到huangjingjing@elecfans.com.
-
英特爾
+關(guān)注
關(guān)注
61文章
9978瀏覽量
171923 -
異構(gòu)集成
+關(guān)注
關(guān)注
0文章
34瀏覽量
1894
發(fā)布評論請先 登錄
相關(guān)推薦
評論