圖:英特爾市場營銷集團副總裁、中國區數據中心銷售總經理兼中國區運營商銷售總經理 莊秉翰
至強處理器的發展歷程
作為數據中心平臺和解決方案的技術引領者,英特爾產品為全球的客戶和行業伙伴提供了堅實的算力基礎。目前,至強處理器的安裝量已超過一億——從運行IT服務的本地服務器其中包括全新的即服務商業模式,到管理互聯網流量的網絡設備,再到進行邊緣計算的無線基站和云服務等。
自2017年Intel推出第一款至強和擴展處理器以來,英特爾已經向全球客戶交付了超過8,500萬顆的至強可擴展處理器,支持了全世界數據中心。在過去2年,第三代至強可擴展處理器已經在全球累計出貨1,500萬顆。
圖:英特爾市場營銷集團副總裁兼中國區總經理 王稚聰
英特爾市場營銷集團副總裁兼中國區總經理王稚聰表示:“中國5G網絡建設具有重大的意義,使得網絡和計算逐漸融為一體,使得感知、計算、數據、存儲、數據中心得以實現無縫連接,由此在中國形成了一個巨大的網絡。國家提出“東數西算”,運營商朋友在做算力網絡的構建,都是在中國有非常宏大的構想,能夠把遠端的大型數據中心,以及算力逐漸蔓延到邊緣,以及網絡的智能調度、切片,以及前端的傳感統一調度起來。
由此之上建立的數據流,以及對工作負載平衡的處理,AI的各種加速,提供了一個非常豐富而充滿樂趣和創造力的環境。第四代英特爾至強可擴展處理器的發布,就是面對這樣的計算環境,助力合作伙伴新業務需求。”
七大神器助力第四代至強服務器打造超強能力
莊秉翰指出,第四代至強服務器芯片采用Intel7的制程工藝制造,具有全新的芯片架構,通過集成高性能和更多的內核數量,業內高需求的數據中心工作負載的相關加速器,以及業界領先的DDR5,CXL1.1,PCIe5.0和高帶寬內存,以提供高吞吐量、低時延性能,讓加速無所不在。
第四代至強服務器芯片
這些加速體驗體現在在全新的至強平臺所提供的七大算力神器。
- 加速深度學習,實時推理和訓練性能提升的Intel AMX加速器;
- 加速處理網絡數據系統及系統性的性能提升的Intel VOD加速器;
- 加速在存儲網絡工作負載中常見的流數據移動的Intel DSA加速器;
- 加速在數據分析工作負載中內存占用優化和查詢吞吐量的Intel IAA加速器;
- 加速在網絡吞吐量以及壓縮解壓縮功能的Intel QAT加速器;
- 加速平臺安全性能的Intel安全技術策略組合;
- 提供內置高帶寬內存的Intel至強CPU Max系列。
與前一代相比,第四代英特爾至強可擴展處理器通過內置加速器將目標工作負載的平均每瓦性能提升了2.9倍,在優化電源模式下每個CPU節能高達70瓦,并對性能只產生極低的影響,同時將總體擁有成本降低52%到66%。
可持續性
第四代英特爾至強可擴展處理器擁有豐富的內置加速器,意味著英特爾能夠提供平臺級的功率節省,并緩解對額外獨立加速方面的需求,幫助客戶實現可持續發展目標。此外,新的優化電源模式可以為某些工作負載帶來高達20%的插槽節能,而對性能的影響僅有不到5%11。風冷和液冷的創新進一步降低了數據中心的總能耗,且第四代至強可擴展處理器在英特爾工廠制造時,運用了超過90%的可再生電力,并同時配備了一流的水資源回收設施。
在AI方面,與前一代相比,通過內置英特爾高級矩陣擴展(英特爾AMX)加速器,第四代英特爾至強可擴展處理器將PyTorch實時推理和訓練性能提升了10倍5,6。第四代英特爾至強還將廣泛的AI工作負載的推理和訓練性能提升到新的高度。英特爾至強CPU Max系列在這些功能的基礎上針對自然語言處理進行了擴展,將大型語言模型的處理速度提升多達20倍12。借助英特爾的AI軟件套件,開發者可以使用自己選擇的AI工具,提高生產力并加快AI開發速度。該套件可以從工作站進行移植,使其可以在云中擴展,并一直擴展到邊緣。同時,該套件已經針對400多個機器學習和深度學習AI模型進行了驗證,涵蓋所有商業細分領域最常見的AI應用場景。
網絡
第四代英特爾至強包含一系列針對高性能、低時延網絡和邊緣工作負載進行了特別優化的處理器產品。對于如今電信、零售、制造和智慧城市等行業正在推動更加軟件定義的未來,這些處理器將發揮關鍵性基石作用。對于5G核心工作負載,內置加速器有助于提高吞吐量和降低時延,而電源管理的升級則提高了平臺的響應能力和能效。此外,與前幾代相比,第四代英特爾至強在不增加功耗的情況下提供多達兩倍的虛擬無線接入網(vRAN)容量。這使通信服務提供商能夠將每瓦性能提高一倍,滿足其關鍵的性能、擴展和能效需求。
科學計算
第四代英特爾至強可擴展處理器和英特爾Max系列產品具備可擴展、平衡的架構,其中整合了CPU、GPU和oneAPI的開放軟件生態系統,適用于科學計算和AI等領域要求嚴苛的計算工作負載,旨在幫助解決全球最具挑戰性的問題。
第四代英特爾至強內置英特爾AMX專屬AI加速器,大幅提升矩陣乘法運算,為人工智能加速提供了全新方式,與上一代(FP32)相比,內置英特爾高級矩陣擴展(英特爾AMX)(BF16)的PyTorch實時AI推理和訓練性能提高了10倍。結合通用CPU計算單元,第四代英特爾至強可擴展處理器可以端到端運行任何AI工作負載。
英特爾至強CPU Max系列是集成高帶寬內存的x86處理器,能夠在無需變更代碼的情況下為科學計算工作負載加速。英特爾數據中心GPU Max系列提供極高的計算密度,且具有多種產品規格以滿足不同的客戶需求。
英特爾至強CPU Max系列可提供64GB的高帶寬內存(HBM2e),為科學計算和AI工作負載大幅提高了數據吞吐量。與第三代英特爾至強可擴展處理器的高端SKU相比,英特爾至強CPU Max系列可為如能源、地球系統建模等一系列實際應用提供高達3.7倍10的性能提升。
此外,英特爾數據中心GPU Max系列在單個產品上整合47個小芯片,集成了超過1000億個晶體管,為諸如物理、金融服務和生命科學等極具挑戰性的工作負載帶來更高的吞吐量。相較上一代產品,英特爾數據中心GPU Max系列和至強CPU Max系列的結合,可以使生命與材料科學領域LAMMPS處理性能提升12.8倍13。
合作案例分享
騰訊云星星海實驗室研發總監曾欽杵先生現場分享一下騰訊云與英特爾的合作狀況。
騰訊云在云服務器方面,基于英特爾最新的Sapphire Rapids CPU進行了全面升級,推出了騰訊云第七代云服務器,標準型的S7和內存型的M7這樣的云實例,這兩款產品全面應用了騰訊云和英特爾的全新軟硬件技術,充分發揮了目前產品的新特性,在計算、存儲和網絡多方面都做了全方位的性能提升。
騰訊云星星海自研服務器,基于Sapphire Rapids CPU可以提供先進的IO處理能力,包括目前最新一代的PCIe Gen 5,以及下一代IO接口標準CXL1.1,內存接口部分也從DDR4升級到了最新的DDR5內存接口。在存儲領域,可以提供高達100萬IOPS的存儲性能,通過傲騰持久內存的助力,我們可以實現端到端的存儲延時,達到40ms的級別,真正意義上達到了10納秒云存儲的新的性能指標。
在網絡配置方面,星星海自研服務器通過搭載騰訊自研的“銀杉”智能網卡,網絡性能可以提供高達5000萬PPS的網絡性能。面對不同的業務場景,Sapphire Rapids提供了多個全新的內嵌的加速器。
5G云網能力提升,Intel第四代至強處理器助陣
隨著5G網絡的廣泛應用,每一年移動數據流量增長50%,主要來自各種視頻內容的增長,占到了全部流量的66%。要支撐流量增長的要求,運營商需要極大地增加網絡容量和吞吐能力,加速網絡工作負載的系統級處理性能。
天翼云云網產品事業部的楊鑫分享了和英特爾的合作,解決運營商工作負載不斷提升的挑戰。
經過十年的發展,天翼云目前已經是全球最大的運營商云和國內最大的混合云。據IDC今年發布的報告,天翼云在公有云IaaS市場已經排名第三,成為國內一線云服務提供商。
中國電信和英特爾一起合作推出天翼云的第八代云主機,基于英特爾第四代英特爾至強可擴展處理器。基于英特爾的芯片架構,天翼云第八代彈性云主機可以支持128vCPU的大規格實例,支持8通道的DDR5內存,包括單條的內存帶寬高達4800MT/S,性能較上一代有大幅度提升。
基于第四代英特爾至強可擴展處理器的英特爾DLB的特性,天翼云有超過200萬的政企客戶,很多政企客戶除了提供普通的互聯網上云,對政企客戶我們重點提供了云專線、SD-WAN和VPN上云,而這個上云會采用IPSec加密隧道來做處理。傳統的方式對性能有較大的影響,特別是大帶寬的場景下,它是占據了某顆CPU的轉發能力,影響同CPU的其他業務量的傳輸,而造成丟包、擁塞的業務質量下降。而通過和英特爾的合作,天翼云利用CPU的英特爾DLB硬件加速特性,針對IPSec的大象流處理做了優化。相比之前的純軟件方案,英特爾DLB的加速方案穩定可靠,帶來了更好的線性擴展,最高可以達到4倍以上的吞吐收益,有效解決了在入云環節針對大象流加密處理的業務難題。
本文由電子發燒友原創,轉載請注明以上來源。微信號zy1052625525。需入群交流,請添加微信elecfans999,投稿爆料采訪需求,請發郵箱zhangying@elecfans.com。
-
intel
+關注
關注
19文章
3482瀏覽量
185920 -
數據中心
+關注
關注
16文章
4761瀏覽量
72033 -
5G
+關注
關注
1354文章
48436瀏覽量
563960 -
至強處理器
+關注
關注
0文章
23瀏覽量
9186
發布評論請先 登錄
相關推薦
評論