在利潤豐厚的服務器和HPC(高性能計算)處理器市場,英特爾的市場份額在很長一段時間都超過九成,但市場不總是一成不變。隨著AMD Epyc處理器的推出,以及Arm架構處理器進入這一市場,2020年英特爾難以避免他們帶來的競爭。但是,市場份額并不會迅速變化,英特爾x86處理器在未來五年甚至更長時間仍將主導這一市場,面對強有力的競爭者,能否守住這一市場,新產品變得更加重要。
高性能計算(HPC)市場已經連續多年增長。目前至少有三種架構的CPU可用于HPC任務,包括X86、Arm和Power,有超過六家可靠的供應商,還有兩種(即將成為三種)GPU架構。不過,目前該領域的絕大多數HPC系統還是由英特爾 CPU(有時是Nvidia GPU)提供算力。從今年開始,情況將開始改變。
近期內的變化可能會來自x86領域,AMD Epyc的勢頭將使英特爾面臨自Opteron(皓龍,AMD 2003年推出的64位處理器)時代以來最激烈的競爭。特別是,幾乎可以確定第二代Epyc芯片(又名“羅馬”)將搶占英特爾在服務器領域(包括HPC)的市場份額。
羅馬令人印象深刻的性價比無疑是促使美國、英國、德國和芬蘭等超級計算機系統選擇它的關鍵,大多數系統將于今年上線?,F在的關鍵問題是,更新的至強處理器(14納米“ Cooper Lake”至強可擴展處理器),尤其是未來的10納米“ Ice Lake”至強可擴展處理器,能在多大程度減少市場份額的流失。
Arm也在緩慢地進入HPC市場,我們認為,緩慢的主要原因是,從技術角度看,與x86或任何其它通用處理器相比,該架構沒有任何特殊的優勢。Arm的優勢在于其IP是可授權的,因此該架構可以滿足不同市場定制處理器的需求,這和全球軟件生態系統捆綁在一起。
需要說明,這種可延展性是長期的優勢,而不是短期的優勢。富士通花了至少五年的時間設計和開發了A64FX,這是第一個基于Arm架構的HPC專用處理器。它即將在RIKEN Lab的“ Fugaku” 400 petaflops超級計算機中首次亮相,將測試Arm架構在高端HPC中的可行性以及相應的生態系統。巧的是,它也將展示沒有加速器或外部存儲器系統的優缺點。
Cavium(凱為半導體2017年已經被Marvell收購)的ThunderX2 SoC是一種更普通的芯片,其目標是在低級別的HPC領域,這款處理器于2018年推出,很快就獲得了Marvell的訂單,并成為了英國和其它地區為數不多的第一批基于Arm處理器構建HPC集群的基礎。盡管ThunderX2不是超高性能,但由其較好的集成內存控制器分配,在受內存帶寬限制的應用中表現出色。Marvell希望在ThunderX2成功的基礎上再推出ThunderX3,該產品有望在今年年初發布。
Marvell預測,第三代產品將基于7納米制程,將與AMD的“羅馬” Epyc 7002和英特爾的Ice Lake至強可擴展處理器競爭,性能將比ThunderX2高出兩倍以上,時鐘頻率也更快,能源效率更高。
今年,基于Arm的高性能計算將有另一個重要選擇——基于A64FX的商用系統。例如,由于與富士通達成了合作協議,客戶現在可以從Cray / HPE選擇支持A64FX的CS500集群。對于日本或者歐洲市場,富士通還將提供基于A64FX的FX700和FX1000系統。
如果這些系統在各自的地區能夠吸引足夠的客戶,其他OEM也可能與富士通達成類似的協議。
基于A64FX的商業系統的前景也可以預測。Isambard 2是布里斯托大學最初由ThunderX2驅動的Isambard集群的迭代版本,將采用A64FX Cray CS500。盡管還沒有宣布任何消息,但是如果歐洲三臺E級超級計算機(每秒可進行百億億次數學運算)中的一臺(或更多臺)也都采用A64FX芯片,這也不會令人感到驚訝。
我們認為,用戶和供應商當前對基于Arm的群集的熱情是基于以下事實,即變化似乎已達到拐點。Hyperion Research一直在跟蹤HPC中Arm的銷售情況,他們預計在未來五年中,該領域Arm處理器收入的復合年增長率為64.7%。
盡管在2019年僅有50,000顆Arm芯片被用于HPC,但Hyperion預計該數字到2020年將超過233,000,到2024年將超過610,000。其中許多系統將在美國以外,這一事實反映出所有最初的基于Arm的億兆級系統都將在歐洲、中國和日本構建和部署。這些地區占高性能計算一半以上的市場。也就是說,盡管Arm在這一領域可以維持較高的增長率,但x86處理器在未來五年甚至更長時間內仍將主導這一市場。
Power架構方面,盡管有OpenPower計劃,IBM仍然是游戲的唯一玩家。Power10處理器原定于今年推出,但現在看來它將在2021年問世,該公司并沒有依靠HPC來增加出貨。盡管Power10可以成為高性能計算領域令人印象深刻的芯片,但尚無大型系統由該芯片提供算力(能源部通過了IBM和Power10的CORAL-2合同)。
一個潛在的增長點是,歐洲開放計算機體系結構實驗室(LOCA)計劃選擇OpenPower作為開發開源HPC處理器的三種架構之一。
在可預見的未來,Power架構似乎注定在高性能計算中扮演次要角色。
GPU和更廣泛的加速器肯定會增長,特別是如果考慮到中國(中科曙光的DCU和Matrix-3000 DSP),歐洲(RISC-V和其他特定領域的加速器)追求定制設計(歐洲處理器計劃)的產品,以及無數的AI加速器進入市場,例如英特爾最近推出的神經網絡處理器:NNP-T和NNP-I。當然,還有Xilinx和英特爾的各種FPGA迭代產品,可用于在芯片中實現硬件半定制化的HPC應用。
但是,對于主流HPC使用者,GPU仍將是首選的加速器平臺。英偉達主導了這個領域,但AMD及其Radeon Instinct準備搶占該市場的部分市場份額。頂級的MI60通過Infinity Fabric提供7.4 teraflops的64位性能,32 GB的HBM2內存以及與GPU之間的200 GB /秒的連接性能。在將來的迭代中,連接性能將擴展到AMD的Epyc CPU,以便GPU和CPU可以在同一結構上進行通信。這個功能將在Oak Ridge National Lab的“ Frontier”百億級超級計算機中進行大規模測試,將通過Infinity Fabric在每個節點中連接四個Radeon Instinct GPU和一個Epyc CPU,Frontier計劃于2021年啟動。
同年,“ Aurora”E級超算有望在Argonne國家實驗室上線。該系統將配備英特爾的Xe GPU,這是一個協處理器,旨在加速HPC和神經網絡訓練,就像Nvidia的V100和T4一樣。因此,Aurora將是針對此處理器進行HPC和AI負載的第一個大型測試。由于現在沒有Xe處理器(定于今年晚些時候發布),因此它們的性能以及可編程性未知。
在這方面,英偉達具有優勢,因為該公司十多年來一直在圍繞其CUDA硬件有條不紊地擴展其CUDA軟件,并已擁有數量龐大的開發人員和用戶。事實證明,該公司的GPU也有些難以捉摸,而且隨著可能在今年晚些時候推出的新一代(“安培”)架構的出現,英偉達可能再次體現出優勢。
但現在,至少是一場三雄爭霸的比賽。隨著新十年的開始,這將使加速器市場變得更加有趣。
來源:雷鋒網
評論
查看更多