服務器中的CPU數量正在增長,制造這些處理器的供應商數量也在增加。
除了IBM的Power和Z系列是主要的例外之外,CPU服務器一般是多核的x86處理器。盡管不一定要更換x86處理器,但它們會通過新的處理器設計得到補充和擴充,以用于各種更專門的任務。
在最近的Top500超級計算機列表中,有140個超級計算機具有Nvidia GPU協處理器,而且這個數字只會增加。在未來5到10年內,通用服務器將隨x86處理器,GPU,FPGA,Arm內核,AI協處理器,5G調制解調器和網絡加速器一起交付。
這是公認的一種尺寸并不能完全適合應用程序處理。終端市場可能會四分五裂,所有這些都要求定制化的解決方案。結果,一定會導致計算的未來(尤其是在服務器端)是異構的。
TECHnalysis Research總裁兼首席分析師Bob O‘Donnell說:“人們發現,不同的芯片架構更適合于處理不同類型的工作負載。而且由于這種工作負載的多樣化將繼續,因此對多樣化計算的需求也將繼續。將會有其他必要的芯片。這并不意味著CPU會大量消失,但是其他類型的芯片將會有更多的多樣性。然后最大的問題將是互連封裝。”
英特爾在其XPU項目中采取了積極的態度,該項目將CPU,GPU(通過其新的Xe GPU),Altera的FPGA和AI處理器與API結合在一起。英特爾數據中心XPU產品和解決方案副總裁兼總經理Jeff McVeigh說:“我認為未來的發展不會有一個統一的答案。但是會有很多種類型,從緊密集成的單片芯片到集成到系統級連接的多芯片封裝。”
Nvidia企業計算部門負責人Manuvir Das認為:“對不同計算體系結構的需求是由新數據類型驅動的。每個公司都有越來越多的數據可供使用。而且公司越來越愿意收集越來越多的數據。這樣做的原因是因為他們現在可以看到他們可以從數據中獲取價值。”
近幾個月來,隨著公司通過購買而非自然增長實現產品多樣化,半導體行業見證了相當大的并購活動。
英偉達(Nvidia)是一家多年來未曾進行大筆收購的公司,它突然打開了錢包,以70億美元的價格收購SmartNIC制造商Mellanox,以400億美元的價格收購ARM Holdings。
AMD計劃以350億美元的價格收購Xilinx,這是多年來的首次重大收購行動。
Marvell Technology以60億美元收購了Arm服務器芯片制造商Cavium,并以100億美元收購了網絡半導體制造商Inphi。
ADI公司已經簽署了一項協議,以210億美元的價格收購Maxim Integrated產品。
O’Donnell說:“他們之所以多樣化,是因為他們都認識到必須擁有各種各樣的不同芯片架構。最困難的部分將是英特爾要使用一種API來做的事情,那就是,我如何采用這些多樣化的架構,并使它們可供人們使用?每個架構都需要不同的指令集,不同的編程方式,不同類型的編譯器等。”
一個或多個芯片?
那么問題就變成了主板上是否會有一塊大硅片,或者每個芯片組有多個插座?這幾乎不是一個新主意。片上系統(system-on-chip)已經存在多年。但是SoC正在發生變化。
SoC設計通常會縮減處理器,尤其是GPU,以使所有這些芯片都適合合理的散熱范圍。僅具有完整CPU,GPU和FPGA的SoC的TDP約為700瓦,這對任何人來說都是完全沒有吸引力的。如果要進行包裝設計,則很可能會縮小處理器的規模。
系統和解決方案副總裁兼Rambus杰出發明家Steven Woo表示:“AMD已經做了一些偉大的工作,表明可以將小芯片封裝用于CPU內核和I/O芯片。而且,如果您想獲得更強大的功能,則可以構建整個小芯片,這些小芯片可能只是CPU內核,一個是更多的神經網絡引擎,也許是GPU,然后可以將它們組合在一起。”
英特爾的McVeigh可以選擇采用多封裝設計。“從存儲器帶寬的角度來看,單封裝設計顯然有好處,但是在每個封裝中可以裝多少東西也有限制。因此,我認為未來的發展不會有一個單一的答案。但是,從緊密集成的單片芯片到集成到系統級連接的多芯片封裝,將有多種選擇。”他說。
英偉達也對多芯片封裝的想法持開放態度,盡管它的愿景與英特爾類似。它提供所有的硅。Das指出,英偉達已經擁有Tegra形式的Arm/GeForce SoC,以及結合了Mellanox ConnectX-6網絡控制器,Arm CPU和Ampere GPU的新型Bluefield 2數據處理單元(DPU)系列。按照Nvidia的發展路線圖,2022年的BlueField 4將在一塊硅片上配備所有三個CPU。
“如果僅考慮從現在起三年后以及從現在起五年后將要完成的計算量,那么如果您不這樣做的話,世界將負擔不起。因此,將有多種形式。當您靠近邊緣時,它將看起來將更傾向于集成解決方案,” Das說。
但這就是英特爾和英偉達將自己所有的IP包裝到一塊硅中。當兩家或更多公司合作的前景(例如,Marvell和AMD)時,這種觀點是令人懷疑的。
Supermicro的FAE和業務開發高級副總裁Vik Malyala表示:“這將非常困難。為什么英特爾或AMD會向Nvidia開放有關其處理器架構的所有內容?英偉達也是如此。Nvidia為什么要開放其GPU的所有功能以與某人一起工作?所以說他們試圖購買Arm是有原因的。”
Arm基礎設施業務部門的營銷高級總監Eddie Ramirez表示,多供應商芯片是有先例的。“如果您要看10年前的事,我們幾乎還沒有將您的設計與制造分開的初期階段。對于現在的SoC,這是司空見慣的。因此,在您談論的時間范圍內,在5到10年內,生態系統將發展到可以使用來自不同供應商的硅片構建FCM的地步。”他說。
但是,他質疑鑒于不同的芯片具有不同的使用壽命,這是否是一個好主意。“擁有一臺帶有PCI卡的服務器是一回事,您可以更換卡。但是,當它們裝在一個包裝中時,您必須立即更換所有東西。這適用于不同的生命周期嗎?這是這里的有趣之處。”他補充說。
Malyala還指出,芯片供應商針對不同的性能場景提供了多種芯片,將一大堆集成到一個封裝中會限制客戶的選擇。例如,如果我是Xilinx,那么我有十幾個不同的FPGA。但是,如果我要在給定的硅片中放置一個硅片,那就是說這就是它的原樣,即使我的配置過多或配置不足,我也堅持這樣做。
CXL公式
服務器中非CPU處理器的當前解決方案是PCI Express卡。GPU,SSD,FPGA和其他協處理器占用一個PCIe插槽,并且服務器中只有太多空間可用于存儲卡,尤其是超薄1U和2U設計。
PCIe還具有作為點對點通信協議的局限性。由于Compute Express Link(CXL)協議可與PCIe以及其他自動協商交易協議一起使用,因此已迅速成為PCIe的替代協議。
McVeigh說:“當我們進入這些更復雜的體系結構時,真正需要的是可以支持對等通信的各種拓撲,以及能夠擴展這些拓撲的能力。PCI Express本身并不能解決所有這些問題。但是,對于您希望能夠進行升級的情況,顯然是從現有設計中升級,即您擁有單獨的卡,并且可能不需要完全的互連性,那么在那兒做得很好。”
CXL的一大優點是它通過其快速連接將加速器放置在距離處理器更近的位置,更重要的是,它使連接到加速器的內存成為系統內存的一部分,而不是專用設備內存。這可以減輕系統內存的負擔,并減少必須移動的數據量,因為設備內存(例如GPU)中的數據很容易看到,而無需在系統內存之間來回移動。
無論多個處理器是在單個裸片上還是在多個裸片上,它們都必須以某種方式綁在一起,并且CXL被視為將它們綁定在一起的網格。PCIe有其用途,但它是點對點協議,而不是像CXL這樣的網格。另外,CXL允許處理器共享內存,而PCIe則無法做到這一點。
“ CXL絕對是非常可信的,” Rambus的Woo說。“如果行業真正圍繞它發展起來,那將是新型互連發展的墊腳石,我們將圍繞節點之間相互連接所發生的事情對它進行更大程度的優化。也許將處理器連接到內存和分解方案,甚至將處理器連接到GPU和存儲之類的東西。”
Ramirez說,CXL出現的一個例子是在具有PCIe的不同端點之間具有一致的內存訪問的概念。如果您試圖在一個加速器上進行一定數量的計算,并且需要與其他加速器進行通訊,則它們應該能夠直接講話,而不是使用“輪輻式”模型,在該模型中,一切都必須花一點時間才能完成。協調。拉米雷斯說:“ PCI Express本質上不具備該功能。”
可能會有一種全新的標準在PCIe的良好組成部分基礎上發展,而忽略了不需要的部分。Woo指出,當兩個PCI Express設備首先開始互相通信時,它們使用PCIe Gen 1進行協商,然后逐步升級,直到找到可以通話的最高速度。
Woo說:“整個初始化序列要麻煩一些。如果您從芯片設計師的角度考慮問題,必須把所有這些Gate都放進去,它們將習慣于弄清楚我可以更快地講話,并且我不再使用那些晶體管了。擁有這種簡單的協議是有好處的。作為硅設計師,我寧愿將這些Gate用于其他用途。”
一個可以統治所有應用程序的API
而沒有軟件的硬件只是一堆金屬,因此,這些工作背后的真正問題是如何將它們組合在一起。英特爾的oneAPI程序提供了最完整的解決方案。oneAPI提供了用于計算和數據密集型領域的庫,例如深度學習,科學計算,視頻分析和媒體處理。
oneAPI可與用C,C ++,Fortran和Python編寫的代碼以及MPI和OpenMP等標準進行互操作。它還具有一組編譯器,性能庫,分析和調試工具,以及一個兼容性工具,該工具有助于將以CUDA編寫的代碼遷移到Data Parallel C ++(DPC ++),這是一種基于C ++和Khronos SYCL構建的開放式標準跨體系結構語言。
DPC ++擴展了這些標準,并提供了顯式的并行構造和卸載接口,以支持各種計算體系結構和處理器。當然,它支持英特爾,但McVeigh說,他希望其他芯片公司也采用它。
McVeigh說:“我們將其視為一項行業計劃,將這些異構架構與統一的編程模型結合在一起。而且我們已經將其用作真正結合這些架構的關鍵要素,因此您可以使用一種通用語言,一套與OS供應商解決方案一起使用的通用庫(不僅是英特爾產品)對它們進行編程。”
O‘Donnell相信,該軟件解決方案將全面存在,從BIOS和驅動程序供應商到Linux發行版,如Red Hat Enterprise Linux和Canonical的Ubuntu。他說:“這是一個如此多層的堆棧。現在,它是全面的。我認為您不會看到任何解決方案。涉及的部分太多了。”
結論
服務器行業將需要更多的證明點來證明異構計算的有效性。但這不是尋找市場的解決方案。存在著許多市場,隨著邊緣的推出,正在開發新的市場。所發生的變化是,解決方案是針對它們量身定制的,而不是最終市場適應現有的最佳現成技術。
O’Donnell說:“從概念上講,我們將需要不同的芯片體系結構才有意義。我們需要一個單一的軟件平臺來利用它們,但是在這種硬件抽象層以及其他所有東西的幕后,它需要采取某種神奇的方式。”
隨著人們開始使用多芯片架構,我們是否將開始看到它按他們期望的方式工作?我們是否正在獲得人們期望的性能優勢?劃算嗎?在現實世界中這實際上是如何工作的?
他說:“除了理論之外,這還有待觀察。” “我們將不得不在多個層面上看到這一點。英特爾將驅動它,但是您也會看到其他公司也嘗試驅動它。”
原文標題:服務器以后會變得越來越異構?
文章出處:【微信公眾號:存儲社區】歡迎添加關注!文章轉載請注明出處。
責任編輯:haq
-
英特爾
+關注
關注
61文章
9955瀏覽量
171709 -
服務器
+關注
關注
12文章
9138瀏覽量
85365
原文標題:服務器以后會變得越來越異構?
文章出處:【微信號:TopStorage,微信公眾號:存儲加速器】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論