蘋果M1芯片憑借著優越的性能及低功耗,成功走入大眾視野。那么蘋果能否開始為服務器市場制造芯片?如果不能,又是什么阻止了他們?
沒錯,我們知道蘋果的M1芯片運行速度非常快。那么是什么阻止了他們在未來用自己的芯片占領服務器市場?我將從以下幾個方面來回答這個問題:
什么樣的芯片才能稱作是“好”的服務器芯片?與臺式計算機相比,服務器會對微處理器會有不同的要求嗎?
通過比較ARM和x86的商業模式,來更好地了解兩者是如何以完全不同的方式運作。
ARM的競爭究竟是什么樣的?我們來看看一些知名的ARM芯片制造商:亞馬遜(Amazon)和安晟培(Ampere),他們的技術和商業模式是什么?他們與蘋果的M1相比有什么優勢?
芯片制造正在發生范式轉變。芯片的制造方式已經不同了,隨著時間的推移,這將如何影響市場的發展?
蘋果進入服務器市場有哪些優勢和劣勢?我們將討論蘋果獨特的垂直整合優勢。
蘋果在消費市場的獨特優勢如何在服務器市場上與之抗衡。
什么才能稱作“好”的服務器芯片
在服務器市場上有許多不同的工作流。正如我在《蘋果M1芯片為何如此之快》一文中所討論的,服務器的需求往往與臺式機截然不同。在這里,我將用一個例子來說明服務器如何處理來自多個用戶的多個請求,這些請求通常不是CPU密集型的。
例如,提供網頁或從數據庫獲取數據就不是CPU密集型的,在這種情況下,能夠并行執行多個任務更為重要。因此,具有大量內核的CPU是非常有利的。
這一點與蘋果M1或A14芯片的設計方式相反,它們的設計是擁有幾個非常強大的內核,這一點在視頻編輯、玩游戲、畫畫等方面更為重要。
因此,在這個領域有其他ARM CPU設計得更好,讓我們來看看這其中的一些,并將它們與蘋果的M1芯片進行比較。
但為了確保您真正了解我在說什么,這里我們先來簡單介紹一下CPU指令集。
ARM與x86的簡單對比
蘋果生產的芯片稱為蘋果硅(Apple Silicon),AMD生產Ryzen芯片,英特爾生產的芯片通常稱之為酷睿(Intel Core),高通公司生產驍龍(Snapdragon)芯片,安晟培制造Altra芯片。然而,所有這些微處理器生產商生產的芯片分為兩類:ARM和x86,這基本上就是這些芯片使用的指令集的名稱,可以將其視為每個芯片使用的語言。
這是一個粗淺的比較,下面是5條ARM指令,它們將數字4和5加載到兩個單獨的寄存器r1和r2中。寄存器是微處理器(CPU)中的允許執行運算的存儲位置。
我們添加一些數字,然后將它們存儲在RAM中的內存位置24。我將不會進一步對它進行詳細說明,因為它在本文中并不重要。
LDR r0, #24
LDR r1, #4
LDR r2, #5
ADD r1, r1, r2
STR r1, [r0]
在x86架構的芯片上,使用的指令會略有不同:
MOV ax, 4
MOV bx, 5
ADD ax, bx
MOV 24, ax
在本例中,我們在加法之前將數字放到名為ax和bx的寄存器中。這里的關鍵是ARM和x86基本上是不同的語言。寫在ARM上運行的程序不能在x86上運行,反之亦然。如果你想在基于ARM的處理器上運行x86程序,你需要使用翻譯服務,比如蘋果的rosetta2,它可以將x86代碼翻譯成ARM代碼。
Intel和AMD生產x86 CPU,這意味著即使你寫了一個可以在在Intel處理器上運行的程序,它也會在AMD處理器上運行。同樣,為蘋果硅芯片編寫的程序也可以在高通驍龍、安晟培Altra芯片和亞馬遜的AWS Graviton芯片上運行。
這是ARM相對于x86的優勢之一,有很多不同的公司都在生產ARM芯片。這還有一個復雜的因素。
ARM公司不僅僅設計ARM指令集,他們還創建了完整的設計,我們也可以稱之為ARM芯片的微體系結構。現代的CPU實際上是由多個CPU內核組成的,ARM設計的就是這樣的內核。ARM設計了一個名為Neoverse N1的CPU內核。
亞馬遜和安晟培向ARM公司付費來使用這種設計進而創建自己的CPU,他們來決定如何盡可能的將這些Neoverse N1內核設計出他們想要的芯片。他們想要多少緩存內存、這些內核應該如何連接,他們可以從其他地方購買設計許可證。
但這不是唯一的辦法。例如,蘋果的M1和A14處理器使用的是ARM有限公司授權的ARM指令集,但蘋果使用的是自己定制的CPU內核firestrom和Icestorm。
在進行比較時要注意這一點。來自不同公司的許多ARM芯片在相同核數下的性能將非常相似,而蘋果卻有點離群。
在x86世界中,沒有內核設計的共享。英特爾和AMD都有自己的內核,因此它們的性能特征可能會有很大的不同。
好了,現在我們有了一些背景,我們可以開始比較蘋果的M1和現有的ARM芯片,瞄準服務器市場。
亞馬遜AWS Gravition 處理器
亞馬遜一直在為AWS云服務(AWS-Graviton)制造自己的ARM處理器。最新的化身是Gravition 2。這些處理器基于1ARM有限公司的Neoverse N1內核許可。
因此,在制造這些產品方面所付出的努力與蘋果公司所做的并不具有可比性。從性能上看,這些內核與M1上的Firestorm內核完全不同。AnandTech對Graviton2進行了多項性能測試,并與圖中的競爭對手進行了對比。不過,這是在M1之前發布的,所以我對AnandTech的M1進行了后期性能測試,并添加到同一個圖中進行比較。
好吧,這些怪東西是什么意思,比如433.milc和444.namd?這些是用C++編程語言編寫的特定程序的名稱。在進行性能測試時,這些程序在不同的微處理器上運行。通過總是使用完全相同的程序,我們能夠比較微處理器。每個程序都以不同的方式挑戰微處理器。一個CPU并不是在所有方面都同樣出色。
因此,每一列代表每個微處理器在運行特定程序時得到的分數。你可以看到黃色的Apple M1和紅色的Ryzen 9 5950x覆蓋了每列中最大的區域,因為它們的得分最高。
相比之下,藍色的Gravition 2的面積相當小。這個性能測試不是針對整個芯片,而是針對單個CPU內核。在這種情況下,我們可以看到,Gravition所使用的Neoverse N1內核明顯弱于蘋果的Firestorm內核和AMD的Zen3內核。
所以看起來幾乎每個人都在打壓亞馬遜。例如,AMD能不能就這樣闖入,用他們的旗艦基于Zen3的CPU搶占市場?沒那么快!亞馬遜并不愚蠢。這里還有很多要考慮的。如前所述,內核的數量在云中非常重要。M1的內核只有4個firestrom,而Amazon的Graviton2有64個Neoverse N1內核。
但更重要的是,今天的微處理器已經變得如此便宜,相對于它們的強大功能而言,在芯片的整個生命周期中,驅動這些芯片所需的電力要比芯片本身要多得多。
Infoq對此進行了更詳細的討論,但讓我挑一點。例如,Intel Xeons解決方案與Graviton2相比耗電420瓦,而AMD的EPYC則耗電180瓦。相比之下,Graviton2的64核功耗僅為80-110瓦。
這些在電源和冷卻方面的節省轉化為Amazon在ARM上提供比x86更多計算能力的能力。根據AMAZON AWS、的說法,它們能夠以比同等x86解決方案低40%的價格完成相同的工作負載。
Amazon EC2 T4g、M6g、C6g和R6g實例及其帶有本地基于NVMe的SSD存儲的變體,與可比較的當前一代基于x86的實例相比,提供了高達40%的性價比。
面向新的制造業范式
這也強調了我們目前所處的不斷變化的計算環境。像亞馬遜這樣的大公司現在越來越能夠根據自己的特定計算需求構建內部解決方案。Graviton2不是現成的(買來直接能用的)。由于不同芯片的IP(知識產權)現在可以在各地購買,并結合起來創建自己的微處理器,任何人制造芯片的門檻都大大降低。
這并不是計算機行業獨有的。這種事到處都在發生。威爾·查普曼(Will Chapman)是一名軟件開發人員,他發現盡管他只是一個人,但他可以進入制造業。他創立了BrickArms,為樂高迷你角色制造史詩級的塑料武器。
今天你可以在家里用三維建模軟件設計一個零件,然后把你的設計上傳到中國的工廠,工廠將為你量產。這些工廠現在生產小規模的產品,所以你不必成為一個大企業就可以開始。
Ponoko舉例說明了這一趨勢。他們自稱為你的私人工廠。你可以上傳設計和他們的設施將三維打印和激光切割部分根據你的設計,其他人可以購買。因此,任何一個獨自坐在家里,資金最少的人都可以從事制造和銷售商品的業務。你在圖書上也看到了同樣的情況,亞馬遜將按需印刷圖書。因此,即使你的書很少賣,也有可能印刷出來。
谷歌、特斯拉、Facebook、亞馬遜等都在利用這一全球趨勢。他們今天都自己制造硬件。谷歌制造專門的機器學習硬件,用于他們的數據中心,稱為張量處理單元。它們的用途與蘋果M1芯片上的神經引擎類似。
張量處理單元3.0.谷歌定制的用于機器學習加速的硬件
特斯拉還制造了自己的汽車電腦,以加速機器學習模型的運行,幫助他們提高自駕服務所需的巨大處理能力。別把它和英偉達的特斯拉卡混淆了。
這種趨勢正在加速。谷歌正忙著為他們的Android手機制造自己的ARM芯片。我認為,我們將越來越多地看到大型科技公司根據自己的需求設計自己的定制硬件,因為你可以很容易地買到現成的設計。
當你設計了一個芯片,它只是將藍圖傳輸到一個大型芯片鑄造廠,如臺積電建立它就解決了的問題。就像BrickArms的擁有者Will Chapman一樣,他可以將自己的樂高武器設計圖運送到中國的某家工廠,該工廠立即開始使用塑料注射成型來生產這些零件。
接下來,讓我們看看ARM服務器芯片市場上的另一個競爭對手。
安晟培(Ampere Computing)
Ampere Computing(安晟培)是一家成立于2018年的新公司,其目標是為所有非亞馬遜的云提供商提供ARM服務器處理器,因此無法獲得Graviton2。
然而,安晟培有很多有趣的地方值得一談,特別是與M1相比。每個內核的性能可能與Graviton2類似,因為它基于ARM有限公司設計的Neoverse N1 CPU內核。
但這就是區別的終結。安晟培有一些獨特的方案選擇:
極多內核。他們目前的Altra有一個驚人的80內核。但他們正忙于制造將采用128核的Altra Max。
你可以在主板上安裝兩個這樣的芯片。因此,你可以得到一臺電腦共160內核。他們下面的Mt. Jade 平臺就是一個例子。搭配可后向兼容的Altra Max,你可以得到一臺256核的電腦!
Altra旨在為每個內核提供確定性性能。那是什么意思?通常,當你有多個內核時,一個核的活動會導致另一個核的性能突然下降。云客戶不希望由于其他客戶的活動而導致性能突然下降。因此,這是安晟培的一個主要賣點。
大規模擴展能力。你可以連接很多內存,硬盤,顯卡,神經網絡計算卡和其他形式的加速卡。加速器是一種特殊的卡片,可以讓特定的任務運行得更快,比如視頻編碼或機器學習。
Mt. Jade 平臺:雙插座機架式服務器。這是一個帶有兩個Altra CPU的云計算機架。每個CPU有80個內核,因此這臺機器一共有160個內核。
因此,如果我們要與蘋果的M1相比,我們可以看到一些明顯的差異。Graviton2和安晟培的內核可能都很弱,但M1只有4個快內核和4個慢內核。
與M1不同的是,Ampere芯片并沒有搭上異構計算的馬車。它沒有專門用于加密、機器學習、圖像處理或視頻編碼的芯片。在《蘋果M1故事》中,我提到PC行業很難復制蘋果的異構策略,因為該行業將有許多參與者,他們需要協調和同意這些專用芯片應該是什么,否則就會造成完全的混亂。
這確實是安晟培面臨的一個問題,因為他們只生產硬件,而不像蘋果那樣控制軟件。因此,安晟培公司表示,他們認為現在增加專門的合作者還為時過早。他們正在等待行業標準的確立。蘋果不需這樣——蘋果公司生產的軟件可以訪問他們的硬件設備如神經網絡加速引擎,因此他們可以確保軟件和硬件匹配。硬件和軟件供應商之間不需要協調。
主板上的PCIe插槽示意圖:有一個帶1個通道的插槽,一個帶16個通道的插槽——可以傳輸16倍的數據。您可以將顯卡,網卡或其他專用卡放入這些插槽。
到目前為止,安晟培的解決方案是支持許多PCIe通道。什么是PCIe通道?可以將PCIe通道視為數據的管道或者流水線。這些管道越多,可以連接的外部硬件就越多。PCIe標準允許你將其中多達16個管道連接到一個外部硬件卡(如圖形卡)或硬盤驅動器。
他們還增加了對CCIX標準的支持——CCIX允許類似于蘋果統一內存架構的東西。它允許外部圖形卡上的GPU和安晟培CPU共享內存中的數據。不需要顯式地將數據塊從一個內存位置復制到另一個內存位置。
蘋果進軍服務器界的優劣
到目前為止,我們所討論的可能會開始給大家一些權衡利弊的直覺。
蘋果有一個優勢,他們控制著整個小部件,但這只適用于同時使用硬件和軟件的情況。因此,要充分利用蘋果的異構計算能力,實際上你需要在云中運行macOS,而不是Linux,不是FreeBSD,當然也不是Windows否則,蘋果將不得不等待Linux、BSD、Windows等支持的行業標準出現,然后根據這些標準來定制硬件。這蘋果可不太可能同意。
同時,我也懷疑蘋果是否愿意銷售不運行其軟件的解決方案。這使潛在用戶陷入困境。macOS是Unix操作系統,這意味著許多Linux和BSD軟件將在它上面運行良好,只需很少的改動。然而,macOS并沒有真正針對服務器使用進行優化。
Linux內核開發人員非常關注這一點,這推動了他們的開發工作。例如,macOS高度關注低延遲等方面,以處理實時音頻和視頻等問題。這些用例對從事視頻和音頻工作的專業人員很重要。這是蘋果DNA和傳統的一部分。
因此,開發人員可能會面臨在macOS上運行并獲得優異性能的選擇,但卻錯過了他們喜歡的定制和完全開放的Linux。請記住,Docker等云軟件的關鍵技術需要Linux內核才能運行。
Docker只是眾多技術示例中的一個,它在服務器空間很大,而且是為Linux量身定做的。
然可以通過虛擬化在macOS上運行Linux,但是你也失去了對蘋果特定框架的訪問,比如Core Audio、Core ML等,這些框架使用定制的蘋果協處理器。
需要記住的是,對于不能使用蘋果專用硬件的服務器工作負載,可能沒有充分的理由選擇蘋果解決方案。像蘋果那樣制造大型高性能內核并不是一個神奇的解決方案。這是一個深思熟慮的選擇,因為他們的用戶沒有可以輕松利用大量CPU核的工作負載。
對于可以使用大量內核的情況,比如云服務,蘋果的解決方案可能沒有優勢。亞馬遜和安晟培只要擁有更多的內核,就可以在性能上與蘋果媲美。目前,蘋果只在只有4-8核可供使用的工作負載(如在現代電腦游戲中)上贏得這場競爭。
導讀:32-Core Apple Silicon Macs in 2021?
蘋果可能大放異彩的地方
所有的云服務都不完全一樣。對于高性能計算和機器學習服務,我們希望以較低的功耗獲得大量的數字處理能力。在這方面,M1芯片也許能打敗所有人。由于其特殊的協處理器,它在進行高度密集的數學運算時所能提供的性能非常出色。
傳言還說,蘋果公司將生產多達128個GPU核的芯片。GPU往往在許多科學數字運算應用程序中占據主要優勢。相比之下,Ampere和Amazon沒有任何可利用的集成GPU。
研究人員可能不得不接受這樣一個事實:他們需要運行macOS,因為使用蘋果的解決方案可能會節省太多的錢。
因此,如果蘋果要進入服務器領域,他們不應該瞄準普通服務器市場,托管網站、數據庫等。他們應該專注于:
數據分析。
高性能計算(HPC)
機器學習(ML)
為什么我不認為蘋果能在服務器領域成功
雖然我已經闡述了為什么蘋果可能提供強大優勢的原因,而且我是蘋果的超級粉絲,但我必須對我所知道的蘋果歷史保持現實。蘋果根本沒有良好的業績記錄。他們放棄了MacOS X服務器。他們拋棄了專用的服務器機架式計算機。而在iCloud之前,他們的數據同步服務的記錄相當糟糕。
蘋果真的很擅長他們所做的,但在史蒂夫·喬布斯從未熱衷于的領域,如B2B和游戲,蘋果從未成功地把它做大。蘋果電視本來是一款可以與任天堂競爭的好主機,但是蘋果完全沒有抓住這個機會,因為它提供了一個幾乎完全不適合玩游戲的手柄。
蘋果不是一個好的B2B的公司有幾個原因,與他們的DNA緊密相連。是什么造就了蘋果?我們對蘋果的了解和熱愛是神秘的。他們多年來一直在秘密研究新的革命性產品。然后他們突然沖上舞臺,向我們展示了一些我們從未見過的東西,然后宣布你可以在明天(或半年后)購買。
為了讓興奮和敬畏真正起作用,你需要完全保密。在產品發布之前,你需要開發出一個真正的產品。我們在典型的蘋果開發中看到了這一點。他們發布了一個令人震驚的公告,其產品超越了其他所有人。我們都排著隊去拿。但隨著時間的推移,我們注意到蘋果產品開始落后于競爭對手,因為他們根本不做頻繁的更新。
索尼的PlayStation5。蘋果的產品很像游戲機——他的出現是革命性的,但往往在更長的時間里落后于競爭對手。
蘋果產品之所以這么好,部分原因是因為蘋果花時間真正打磨和完善自己的產品。但這意味著不會有穩定的改進版本定期推出。在這方面,蘋果的運營方式與主機市場非常相似。通常,當一款新游戲機發布時,它們會徹底摧毀價格相近的游戲PC。然而,隨著時間的推移,PC往往會縮小這一差距。
像蘋果產品這樣的游戲機是終極消費品。顧客想要高興和眼花繚亂。這就是為什么這些東西在發布時帶來了巨大的改進和漂亮的新設計。
這不是服務器市場的運作方式。該行業需要清晰的路線圖和透明度。他們想知道蘋果公司正在計劃什么,他們目前在做什么,他們能期待什么。這些人必須做出長期的戰略決策。在圣誕節等待驚喜,并不是個成功的運營企業的模式。
這些完全不同的需求總是讓蘋果很難與商業客戶打交道。蘋果想要嚴密的控制和精簡的產品,而企業需要開放和靈活的解決方案。要想在服務器市場或企業對企業市場取得成功,蘋果必須變得更像微軟,我相信這是蘋果最不希望看到的,也是他們的粉絲們最不希望看到的。微軟與蘋果所代表的恰恰相反。
微軟不惜一切代價保護向后兼容性,例如在商業上有巨大價值的兼容性。但它也拖累了微軟,并創造了混亂復雜的解決方案,受到遺留問題的阻礙。相比之下,蘋果殘酷地打破過去,創造出新的閃亮解決方案。他們在路上惹惱了很多顧客,但當我們拿到他們閃亮的新產品后,我們很快就忘記了這些違規行為。
蘋果能在服務器領域起什么作用
我認為蘋果與亞馬遜、安晟培、谷歌和其他公司合作,將ARM打造成x86的強大替代品,而不是自己制作服務器解決方案,這要現實得多。這些公司都對此感興趣。有了ARM,所有的大玩家都可以按照自己的需求定制解決方案,而這是x86所無法做到的。
但這個難題有兩個部分。你需要服務器硬件,但你也需要流行的臺式機和筆記本電腦運行ARM。如果這些都不流行,那么開發人員就不會開發出足夠的ARM經驗。Linus Torvalds已經講的非常清楚,(如此的話)家庭計算機需要運行與服務器相同的硬件。
隨著我們現在看到的圍繞M1的興奮,基于ARM的計算機可能會有一個重大的發展,這意味著Amazon和其他公司將最終擁有一大批擁有基于ARM的機器的開發人員,他們可以開發運行在他們的Graviton2芯片上的服務。
這會讓雪球滾起來的。一切都是為了達到臨界質量——只要有足夠多的人在ARM上運行,就會達到一個轉折點——每個人都會希望將他們的服務轉換到更便宜的ARM云服務。
這可能意味著大量開發者和其他專業人士涌入蘋果平臺。或者至少在個人電腦行業能夠想出一個可行的ARM替代方案之前。正如我在前面的故事中所討論的,我認為這需要時間。蘋果現在可能有好幾年的時間,在這幾年里,他們將比其他個人電腦行業享有持久的優勢。
最終個人電腦行業將標準化并迎頭趕上。然而,一旦人們習慣了Mac平臺,他們通常不會離開它。因此,這可能意味著蘋果的市場份額將永久性提高。
編輯:jq
-
芯片
+關注
關注
456文章
50967瀏覽量
424869 -
ARM
+關注
關注
134文章
9111瀏覽量
368044 -
蘋果
+關注
關注
61文章
24431瀏覽量
199201
原文標題:蘋果芯片的下一個目標:服務器?
文章出處:【微信號:半導體科技評論,微信公眾號:半導體科技評論】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論