?? Apple在上月底宣布了新一代的M3系列處理器,同時也推出了新款MacBook Pro。而本次Apple選擇一次性推出幾乎所有產品系列,同時推出了基于標準M3以及更強大的M3 Pro和M3 Max SoC的產品。這些產品是基于TSMC的N3B工藝制造的,Apple旨在再次提高CPU和GPU的性能,并在單個筆記本SoC中使用的晶體管數量上創下了新紀錄。
? M3系列搭載于新款MacBook Pro以及24英寸iMac。但這些設備沒有任何外部設計或功能更改(尺寸、端口和部件都與之前相同),因此內部更新就跟顯得直接。因此,這些新產品發布的亮點是新的M3系列SoC及其帶來的功能和性能。 ? Apple利用其最新一代用于Mac(毫無疑問,也用于高端iPad)的高性能芯片,似乎正在充分利用TSMC N3B工藝提供的密度和功率提升。但同時,他們也在改變SoC的配置方式。尤其是M3 Pro,在某些方面與其前代產品有顯著的不同。所以,盡管M3芯片本身并不算“開創性”,但這里有一些重要的變化值得我們關注。 ?
首先,讓我們來看看三款M3芯片的規格。這三款芯片在一個月內相繼發布(嚴格來說M3 Max設備要到11月中旬才上市),這是迄今為止最雄心勃勃的一次M系列芯片的發布。通常,Apple會從小型設備開始,逐步升級(比如先發布M2,然后再推出Pro和Max型號),但這次我們一次性得到了所有配置的芯片。 ?
不過,Apple在產量方面也開始縮小規模。Apple使用這些新款芯片來更新MacBook Pro系列和一款iMac,這些是Apple產品中較昂貴的產品(普遍被認為是低產量的)。這與先從MacBook Air和其他更便宜的設備開始完全不同,后者需要大量的入門級芯片。這很可能是因為像N3B這樣的前沿節點(Apple是為數不多的客戶之一),初期可能會有些產量和產能瓶頸。當然,Apple永遠不會承認這一點。無論如何,他們在這一代產品的芯片發布策略上采取了從更昂貴設備開始的方式。 ?
這三款芯片共享一個通用架構,并且從廣義上講,是該架構的升級版本,具有更多的內核、更多的I/O和更多的內存通道。最小的芯片M3,以250億個晶體管開始(比M2多出50億個),而最高端的M3 Max則擁有高達920億個晶體管。雖然Apple提供了芯片照片(在當今行業中這是非常罕見的),但他們并未提供芯片尺寸,因此我們需要等到設備發貨后才能看到這些芯片尺寸的實際大小。 ? 除了3nm工藝之外,Apple官方沒有公開其它的具體工藝,但鑒于TSMC唯一可用于這類高產量生產的3nm生產線是N3B,所以我們可以非常確定M3系列使用的是N3B,A17也采用了這一工藝。根據TSMC的官方數據,N3B提供了極高的晶體管密度,特征尺寸減少了42%,等效功率減少了大約25%。即便如此,尤其是M3 Max,也是一個非常龐大的芯片。
? 在其他方面,Apple似乎沒有對其支持的內存類型進行任何更改。Apple的帶寬數據在幾個案例中與M2系列數據相同,這表明他們仍在使用LPDDR5-6400內存。這有點令人驚訝,因為更快的LPDDR5X內存已經隨處可得,而且Apple以GPU為重的設計通常會從額外的內存帶寬中受益匪淺。此時的大問題是,這是否是因為技術限制(例如Apple的內存控制器不支持LPDDR5X?),或者Apple有意決定堅持使用常規LPDDR5。 ?
M3 CPU架構:速度更快?
在架構方面,遺憾的是,Apple對于M3系列SoC中使用的CPU和GPU架構的表述相當含糊。事實上,Apple一整年對相關信息進行了更嚴密的控制。即使到現在,我們也不知道用于A17 SoC的CPU內核的代號。 ? 無論如何,鑒于Apple在A系列和M系列芯片之間共享CPU架構,我們無疑之前已經見過這些CPU內核。問題是我們是在看A17 SoC最近推出的CPU內核,還是A16的CPU內核(Everest和Sawtooth)。A17更有可能,尤其是因為Apple已經擁有了N3B的工作IP。但嚴格來說,我們目前沒有足夠的信息來排除是否是A16 CPU內核;特別是因為Apple沒有提供關于M3系列CPU內核相較于M2架構的改進的任何指導。 ?
我們目前所知的是,與M2系列相比,Apple宣稱其性能核的性能提升了約15%,與M1相比提升了30%。Apple沒有公開用于做出這一判斷的benchmark或設置,因此我們無法對這個估計的現實性做出太多評論。或者說,這種提升多少是來自于IPC提升還是時鐘頻率提升。 ?
與此同時,能效核也得到了改進,據Apple稱,其提升幅度超過了性能核。M3系列的能效核比M2快30%,比M1快50%。 ? Apple在其網站上發布了特定應用的benchmark,盡管這些是系統級別的測試。其中許多混合了CPU和GPU的性能提升。這些測試對于那些應用的用戶來說肯定是相關的,但它們并沒有告訴我們太多關于CPU內核本身的信息。 ?
Apple同樣模糊的性能/功耗曲線也在很大程度上重申了這些聲明,同時確認了性能/功耗曲線變得更加平緩的長期趨勢正在持續。例如,Apple聲稱M3能以M1一半的功耗提供相同的CPU性能;但在等效功耗下,峰值性能只提高了約40%。 ? 連續幾代的工藝持續降低了從等效性能的角度來看的功耗,但它們在提高時鐘速度方面做得相對較少。這使得通過提高時鐘速度獲得持續性能增益在功耗方面相對昂貴,這反過來又促使芯片供應商整體增加了功耗。即使是M3也無法避免這一點,根據蘋果的圖表,其峰值功耗高于M1。
? M3 GPU架構:Mesh Shading和Ray Tracing
在GPU方面,M3系列包含了更實質性的GPU架構更新。雖然Apple對GPU架構的基本組織沒有透露太多,但從功能角度來看,新架構為Apple平臺帶來了一些重大的新功能:Mesh Shading和Ray Tracing。 ? 這些功能也是隨Apple A17 SoC一同為iPhone 15 Pro系列引入的,幾乎可以肯定這是該架構更大規模的實現,就像在之前的幾代產品中一樣。由于我們在這里討論的是筆記本和臺式機,這些功能將使M3 GPU在功能上大致與Nvidia/AMD/Intel最新的獨立GPU設計相當,后者在幾年前就已經提供類似功能了。在Windows術語中,M3 GPU架構將是一個DirectX 12 Ultimate級別(feature level 12_2)的設計,使Apple成為第二個在筆記本SoC中提供如此高功能集成GPU的廠商。 ? Ray Tracing幾乎不需要介紹,因為整個GPU/圖形行業在過去五年里一直在大力推廣這種更加物理準確的渲染形式。另一方面,Mesh Shading不太為人所知,因為它提高了渲染pipeline的效率,而不是解鎖新的圖形效果。然而,它的重要性不應被低估。Mesh Shading徹底顛覆了整個幾何渲染pipeline,允許在可用的幀率下實現更多的幾何細節。這是一個“基線”功能(開發者需要圍繞它設計他們引擎的內核),所以最初的采用不會太多,但最終它將成為一個決定性的功能,作為與M3之前GPU兼容性的分水嶺。這是我們今天已經可以在PC上看到的,比如最近發布的《Alan Wake II》等游戲。 ?
這一代GPU還引入了一種新的內存管理功能/策略,蘋果稱之為“動態緩存”。根據Apple產品展示中的有限描述,看來Apple已經開始更好地控制和分配GPU使用的內存,防止其分配的內存超出實際需求。GPU過度分配內存是常見的,但這是非常浪費的,尤其是在統一內存平臺上。因此,正如Apple所說,“每項任務只使用所需的確切內存量”。 ?
值得注意的是,這項功能對開發者是透明的,并且完全在硬件層面上操作。因此,無論Apple在底層做了什么,它都被從開發者和用戶那里抽象出來。盡管如此,用戶最終將從更多的可用RAM中受益,這對于M3版Macbook Pro的最低配8GB RAM來說,無疑是好消息。
? 然而,更令人好奇的是,Apple聲稱這還將提高GPU性能。具體來說,動態緩存將“顯著”提高GPU的平均利用率。目前還不清楚內存分配和GPU利用率之間的關系,除非Apple是針對由于缺乏RAM而不得不不斷交換到存儲的邊緣案例。無論如何,Apple認為這個功能是新GPU架構的基石,并在未來值得更仔細的觀察。
? 然而,在性能方面,Apple提供的指導非常有限。在過去的幾代產品中,至少為其GPU提供了一個通用的計算吞吐量數字,比如M2 GPU的5.6 TFLOPS。但對于M3 GPU,我們并沒有得到這樣的吞吐量數據。因此,至少可以說,目前還不清楚這些GPU在現有應用/游戲中可能會多快。Apple在其產品頁面上引用了2.5倍的數據,但查看注釋,這是Redshift使用硬件RT(M3)與軟件RT(其他所有)的比較。 ?
在最佳情況下,Apple在其演示中展示了一張GPU性能/功耗曲線圖,將M3與M1進行了比較。Apple再次聲稱,在等效性能下,M3的功耗是M1的一半。同時,在等效功耗下(峰值M1,約12.5W),性能提高了約50%。但M3的GPU功耗限制也顯著提高,達到大約17W。這確實解鎖了更高的性能,但同樣需要更多功耗,且沒告訴我們M3 GPU與M2相比如何。 ?
M3 NPU:速度略快,但架構未更新?
最后,讓我們快速了解一下M3的NPU。從高層次來看,這次仍是一個16核設計。Apple聲稱它提供18 TOPS的性能,比M2的NPU快約14%(Apple的官方數據顯示為15%,很可能是四舍五入)。所有三款M3芯片似乎都有相同的16核的NPU設計,因此應該都具有類似的性能。
這個18 TOPS的數據引起了一些疑問。正如Ian Cutress博士指出的,18 TOPS實際上比A17 SoC中的NPU慢,Apple給出的A17的NPU性能是35 TOPS。
那么,究竟發生了什么?
在A17 SoC發布時,Apple開始引用INT8性能數據,與我們認為之前NPU版本(A系列和M系列)使用的INT16/FP16數據相比。該格式的較低精度允許以更高速率處理(以精度換取吞吐量),因此得出了更高的數據。
這里的18 TOPS數據顯然是INT16/FP16性能,因為這與過去M系列的說法以及Apple自己的圖表一致。然后,留下的問題是,鑒于INT8是最近才為A17添加的,M3中的NPU是否支持INT8。要么它確實支持INT8,這種情況下Apple在這里的信息傳遞存在困難;要么它是一個較老的NPU架構版本,不支持INT8。
這種差異總體上更像是一個好奇點而非一個問題。但看看Apple是否保持了其A系列和M系列NPU架構的一致性,或者我們在這一代產品中是否看到了分歧,肯定是挺有意思的。
M3?vs M2 vs M1
回到速度和性能規格上,看每一級別M系列處理器的規格表,與它們的直接前代產品進行下比較。這有助于更好地說明M系列芯片隨著時間的推移在內核數量、性能、內存支持和I/O方面是如何發展的。
標版M系列是該系列中最直接的。作為M系列芯片中的首款產品,Apple不斷提升芯片的能力和性能。但他們并沒有在功能模塊/內核方面增加太多。現在進入了第三代,我們看到的仍然是4P+4E的CPU設計,而GPU從第一代的8核增長到了M2和M3的10核。
為這個小野獸提供動力的是一個持續的128位內存總線。由于Apple在這一代M系列中沒有采用LPDDR5X,內存帶寬與M2保持不變,最多可達24GB的LPDDR5-6400,允許100GB/秒的總內存帶寬。
芯片的I/O也在各代產品中保持不變。M3能夠驅動兩個40Gbps的USB4/Thunderbolt端口,與M2和M1相同。此外,它仍然只支持兩個顯示器,內部顯示器和一個外部顯示器。
盡管內核數量沒有增加,但跨代產品的晶體管數量繼續增長,因為新功能和更復雜的內核設計占用了更多的晶體管預算。M3擁有250億個晶體管,比M2多出25%,或比M1多出56%。
然而,M3 Pro的發展路徑更加有趣。與M2 Pro相比,M3 Pro在配置上有一些顯著的不同,而且在晶體管數量上并沒有像其他芯片那樣增長。
從CPU內核開始,盡管M3 Pro像M2 Pro一樣共有12個CPU核,但性能核和能效核之間的平衡已經發生了變化。具體來說,它從8P+4E設計變成了6P+6E設計。雖然所有CPU核的總體性能都比M2的內核更高,但這就是為什么Apple官方的性能數據顯示,配備M2 Pro的MacBook Pro在CPU性能上只有微弱提升的原因。對于重度多線程工作負載,計算硬件實際上并沒有增加。
GPU內核數量也有所下降。M3架構GPU提供18個內核,而M2 Pro提供19個內核。這與普通的M3或M3 Max相反,后者要么保持不變,要么分別略微增加了GPU內核數量。
最后,這一切的原因是一個明顯較小的內存總線。M1 Pro和M2 Pro都配備了256位的LPDDR5內存總線,當使用LPDDR5-6400時,為SoC提供了200GB的總內存帶寬。然而,在M3 Pro上,Apple顯然將內存總線削減到了192位寬(減少了四分之一的內存總線),這反過來又將內存帶寬減少了25%,降至150GB/秒。
這些變化的組合意味著,從高層次來看,M3 Pro更像是一個比普通M3更強大的版本,而不是一個縮減版的M3 Max。但總體而言,性能核與能效核的平衡比例更接近M3的設計,內存帶寬也是如此。M3 Pro應該仍然比M3快很多,但在某些領域,它可能在性能上與M2 Pro相比只是一種側面升級。
Apple在M3 Pro上采取的更為保守的立場也反映在其晶體管數量上。M3 Pro的晶體管數量實際上比M2代降低了,從400億降至370億。因此,不論使用的是哪種工藝節點,這總體上是一個更簡單的芯片。與M1 Pro相比,兩代產品中晶體管數量的增長僅約10%。
至于為什么Apple沒有像其他M3 SoC那樣增加M3 Pro的規模,目前任何說法都是猜測。但從根本上來說,由于晶體管數量較少和芯片尺寸較小,M3 Pro應該比M2 Pro更生產成本更低。N3B的產量可能在這里有一定影響因素(產量較低等于芯片的實際成本更高),但只有TSMC和Apple知道這是否確實如此。
功耗也可能是一個因素,特別是在CPU內核重新平衡的情況下。8個性能核確實可以提供出色的性能,但它們肯定會增加功耗。Max SoC在某種程度上可以擺脫這個問題,因為它們是頂配芯片,也用于高端臺式機,并且主要面向臺式機替代類筆記本電腦的用戶。但對于更多Mac用戶來說,Apple可能在通過限制性能增長來控制功耗方面做出了努力。
出于這些原因,看看評測benchmark會如何展開將會很有趣。雖然這不太可能是Apple會講述的故事,但他們筆記本的性能和功耗應該能夠替他們說出很多故事。
最后,我們來看看M系列產品線中最大、最強的產品,Max系列。Max一直在內核數量和晶體管數量上推動極限,M3 Max延續了這一傳統。
與其M2前代相比,Apple在這里增加了另外4個性能核,總數達到12個性能核和4個能效核。這使它成為唯一一個性能核數量增加的M3系產品。因此,至少在良好的熱條件下,它應該是唯一一個在多線程CPU性能上看到顯著提升的M3芯片。盡管“良好的熱條件”確實是關鍵,因為這是一個非常強大的、需要冷卻的芯片。
在GPU方面,GPU核數量略有增加,從M2 Max的38核增加到M3 Max的40核。由于Apple沒有提供的可參考的相關性能數據,很難估計這在實踐中會快多少。
驅動M3 Max的是與前兩代芯片相同的512位LPDDR5內存總線。值得注意的是,這意味著Apple可用的內存帶寬在過去兩代產品中沒有增加,以跟上CPU和GPU內核數量的增加,因此Apple需要從其芯片架構中提取更多的效率(和緩存hits中)來保證SoC得到充分供應。
從Apple官方提供的芯片照片來看,我們可以看到Apple再次使用了他們定制的x128組織LPDDR5內存芯片,使他們能夠僅通過4個芯片連接一個512位的內存總線。這一代產品的最大內存容量已經增加到128GB,這對這些內存芯片中使用的die有著有趣的影響。除非Apple正在進行一些真正瘋狂的事情,否則獲得128GB LPDDR5的唯一方法是使用32Gbit LPDDR5芯片(總共32個)。我不知道目前有誰在提供這樣容量的芯片,因此看來Apple已經獲得了該內存供應商的首發權。對于其他公司來說,我們應該看到明年晚些時候在Windows筆記本上提供128GB LPDDR5(X)配置。
隨著CPU內核、GPU內核的增加,以及芯片各種構建模塊復雜性的普遍增加,M3 Max的總晶體管數量已經增加到920億個。這比M2 Max多出了37%,甚至比Nvidia基于TSMC N4工藝的GH100服務器GPU多出15%(120億個)。基于N3B構建的M3 Max應該明顯更小(低于400mm2?),但按照筆記本SoC標準,這仍然是一個巨大的芯片,更不用說如果Apple把兩個這樣的芯片放在一起形成Ultra配置會發生什么。Apple支付給TSMC的費用肯定價格不菲,但又有多少其他公司在筆記本的SoC上設計比服務器芯片還要多的晶體管呢?
M3 Macbook Pro???????????
總結一下,我們將很快看到M3芯片實際運行的情況。目前M3和M3 Pro已經開始交付。
與此同時,M3 Max的交付時間稍晚一些,Apple表示預計會在11月稍晚時候到貨。
此時,M2 Pro和M2 Max的筆記本,以及基于M2的13英寸MacBook Pro已經停產,因此這看起來將是筆記本方面非常迅速的過渡。Apple仍在其臺式機部件中使用M2 Pro/Max芯片,例如Mac Studio,但由于所有M3芯片已經上市,Apple升級其臺式機產品線只是時間問題。
編輯:黃飛
?
評論
查看更多