電子發燒友網報道(文/周凱揚)隨著2023年步入尾聲,無論是蘋果還是高通,都已經推出了新一代的旗艦手機SoC,這也昭示著安卓與iOS陣營手機性能的又一次年末大比。然而,對比過去拼通用計算性能和通用圖形計算性能的局面,今年兩大廠商都已經開始卷向其他的計算負載,比如光追、超分這樣的特殊GPU負載,以及終于被積極調動算力的NPU單元。我們就從CPU,GPU和NPU三個手機SoC主力計算單元來分析蘋果A17 Pro和高通驍龍8Gen3在設計上新一輪迭代。
CPU,單核多核性能各有千秋
A17 Pro和驍龍8Gen3分別是基于臺積電3nm和4nm工藝打造的芯片,在最先進的半導體工藝下,CPU上的提升尤其引人注目,尤其是蘋果的A17 Pro還是首發3nm的芯片。然而在各路實機測試的表現中,兩者的成績卻是各有勝負。
A17 Pro雖說用上了最先進的3nm工藝,且對微架構進行了一定的改進,最大主頻從A16時期的3.46GHz大幅提升至3.78GHz,但A17 Pro依然保持了6核(2性能核+4能效核)的配置,即便是在蘋果自己給出的性能指標中,相較上一代也只有10%的性能提升。
而高通的驍龍8Gen3 Kyro CPU,通過升級大核為Cortex-X4、升級中核為Cortex-A720、升級小核為Cortex-A520,并將一個額外的能效核轉換成了性能核,從上一代的1:4:3配置,換成了1:5:2配置。正是因為在如此激進的設計改動下,8Gen3的CPU實現了30%的性能提升,20%的能效提升。
主流手機SoC CPU的Geekbench 6測試 / androidauthority
然而在Geekbench 6的測試中,我們還是能看到一些有意思的對比。根據androidauthority對iPhone15 Pro和驍龍8Gen3參考機的測試可以看出,在單核性能上,A17 Pro還是領先一大截的,而在多核性能上,驍龍8Gen3終于實現了反超。這不免讓人期待起未來Snapdragon X Elite的CPU架構下放到手機SoC后,高通CPU的單核性能會有怎樣的提升。
GPU,光追和超分辨率技術
至于GPU性能的對比,結果與上一代似乎并沒有太大不同,在3D Mark的測試中,A17 Pro的GPU全方位落后于驍龍8Gen3。根據蘋果的說法,他們對這一代GPU進行了歷史上最大的一次重新設計,但從這個結果來看,重新設計的方向應該主要放在了硬件光追和超分技術上,其相比前代提升的20%GPU性能還是無法與驍龍8Gen3相提并論。
主流手機SoC GPU的3DMark測試 / androidauthority
今年的手機SoC設計中,硬件光追已經成了標配。蘋果稱其GPU加入的硬件光追相較基于軟件的光追,速度提升了4倍,更適合用于沉浸式AR應用和游戲體驗。不過相較從上一代驍龍8Gen2就開始布局硬件光追的高通來說,蘋果在硬件光追上的性能水平還是有所不及。從上面的3DMark光追測試成績可以看出,8Gen3的硬件光追加速性能要高出A17 Pro一大截。
高通在硬件光追的開發上也領先于蘋果,相比去年8Gen2僅有實時光追支持,今年的驍龍8Gen3還加入了對虛幻5引擎Lumen全局光照和反射系統的支持,可以實現比普通硬件光追更好的光線表現效果。
除了硬件光追以外,無論是高通還是蘋果,都在這一代GPU的設計中加入了超分辨率的技術,比如蘋果的MetalFX和高通的Snapdragon Game Super Resolution(GSR)。為了運行性能要求更高的3A游戲大作,僅僅靠堆高GPU性能是遠遠不夠的,受限于智能手機的散熱結構,我們需要英偉達DLSS或AMD的FSR這類超分辨率技術進一步降低配置要求和功耗。
去年的WWDC 2022上,蘋果正式宣布了MetalFX這一超分技術,利用相對較低分辨率的圖像輸出更高的分辨率,從而減少渲染負載,提高應用或游戲體驗。不過屆時該技術主要是為M2系列的處理器開發的,而如今蘋果已經打算將這一技術引入手機GPU。
手機超分技術對比 / 高通
而高通則在今年推出了GSR這一超分技術,高通宣稱可以提供10bit HDR 144FPS的游戲性能體驗。從上述超分技術對比中可以看出,GSR最高可以實現兩倍的超分。高通還表示,雖然GSR技術兼容大部分GPU,但只有在驍龍硬件平臺上才能發揮出最大性能。
不過在實現方式上,蘋果的MetalFX和高通的GSR還是有一些區別的。高通的GSR是一項單通空域超分辨率技術,與AMD開源的FSR 1.0實現方式一樣。而蘋果的MetalFX,則給到了開發者選擇,既可以采用空域超分辨率技術,也可以使用FSR 2.0一樣的時域抗鋸齒超分辨率技術。
不過,高通選擇這一技術路線不是沒有原因的,首先空域超分更容易達到較好的性能和圖像質量表現,比過去的插值超分在邊緣細節上更有優勢。而時域超分雖說可以實現更好的圖像質量,但其所需的數據輸入在手機圖形的渲染管線卻不常見,只有一部分PC游戲移植到手機上更適合這一方案。
這點從蘋果MetaFX的開發文檔中也可以看出,如果只選擇空域超分的話,開發者只需要輸入像素色彩,而選擇時域超分則需要提供像素色彩、深度和動態信息,這對游戲開發者來說,就需要在渲染管線上花更多的工夫。所以高通的GSR和蘋果MetaFX中的空域超分更容易適配,相信未來即將支持超分的一大批游戲都會選擇這一方案。
NPU,設備端生成式AI
自今年生成式AI成為熱門應用后,手機SoC廠商以及大模型應用開發者們均看到了手機AI計算單元NPU的另一大功用。尤其是在高通驍龍8Gen 3的產品詳情中,高通著重介紹了這一芯片平臺在生成式AI上的優勢。
驍龍8Gen 3的Hexagon NPU相較上一代有了質的提升,性能提升高達98%,能效比提升高達40%。這也是高通首度在NPU中加入支持多模態生成式AI模型的AI引擎,該引擎支持LLM(大語言模型)、LVM(語言視覺模型)和ASR(自動語音識別)模型,端側最大支持100億參數的模型。
在LLM上,以Meta 70億參數的Llama 2模型為例,驍龍8Gen 3支持到20token每秒的表現。同時NPU也進一步提高了Sensing Hub各大傳感器調用用戶數據的能力,比如同時支持兩個始終感應的攝像頭等。
蘋果今年似乎并沒有著重強調A17 Pro的神經引擎,除了35TOPS的計算性能。不過從M2和M3系列的神經引擎配置來看,蘋果或許對于A17 Pro這一智能手機SoC的AI性能有更多的準備。要知道,同為16核的神經引擎,去年的A16和M2芯片其AI算力只有17 TOPS,哪怕是剛公布的M3系列芯片,其AI算力都只有18TOPS。
寫在最后
至此,我們看到了高通和蘋果兩家廠商對于AI計算的重視,只不過兩者的側重點略有不同。比如目前蘋果目前更注重于打造“直覺式AI”,著重加強設備端系統級AI和多媒體AI的表現,比如輸入法自動更正、個人語音、拍照人像模式、第三方app中的圖片降噪/超分等。而高通已經開始擁抱生成式AI,尤其是智能語音助手的AI性能,也給到了第三方AI應用開發者更自由的硬件資源調用。
然而無論是從紙面參數,還是從各大性能測試得出的結果可知,安卓旗艦SoC與蘋果SoC的性能代差已經完全消除了,甚至前者在GPU性能上已經實現了反超。由此也可以看出,半導體工藝提升帶來的性能收益已經在縮小,反而是芯片微架構和核心配置決定了最終的手機SoC性能。
-
gpu
+關注
關注
28文章
4729瀏覽量
128892 -
NPU
+關注
關注
2文章
279瀏覽量
18584
發布評論請先 登錄
相關推薦
評論