在絕大部分手機愛好者的印象中,當代手機GPU的性能與能效排名,理論上是蘋果最強,高通緊隨其后,而Arm的Mali GPU則顯著落后于前兩者。去年年中我們發布過一篇題為《ARM新版Mali GPU簡析:這次終于趕超高通和蘋果?》[1]的文章,簡單談了談Mali G77的理論性能。似乎在Arm的規劃中,Mali G77是有機會超越高通Adreno GPU的。
預計最早將采用Mali G77 GPU的手機SoC為聯發科天璣1000或三星Exynos 990;同代的高通驍龍865與Adreno 650前不久也已經發布。這會兒雖然還沒有采用Adreno 650 GPU的機型面世,采用Mali G77的中低端機型也才剛剛開售,但從2019年包括iPhone 11系列(A13 SoC)在內的諸多手機產品的問世、Imagination A-Series GPU新架構的發布,實則已經很容易發現當前手機市場的GPU表現,已非兩年前的格局。
前不久的Imagination發布會上[2],Imagination提到,如果將高通Adreno 640的性能和占地面積記作100%,Arm Mali G76則需要184%的占地面積,才能達到100%的性能。這大概是Mali GPU被對比得最慘烈的一次,似乎這也符合我們對Mali GPU性能、能效孱弱的歷史認知。
不過我們認為這個說法可能仍然不夠準確,畢竟這和具體的產品相關:高通驍龍855(Adreno 640)采用的是臺積電7nm制程,而與之對比的三星Exynos 9820(Mali G76)則采用三星自家的8nm制程,僅是制造工藝的對比就已經不公平了;事實上,不同SoC制造商對于Mali GPU的實施方案也不盡相同,華為海思對于Mali G76的實施方案和三星就是不一樣的。
本文我們借助在售機型的一些現成圖形計算跑分測試,以及GPU IP廠商對于新產品的解讀,來總結性地談一談當前手機GPU在性能、能效方面究竟是什么格局。
移動GPU市場的主要玩家
首先還是將需要對比的主要手機GPU產品(或IP)做個羅列。這里援引兩家統計機構針對移動GPU市場分析所得的數據,雖然數據并不是最新的,但仍可基本反映當前移動GPU市場的現狀。
從手機與平板出貨量來看,2019年第二季度的不同移動GPU出貨量的市場占比分別如下圖所示:
數據來源:Stategy Analytics
這份數據來自Strategy Analytics[3],由于我們沒有完整的數據,所以這張圖僅根據Strategy Analytics當時發布的新聞稿繪制。值得一提的是,其中的“Others”其他,主要是Imagination和Intel,這里僅知Imagination的市場份額仍高于Intel,但不清楚這兩者分別的占比具體是多少。這份數據也符合我們對于移動GPU市場的認識,即該市場的主要玩家就是蘋果、Arm、高通。
如果不從季度出貨量,而是從手機保有量來看不同GPU產品的市場份額,又是另外一番光景:
來源:DeviceAtlas
上面這份數據來自DeviceAtlas[4],發布時間在2019年年中。這份數據統計的是截至2019年第一季度,DeviceAtlas數據庫中36個不同國家的GPU使用率。這份統計實際可能受到DeviceAtlas樣本量的局限,不過它依然符合我們的基本認知。由于它考察的是手機保有量,而非當季最新出貨量,所以仍有大量老設備活躍。其中PowerVR Series7XT,實際是iPhone 7時代的GPU。其他更多出現在榜單上的設備皆來自高通和Arm。
下面的對比中,我們考察這些市場玩家最新推出的GPU旗艦產品,以及上一代GPU旗艦產品——除了蘋果這樣相對特殊的市場參與者,通常在GPU IP發布的半年到2年的時間里,實際的芯片產品才會問世,所以這些廠商的上一代GPU產品通常才是當前活躍在市場上的旗艦。
那么實際的對比對象就十分明確了,即:
? 蘋果A13 Bionic
? 蘋果A12 Bionic
? 高通Adreno 650(高通驍龍865)
? 高通Adreno 640(高通驍龍855)
? Arm Mali G77(三星Exynos 990/聯發科天璣1000)
? Arm Mali G76(三星Exynos 9820/海思Kirin 990、980)
? Imagination PowerVR A-Series
? Imagination PowerVR Series 9
需要注意的是,Imagination的近兩代IP實際上都沒有具體的芯片產品問世,Series 9XT的Furian架構作為轉瞬即逝的一代架構,很難做具體的量化,所以Imagination PowerVR只會在本文稍稍帶過。我們主要要對比的主角就是蘋果、高通、Arm。
話當年Arm與競爭對手的巨大差距
Arm Mali GPU在性能和能效方面相較蘋果和高通的差距,是的的確確存在于過往歷史中的。2016年,高通驍龍835(Adreno 540)時代,同場競技的選手分別是蘋果A11和Arm Mali G72/71。這時的Arm Mali GPU幾乎被前兩者吊打,無論是性能還是能效。
在此之前的Arm Mali GPU也基本處于被高通、蘋果按在地上摩擦的水平。其中比較具有代表性的是海思Kirin 960,這顆SoC選擇的是Mali G71MP8方案。Mali G71是最早采用Bifrost微架構的一代GPU IP。
當時采用Kirin 960的華為Mate 9在跑T-Rex霸王龍測試時(GFXBench),平均功耗達到了驚人的9.5W——要知道那會兒采用高通驍龍SoC、散熱設計最差的手機GPU平均功耗封頂也才5W,且驍龍821(Adreno 530)只需要Kirin 960不到40%的功耗就能達到相同的性能水平。在能效方面(Perf/W),驍龍821的GPU(Adreno 530)超過Kirin 960(Mali G71MP8)一倍還多。[5]
T-Rex是ALU算力需求較低,更偏向于Texture紋理、填充率和三角形輸出率的測試項目。而另一項知名的Manhattan 3.1測試,Kirin 960的情況也是慘不忍睹的。即便是一年以后的Kirin 970(Mali G72MP12)大幅提升了能效和性能,跑T-Rex測試也同樣需要同時代驍龍835(Adreno 540)2倍以上的功耗,才可勉強達到差不多的圖形計算性能,能效此時剛剛達到了驍龍835的一半。[6]
那會兒驍龍835的GPU平均功耗穩定在3.5-3.8W,相比前面幾代都還在穩步降低;海思Kirin與三星Exynos這些采用Mali GPU的SoC則明顯高于這個值一截。當時華為Mate 10(Kirin 970)跑Manhattan 3.1測試的平均功耗遠高于其可持續運行發熱控制閾限所在的6.3W,T-Rex測試可飆至接近8W。更氣人的是,Mali G71/G72沿用了Midgard架構時代的texture單元,還在采用雙線性過濾方案,所以游戲畫質還落后于同時代的Adreno GPU[7]。
那應該是高通Adreno在性能與效率表現上最風光的年代,驍龍835(Adreno 540)的峰值性能雖然沒有同時代的蘋果A11(iPhone 8/X)彪悍,但持續性能達到了同等水平——Galaxy S8的長時間游戲體驗實際也強于iPhone 8/X。
然而高通Adreno相較蘋果A系列的持平水準,以及相比Arm Mali的絕對領先優勢在2019年的驍龍855身上逐漸喪失;不僅是蘋果在GPU方面的持續發力,而且有Arm的越來越逼近。
2019年的那些移動GPU
2019年的Android旗艦主要采用的SoC就是高通驍龍855(+)、華為海思Kirin 990,以及三星Exynos 9820。同代iOS設備即iPhone 11采用的是蘋果自家的A13 Bionic SoC,GPU部分依然是蘋果自研的IP方案。在對比跑分數據之前,還是先聊聊這幾款產品(或IP)相比前代的一些變化。
Bifrost架構前兩代產品G71/G72相對災難性的表現,在Mali G76身上得到了極大程度的緩解。2018年3月,Arm宣布推出Mali G76時宣稱,基于TSMC 7nm工藝的Mali G76預計能實現性能50%的提升,性能密度提升30%、微架構效率提升30%。至于機器學習性能2.7倍提升就不是本文要探討的重點了。
Mali G76雖然仍是Bifrost架構,但優化幅度還是比較大的。其中比較值得一提的是后端執行部分的加寬:G71/G72采用的是4-wide SIMD單元,每條lane處理單獨的FMA(Fused-multiply-add,融合乘加)和ADD/SF(加法)管線;也就是說單周期wavefront寬度就是4指令;Mali G76將其拓寬至8-wide,比先前加倍了ALU單元數量。
Arm一直在采用很窄的wavefront——可對比的是,我們在Imagination A-Series架構剖析中提到[2],A-Series的這部分已經拓寬到了128-wide。Arm采用這種較窄的方案,原因是期望避免線程發散(thread divergence)帶來的ALU閑置問題。不過較窄的wavefront(或warp size)帶來的問題就是,與ALU配套的控制邏輯電路更多,ALU單元數量與控制電路之比更小。更寬的SIMD可以帶來更好的芯片面積效益,實際相同芯片尺寸下也可以塞進更多的ALU單元。4-wide就實際代碼的線程發散來看,也實在沒有必要。Arm自己也說,現在的游戲GPU代碼粒度需求和G71時期已經不大一樣了。
與SIMD lane同時提升的,還有相應支持的cache和通路,以及像素、紋素(texel)硬件,保持先前相同的ALU與紋理/像素單元的數量比值關系。G76實際上有些類似于把兩個G72核心合并成一個核心,但實際所占的面積卻比兩個核心小得多。Arm官方比較推薦的G76核心數目是12個,雖然這樣的小核心數量仍然比蘋果、高通Adreno這些GPU多多了,但G76在走多核心、小核心的思路上已經發生了一定程度的轉變。
G76相比前代的其他改進還包括增加INT8的進一步支持——這應該主要是針對機器學習的;針對多邊形回寫操作,G76采用亂序回寫機制,在發生回寫停滯時具備了更好的操作彈性;其他調整還有針對tile buffer、線程本地存儲機制等。
就Arm自己紙面上對Mali G76的宣傳來看,這種提升其實是比較中規中矩的,并非大幅跨越。
有關高通Adreno 640(驍龍855)能談的理論部分則并不多,因為Adreno對外界而言始終是個黑匣子,高通幾乎不對外界披露太多有關Adreno的技術細節。可分享的是高通提供的一些數據,包括相比上代提升20%性能(相比Adreno 630);另外高通還在發布會上提到Adreno 640增加了執行FP32、FP16操作的ALU單元數量,增加50%。外媒AnandTech曾推測Adreno 630每個核心的ALU數量是256個[8],總共2個核心。
那么這樣算來Adreno 640每個核心的ALU數量為384個,雙核總共768個(理論上Adreno小升級應該不會再增加核心數)。ALU lane數量增加和高通宣稱20%的性能提升并不對等,所以預計Adreno 640的頻率可能是下降的。另外高通在《絕地求生》40fps演示中宣稱功耗下降將近30%,未知這里的功耗指的具體是什么功耗。
Adreno 640在特性方面包括支持真正的HDR游戲、Physically Based Rendering(基于物理的渲染)游戲——通過更為準確的光線物理與材料交互,讓游戲、虛擬現實提升真實性;圖形管線支持10bit色深、Rec 2020色域來實現HDR,支持HDR10+與Dolby Vision格式;支持120fps游戲、8K 360°視頻回放。
來源:ChipRebel[9],TechInsights[10] via AnandTech
這部分最后再來談談蘋果A12/A13。蘋果本身也很少公開自家GPU的技術信息。我們可挖掘的大致也就是通過die shot來做觀察。A12的GPU部分看起來實則非常像A11——蘋果A11采用的仍然是Imagination的Rogue架構GPU。A12采用的仍然是TBDR(基于tile的延后渲染)機制,這在移動GPU中比較有代表性的目前也就是Imagination了;此外蘋果也支持PVRTC紋理壓縮(PowerVR Texture Compression)。有充分理由相信即便蘋果2017年和Imagination停止合作,其“自研”GPU也依然保留了Imagination基因,只是雙方的授權協議細節未知。
A12 GPU(iPhone Xs)一個較大的改進在于支持內存壓縮,即從GPU到主內存的frambuffer壓縮。蘋果是支持GPU存儲壓縮特性,相對比較晚的一家SoC廠商了。不過從實際效果來看,這個特性的加入的確讓A12 GPU實現了很大程度的性能與效率提升。蘋果宣稱A12 GPU性能提升達到了50%,核心數目增加到4個。
A13 die shot,來源:AnandTech[11]
A13 GPU(iPhone 11)的die shot可見,最大變化在于后端ALU模塊和紋理單元,前端部分看起來是比較相似的;蘋果宣稱A13性能提升20%,相同性能下的功耗下降40%;另外蘋果特別提到加強了SoC散熱能力:iPhone X與Xs的發熱表現的確比較巨量。
Adreno、Mali、蘋果GPU實際性能對比
以上基本都是理論分析,和廠商宣傳中的性能提升。在此我們基于AnandTech過去1年所做的測試,做GPU基準跑分匯總對比。
在測試對比的手機設備選擇上,A12、A13顯然就是iPhone Xs Max與iPhone 11 Pro Max這兩款機型;Arm Mali G76的選擇也比較簡單,對應華為Mate 30 Pro(Kirin 990),與三星Galaxy S10+(Exynos 9820)。
尤為值得一提的是,海思Kirin 990的Mali G76方案規模更大,海思采用的是16個核心的Mali G76,頻率約在600MHz(Kirin 990 5G似有將頻率提升至700MHz);三星Exynos 9820的GPU配置為Mali G76MP12,頻率約在702MHz。
Adreno 640(驍龍855)的終端設備選擇比較多樣,而且不同手機制造商對Adreno 640的系統設計所呈現的性能、效率差別實則是比較大的。這里我們選擇實施方案比較有代表性的幾款機型,分別是一加7 Pro,谷歌Pixel 4 XL,以及黑鯊2、三星Galaxy S10+(驍龍855版)。通過多款機型的對比,實則也能看出OEM制造商在系統、散熱設計方面的功力。
需要注意的是,這幾款GPU(及對應的SoC),以及手機上市的時間是不一樣的,跨度可能超過了半年;而且手機由于屏幕尺寸差異,散熱效率的基礎也不一樣——屏幕尺寸有市場定位導向,并不是廠商可任意做大的;針對不同細分市場也存在手機散熱設計、溫控機制等差別,比如黑鯊2是游戲定位的,它以犧牲手機輕薄性為代價做整體系統設計,理論上可以獲得更好的性能表現(但似乎也只是理論上)。
這里還需要強調一點,蘋果A13的制造工藝會更先進,而三星Exynos 9820則相較其他SoC的制造工藝都略遜一籌,為8nm LPP。所以并不能簡單說,誰跑分更高、誰的設計就一定更優秀。且測試仍涉及軟件、系統、驅動層面,所以這里的對比可能并不嚴謹。
測試項目選擇是AnandTech常規的幾項,包括了3DMark Sling Shot 3.1 Extreme Unlimited – Physics/Graphics
數據匯總自AnandTech
在以上測試項中,我們認為最能表現GPU圖形計算能力的,就是GFXBench Manhattan(曼哈頓),T-Rex(霸王龍),以及Aztec Ruins高畫質測試場景,測試結果單位為幀率(fps,每秒幀數)。不過這幾個測試都有自己的偏向性,比如T-Rex測試相對而言更偏向GPU紋理與填充率吞吐表現,而Manhattan則屬于shader核心重型任務。圖表中橙色柱狀條表示持續性能,藍色表示峰值性能。
需要指出的是,峰值性能并不是沒有意義的。蘋果在早期宣傳中更喜歡談持續性能——即持續長時間跑圖形計算高負荷任務的穩定性能狀態,因為這對于游戲的實際體驗才是更有價值的數據。但從iPhone Xs開始,蘋果也越來越關注設備的峰值性能,因為峰值性能追求的是瞬時突發性能:iPhone在大量場景實際都依賴GPU計算,包括app中的通用硬件加速,甚至拍照處理的GPU計算——這類場景更看重突發性能,需要盡最快速度處理一些固定負載任務。GPU的這種通用性,令其峰值性能成為需要考察的重要指標。Android系統近些年實則也一直在這方面努力。
從我們匯總的柱狀圖不難發現,蘋果A12/A13在GPU性能方面是獨占鰲頭的,其他表現最出色的GPU峰值性能才剛剛達到了A12的持續性能。
而高通Adreno 640組(中間4款設備)與Arm Mali G76組(最后2款設備)的對比,至少就性能來看是很難簡單分出伯仲的。尤其我們看到華為Mate 30 Pro在Mali G76的方案實施中表現出了完全能夠和Adreno 640比肩的性能水平,持續性能甚至比絕大部分Adreno 640機型表現更出色。
而且海思Kirin 990這一代Mali實施方案,也真正實現了對三星Exynos的超越——這在以往也是比較少見的,因為前些年三星總能在同代Arm Mali實施方案中領先于海思。不過這一點仍需要考慮到Kirin 990的GPU是在Kirin 980基礎上的一次改良,且Kirin 990推出時間遠晚于三星Exynos 9820。
值得一提的是,雖然一加7 Pro在持續性能和峰值性能方面看來十分接近,也表現出了Adreno 640機型的最佳水準,但這和一加7 Pro溫控機制十分激進有關——這款手機允許屏幕表面溫度飆升到51℃,所以其持續性能會明顯強于其他Android機型。可對比的是Galaxy S10+溫控會將設備表面溫度控制在42-43℃之間;華為Mate 30 Pro則在45℃上下。這組數據中另外比較奇怪的是黑鯊2,這是一款定位玩游戲的手機,但AnandTech測試中,其溫控非常保守,導致黑鯊2在整個Adreno 640(驍龍855)陣營中都屬于性能較弱的水平。
來源:AnandTech
性能表現之外,GPU的功耗和效率也很重要。這里選擇Manhattan與T-Rex測試的系統有功功率(從設備總功耗中減去相應負載場景的閑時功耗),以及最終的效率來做對比——這是以往Arm Mali被蘋果和高通碾壓的絕對弱勢項(主要可以參見表中最末一位的Exynos 8895)。
iPhone這兩年若單論GPU突發以及平均功耗(第四列Avg. Power),可以說是高得驚人的,尤其A12快速推升到高性能的動作,會將3Dmark跑到崩潰,崩潰前的瞬時功耗可達7-8W;A13已經收斂不少,但峰值功耗依然可超過6.2W。上表中,iPhone后面的“Warm”表示在測試項跑過3遍以后,整體GPU性能會下降并趨于穩定,這個狀態下的功耗會更加合理;而“Cold/Peak”則表示設備溫度較低時,初始跑測試可達到的狀態。
蘋果A12(iPhone Xs Max)在用戶體驗方面并不算好,主要原因是在GPU任務負載伊始,就傾向于快速達到滿負荷運轉狀態,并致設備在使用的前幾分鐘就明顯升溫。實際上蘋果GPU的持續性能已經足以應付大部分工作,而不需要在很多時候這么“拼”。蘋果在A13這一代更偏著力在溫控方面,體驗也就比A12好了很多。
即便如此,如果看能效——即性能成績÷功率=每瓦性能(上表中的最后一列),則A12/A13 GPU部分依然能夠甩開其他競爭對手很遠的距離。在達到與A12 GPU相同性能水平下,A13 GPU的功耗低了32%——雖然沒有蘋果吹的40%那么厲害,但也已經十分優秀。
過去高通Adreno雖然在絕對性能上無法與蘋果Ax GPU相提并論,但在能效方面,高通離蘋果還是十分接近甚至不相伯仲的。但在最新一代產品中高通似乎已經被蘋果甩開了一段距離。T-Rex測試中,驍龍855版Galaxy 10+的GPU能效水平為40.70fps/W,相較穩定狀態下的A13差距達到了將近50%。
更糟糕的是,Mali G76似乎已經在游戲圖形計算效率方面達到了與Adreno幾乎持平的水平。Mali對Adreno的步步緊逼,實則更體現在2018年的上一代Mali G76產品上,同樣采用Mali G76的海思Kirin 980(但實施方案與Kirin 990有差異),當時宣稱GPU能效(power efficiency)提升178%——2018年AnandTech針對Kirin 980 GPU(Mali G76MP10)的測試發現,在GPU滿載狀態下,平均能效提升相比Kirin 980(Mali G72)達到了100%,如果按照相比Kirin 970同等性能時的功耗與效率來看,則其GPU能效提升的確可能達到了華為宣傳中的178%,這在行業內都是相當罕見的提升幅度。
不過Kirin 980的GPU依然在性能和效率方面落后于同代驍龍845,部分測試的能效成績與驍龍835接近。但此時的差距已經比Kirin 970時期縮小了非常多。到Kirin 990在GPU能效方面的表現,就Aztec與Manhattan測試已經能夠和驍龍855打得有來有回,甚至部分超越(不過這與不同手機設備的具體情況仍然相關),這在以往是從來沒有過的。
最后再來看看3Dmark Sling Shot 3.1 Extreme Unlimited – Physics/Graphics測試,這兩項測試側重考察的性能重點與前面的測試不同,3Dmark Physics測試實際上是3D負載中偏CPU性能的測試。華為Mate 30 Pro表現出了最出色的成績,這和Cortex A76的prefetcher加強,以及Kirin 990本身的存儲子系統加強有關;Graphics偏重圖形測試,蘋果仍然表現出了不錯的成績,對驍龍855實施比較激進的一加7 Pro也表現不錯。
需要再次強調的是,測試結果與系統、軟件版本都有關系,iPhone在3Dmark測試中的表現普遍并不算出色,必然是遇到了一些瓶頸的;基于iPhone Xs Max,在iOS 12與13兩套系統中的3Dmark Graphics測試結果上就存在20%的差別。所以上述結果和展示方法并不嚴謹。
不過在以上整體對比中,我們甚至可以認為,圖形計算頭一次不再成為Arm Mali,以及海思Kirin SoC的軟肋。這和兩年前的狀況已大不相同。
不過以上我們并沒有對比GPU的“面積效率”或“性能密度”,比如蘋果A13的GPU部分總面積達到了15.28mm2,這是相較大部分移動GPU都明顯更大、成本更高的方案。高通驍龍和Adreno系列近些年都是以小尺寸著稱的。
三星Exynos 9820與海思Kirin 990 5G die shot,分別來自ChipRebel[13]與TechInsights[14],標注是由AnandTech進行的
從TechInsights公開的信息來看,驍龍855的die size為73.27mm2,這是主流SoC中相當小的方案。只是沒有研究機構公開對驍龍855 die的模塊labeling,所以我們不清楚Adreno 640大致占到其中多大的面積。可參考驍龍845的Adreno 630占地面積為10.69mm2[15]——考慮到Adreno 640加大了后端,其尺寸理論上會更大。
而上圖分別是Exynos 9820與Kirin 990 (5G版)的die shot。Exynos 9820的die size大約是127mm2;Kirin 990 5G的整體die size約為113mm2。Kirin 990 5G雖然采用的制造工藝更先進,但因為GPU規模更大,目測實施方案的占地面積可能會大于Exynos 9820的方案,整體應該是差不太多的。
Imagination在上個月的發布會上提到,Exynos 9820的Mali G76MP12用184%的面積,才達到與驍龍855 Adreno 640相同的性能——如果這個數據是準確的,那么高通目前仍然在面積效率方面具有相當的領先優勢,即便Mali GPU已經在性能和能效方面做到了幾乎與Adreno齊頭并進。這一點我們猜測與Arm Mali仍然采用較窄的wavefront(或warp size),以及小核心、多核心的思路有關。
2020年的移動GPU展望
2019年年中,Arm發布Mali G77,我們之前也已經在《ARM新版Mali GPU簡析:這次終于趕超高通和蘋果?》一文中對Mali G77的架構改進做了比較具體的闡述[1]。這次在架構層面的改進幅度還是相當之大的,新的Valhall架構進一步將執行引擎的wavefront size(或warp size)增加到16-wide;以前的3個執行引擎合并后分成兩條ALU管線,每條有各自的FMA相關單元(融合乘加單元,也就是每個核心32個FMA);TMU單元(紋理貼圖單元)吞吐能力翻番。
Arm當時提到,G77的性能密度提升30%(每mm2性能提升1.2-1.4倍),能效提升30%(每瓦性能提升1.20-1.39倍);綜合峰值圖形性能預計可提升40%——這個值當然與不同廠商的實施方案還將息息相關。
前不久,高通也發布了最新的驍龍865及與其配套的Adreno 650。比較令人在意的是,高通今年的Adreno仍然停留在600系列——這樣一來,這已經是高通連續第三年采用Adreno 600系列來為產品冠名了,這在以前似乎是從沒有過的,可見這代升級仍然并不是什么太大幅度的升級。
高通提到,Adreno 650還將繼續增加ALU單元+50%,以及像素渲染單元+50%(每個時鐘周期處理+50%的像素,也就是ROP光柵化處理),預計總體性能提升為25%。如果說ALU單元數量增加50%,推測Adreno 650的核心數可能要增加一個,或者也可能是單核ALU數量變為512個;ROP單元也增加的話,最終講改變處理紋素:像素單元比例。而在功耗與效率方面,高通表示在相同性能水平下,Adreno 650效率會高出35%;另外持續性能會明顯優于Adreno 640。
AnandTech對驍龍865的參考設計機型做了測試[16],僅有峰值性能數據。這里只摘錄其中的Manhattan 3.1與T-Rex 2.7測試項,其GPU性能水平如上圖所示。測試結果基本符合高通所說的25%性能提升,峰值性能優于2019年的Adreno 640與Mali G76,但仍未達到蘋果A12的水平。其能效(Perf/W)接近A12的水平,領先于Mali G76與Adreno 640——這一點當然也是必然的,這里不再給出詳細數據。
值得一提的是,最終驍龍865手機依然會由于OEM廠商在實施方案上的差別而存在性能與能效的差異,所以這個數據只能作為參考。
25%的性能提升實際是年度迭代比較符合常規的數字,不過如果Arm宣傳中提到的Mali G77性能與能效提升水平的確能夠實現,那么高通的這點提升將不具有競爭力——至少在性能與功耗效率方面,Adreno在2020年有被Mali趕超的可能性,高通正逐漸丟失往日相較Arm在圖形計算方面的絕對優勢地位;且與蘋果存在越來越大的差距。
最后仍然需要提到Imagination,雖然Imagination近些年在移動GPU的市場份額方面還在逐年萎縮,但在GPU性能與效率上卻是個十分恐怖的競爭對手,尤其在前一陣PowerVR A-Series新架構發布以后,我們也已經對新架構做了相對詳細的解析[2]。
Imagination宣稱,如果將Adreno 640的占地面積和性能均視作100%,則Mali G76需要184%的面積才能達到100%的性能;而A-Series GPU可以“更小、更低的功耗”實現175%的性能。這個數字實則遠超今年即將大規模上線的高通Adreno 650,以及Arm Mali G77。
而且就在這兩天,Imagination剛剛宣布蘋果再度與其簽署多年授權協議,未來蘋果A系列芯片的GPU仍能見到Imagination的IP方案,雖然我們不清楚個中合作細節,蘋果目前“自研”的GPU IP中也還能見到Rogue架構的影子。但或許,蘋果對于Imagination這次發布的A-Series,以及規劃中的B-Series、C-Series、D-Series都十分感興趣。
而蘋果與Imagination恢復合作,預計還將促成更多SoC制造商與Imagination的合作。這將成為刺激移動GPU市場推進的又一大變數。在2020年的移動GPU市場上,高通大概是現如今最需要重整旗鼓的市場玩家了。
-
cpu
+關注
關注
68文章
10855瀏覽量
211601 -
gpu
+關注
關注
28文章
4729瀏覽量
128897 -
soc
+關注
關注
38文章
4163瀏覽量
218170
發布評論請先 登錄
相關推薦
評論