本文作者:付斌
來源:半導體行業觀察
曾經,我們只能在PC或主機端體驗到畫面細膩精致和流暢的3A游戲,而現在,手機廠商大力投入自研芯片,將光線追蹤等技術做到手機里,移動GPU處理性能也越來越強勁。
ABI在2022年的調查顯示,手機游戲用戶會從26億增長到2030年的39億,至2026年85%的游戲玩家首選在手機上玩游戲。顯然,光線追蹤成為手機征服玩家的利器。
縱觀當前市場上的光線追蹤方案,針對PC端,英偉達最新發布的Ada Lovelace架構,在光追方面做了不少重大更新;英特爾Arc Alchemist GPU 無論是光追功能還是游戲性能,都給足了玩家期待。在移動端,三星Exynos 2200 屬于較早落地的支持光追的手機,其采用了AMD RDNA 2 架構;高通全新 Adreno GPU 加入了專門的移動光線追蹤加速單元;同時以 Imagination、 ARM 為代表的芯片 IP 供應商,陸續推出支持移動光追的 GPU 架構。其中 Imagination 的PowerVR Photon 架構被稱為業界首個移動端硬件級光追架構,采用Photon架構的IMG CXT GPU成為了首個在移動端實現桌面級視覺效果的GPU IP。其后一年內ARM 也推出了其首款支持光追硬件加速的GPU IP。
目前來看,可真正落地的移動端光追方案還在初期,但不管是 SoC 芯片商還是手機廠商,包括游戲開發商,都對在移動端上實現光線追蹤躍躍欲試。就在今年1月初Imagination 宣布推出IMG DXT 系列 GPU,這款開創性的光追 GPU 將加速該技術的落地和普及,并應對不斷增速的手機游戲市場。
應對手機游戲的畫質革命現如今,手機游戲有三個趨勢值得重點關注:
- 其一,玩家對游戲沉浸感的體驗要求越來越高;
- 其二,對手機性能要求越來越高,任何用戶都不可能喜歡在只有5~10幀的場景下游玩游戲;
- 其三,手機功耗引發的電量焦慮需要引起重視,一直在充電或者快速掉電對手機玩家來說都是不可接受的。
Imagination DXT系列GPU為滿足手機游戲需求,在設計之初便關注到了上述手機游戲趨勢。為了加快光線追蹤在移動端的普及,推出了更具設計擴展性的GPU。在IMG DXT圖形處理單元中引入了基于PowerVR Photon架構的光線加速集群(RAC)的演變。DXT的重點是通過引入片段著色率(FSR)功能和增強的后處理技術來提高效率,同時改變布局,為光線追蹤提供可擴展性和靈活性。
DXT系列GPU的三款產品面向三種機型:主流機更在意單位面積性能,高端機在于更高的性能實現,旗艦機追求更高性能和手機整體表現,Imagination提供不同的算力, 像素填充力和光線追蹤的可選RAC (Ray Acceleration Cluster)。
光線追蹤可以說是Imagination GPU IP的招牌技術之一,該技術可以讓3D游戲場景中的光照更加貼近真實生活中的折射和反射。但實現這樣的光線折射和漫反射卻需要很大的資源開銷,早期甚至高端的服務器也需要一定時間來“烘焙”這些畫面,而現在,對桌面級GPU渲染實時光追已不再是難題,Imagination推出的高效可擴展光追技術使得主流手機也都能使用此項技術。
光線追蹤等級并非所有形式的光線追蹤支持都是相同的。現實情況是,任何具有計算能力的GPU都可以執行光線追蹤,但它們之間的區別在于可以執行光線追蹤的效率和可以達到的性能水平。因此,Imagination引入了光線追蹤等級系統(RTLS)的概念,以突出各種等級光線追蹤的效率。
需要強調的是,Imagination提供的是第4級別的硬件級光線追蹤,且是可擴展的高級光線追蹤技術。
在移動端實現光線追蹤并非易事,因為移動端的能耗和運算帶寬本身受到的限制就比較大,目前市面上絕對大多數光線追蹤都是L1、L2級別的。L1級別的光線追蹤是純軟件光線追蹤,需要消耗大量的CPU資源,L2級別的解決方案中具有判斷光線和物體邊框及三角形是否相交的檢測器,但所有其它RT處理仍保留在著色器代碼中,也就還需要額外的GPU計算資源,而到了 L3級以上都需要具有硬件BVH的分類、相關性的回溯處理等專門的光線處理模塊。Imagination的CXT和DXT系列提供的都是L4級別的光線追蹤。
當然,需要強調的是游戲市場上存在一定誤區,很多人認為只要是使用硬件光線追蹤,幀率一定會下降,游戲運行一定會更慢,其實這是不正確的一種想法。因為現在游戲中或多或少一定都是用了傳統的技術進行光影的渲染,哪怕不加任何新的光線追蹤效果,只是把原來的光影效果從傳統的渲染方式替換成實時光線追蹤,讓硬件承擔這部分的工作,從而使整體的運算結果更快,讓幀率也更高。
集大成之作的性能飛躍IMG DXT系列產品擁有6個關鍵技術值得關注:
- Vulkan 片段著色率(FSR):IMG DXT為 Vulkan 提供了片段著色率 (FSR-Fragment Shading Rate) 支持,為開發者帶來了性能上的裕量。FSR在盡可能不影響視覺質量的前提下,減少了處理的片段數量,并大幅提高圖形性能。光線追蹤技術能很好地和FSR技術結合在一起,配合可擴展RAC,可用更小的RAC實現這個場景下的游戲光追效果,為用戶帶來更好的沉浸式體驗;
- 2D 雙速率紋理處理(Dual-RateTexturing):在其紋理處理單元 (TPU) 中擁有創新的專利特殊模式,可為后處理效果創建“快速通道”。在使雙線性濾波性能幾乎翻倍的同時,最大程度地減少面積的增加并降低整體功耗。
- 提高紋理和計算性能:采用全新的著色器處理單元 (SPU) 設計。DXT GPU 每個 SPU 的高端計算和紋理 (ALU/TPU) 性能提高 50% 以上,這要歸功于全新的三重通用著色器集群(SPU)設計(3個ALU/TPU 單元),而以前的架構只側重于雙USC設計(2個ALU/TPU單元)。
- 流水線數據主控器:改進流水線后,當前場景正在渲染時,無需任何間隙和等待,數據主控器現在就可以開始為下一個 3D 場景創建工作負載。在提高性能和能效的同時,實現工作負載生成的流水線。
- ALU 寄存器組性能翻番:統一存儲的改進提升了 ALU 寄存器組的吞吐量。而且,IMG DXT GPU的ALU寄存器組數量是上一代的兩倍。
- RISC-V固件處理器:長期以來,Imagination的GPU一直得益于集成的固件處理器,實現了許多獨特的功能,如虛擬化,系統安全隔離等。DXT升級采用了在汽車系列中經過芯片級驗證的RISC-V CPU,同時性能提升了40%。因為固件處理器是繪圖任務調度的核心,它的升級給DXT帶來了全方位的性能改進。
Imagination的深謀遠慮與移動端GPU相比,云游戲正在興起,那么移動端的GPU和放在數據中心中的GPU到底會是什么關系?
Imagination 公司技術產品管理高級總監Stephen Barton認為,Imagination其實也有相應的產品,比如B系列的多核系列產品,具有虛擬化的技術,可以八核對應8個以上的玩家,都享受到服務器端的運算能力,這樣可以讓大家在自己的設備玩到以服務器的運行性能跑出來的游戲畫面表現和品質。
設備端GPU的使用方式與本地跑游戲不同,會是用一種流式傳輸,更像是放視頻的方式,在這種情況下有一個問題在于大家不想去用非常高分辨率的原始畫質傳輸到手持設備上,無論是帶寬、流量還是流量費用都會成為一個比較大的負擔,會影響到云游戲的發展。云游戲中本地設備上的GPU可能有些新的應用場景,數據中心服務器把一個較低分辨率的游戲內容傳到設備上,設備GPU負責把這個畫面進一步處理,能夠在高分辨率屏幕上看起來也沒有那么低的畫質,這是未來云游戲在GPU方面產生的變化。
Imagination 公司首席營銷官David Harold認為,很多技術路線都還沒有明確哪一種會成為最終的贏家,云游戲也是一樣的。GPU應用在云游戲中有多個方向可以發展,比如大家最常見、認可最多的云游戲方式就是在本地部署一個輕量級的設備,服務器端有比較強力的運算能力,通過這種方式進行云游戲,但事實上我們也可以把GPU升級部署在本地或者部署在邊緣節點,可以是在手機和云端同時具有一個鏡像規格的GPU配對,從而進一步加強云游戲的體驗,這也都是可能的。
關鍵的一點是,無論是GPU、AI還是其它的云計算等等方面,都要有相應的技術儲備,比如云計算的過程中的數據傳輸需要應用到壓縮的算法,這樣的技術儲備我們做好了,無論這項技術在市場上怎樣發展,我們都有相應的機會抓住。
簡單解釋來說,就是移動端GPU和數據中心GPU將會是協同的向上的,同時Imagination也在兩方面均有布局。
值得一提的是,Imagination一直持續深耕中國市場,據Imagination 公司副總裁兼中國區總經理劉國軍介紹,在中國生態建設上,不僅包括整機廠商,還包括各大游戲廠商;公司的生態團隊在國內周期性、規律性地舉辦各種培訓以及會議,與主流游戲廠商,GPU相關開發者面對面或線上交流。
-
芯片
+關注
關注
456文章
50910瀏覽量
424501 -
光線追蹤
+關注
關注
0文章
183瀏覽量
21494
發布評論請先 登錄
相關推薦
評論