如果你是一個(gè)游戲開發(fā)者,在你使用的圖形引擎中或多或少都聽說(shuō)過(guò)forward rendering和deferred rendering。通常你必須在你的游戲中選擇一種。但它們是什么,彼此之間有什么不同,我們又該如何選擇呢?
Modern Graphics Pipelines(現(xiàn)代圖形管道)
在開始之前,我們必須要知道一點(diǎn)現(xiàn)代可編程圖形管線的一些知識(shí)。早些時(shí)候,我們被顯卡的功能限制,不能去改變每個(gè)像素的繪制方式,除了發(fā)送一些不同的紋理外,不能去修改頂點(diǎn)的數(shù)據(jù)。現(xiàn)在時(shí)代已經(jīng)改變,我們能夠基于顯卡的圖形管線進(jìn)行編程。我們能夠發(fā)送代碼到顯卡去改變像素的外觀(顏色),使用法線紋理(normal maps)改變它們外觀使其變的突起,也可以添加反射(以及大量的現(xiàn)實(shí)主義)。
此代碼采用幾何,頂點(diǎn)和片段著色器的形式,從本質(zhì)上來(lái)說(shuō),它們控制顯卡如何去渲染對(duì)象。
可編程圖形管道的簡(jiǎn)化視圖
Forward Rendering(正向渲染/前向渲染)
Forward Rendering 是大多數(shù)渲染引擎使用的渲染技術(shù)。你給顯卡提供幾何對(duì)象,它將幾何對(duì)象分解成頂點(diǎn)送入頂點(diǎn)著色器,然后把這些頂點(diǎn)數(shù)據(jù)插值后分別送入片元/像素著色器,然后在它們被送入屏幕前做最終的渲染處理(模板測(cè)試,混合等)。
正向渲染:幾何著色器到頂點(diǎn)著色器來(lái)分割著色器
這是一個(gè)線性的流程,每個(gè)幾何對(duì)象分別通過(guò)渲染管線一步步的處理下去并產(chǎn)生最終的圖像。
Deferred Rendering(延遲渲染)
延遲渲染,從這個(gè)名字來(lái)看就意味著渲染是被延遲的,直到所有幾何對(duì)象都已經(jīng)通過(guò)渲染管線處理后,在最后才應(yīng)用著色(通過(guò)光照來(lái)決定最終的像素顏色)并產(chǎn)生最終的圖像。
那么為什么要這樣來(lái)處理呢?
延遲渲染:幾何到頂點(diǎn)到片段著色器。傳遞給多個(gè)渲染目標(biāo),然后用光照陰影。
延遲照明是對(duì)延遲渲染的修改,通過(guò)在場(chǎng)景中使用更多遍來(lái)減少G緩沖區(qū)的大小。
標(biāo)準(zhǔn)前向渲染(Forward Rendering)光照的性能消耗也是為什么要另辟蹊徑選擇其他渲染方式的主要原因。在標(biāo)準(zhǔn)前向渲染(Forward Rendering)管線流程中,每個(gè)燈光都會(huì)在每個(gè)頂點(diǎn)/或片元上執(zhí)行光照計(jì)算,這也就是常說(shuō)的逐頂點(diǎn)光照和逐片元/像素光照。
如果你在場(chǎng)景中有100個(gè)幾何對(duì)象,并且每個(gè)幾何對(duì)象有1000個(gè)頂點(diǎn),你大約就有100000多變形(非常粗略的計(jì)算)。顯卡還能夠很輕松的處理,但是當(dāng)這些多邊形被發(fā)送到片元著色器時(shí), 昂貴的對(duì)燈光消耗會(huì)使性能急劇下降。開發(fā)者可以嘗試放置光照計(jì)算到頂點(diǎn)著色器減少片元著色器對(duì)光照的計(jì)算。
不管它是不是此像素上最頂層的片元,還是被遮擋的片元,昂貴的光照計(jì)算都會(huì)在每個(gè)多邊形的每個(gè)可見片元上執(zhí)行。如果屏幕的分辨率是1024x768,你有將近800000個(gè)像素需要被渲染。你能很輕易的就達(dá)到每幀百萬(wàn)級(jí)的片元操作。并且大多數(shù)的片元還會(huì)被剔除(深度測(cè)試階段),那么對(duì)于此片元的光照就算就白費(fèi)了。
如果你要對(duì)這樣一個(gè)達(dá)到百萬(wàn)級(jí)片元的場(chǎng)景的每一燈光進(jìn)行渲染,那么你在每一幀將躍升的一個(gè)燈光數(shù)量x1000000個(gè)片元的操作上!想象一下你有一個(gè)小鎮(zhèn)的街道上面布滿點(diǎn)光源!!!!!
計(jì)算前向渲染(Forward Rendering)復(fù)雜度的公式參見:big O notatio,復(fù)雜度公式:O(num_geometry_fragments * num_lights)。你能看到這里的復(fù)雜度是和幾何對(duì)象數(shù)量和燈光數(shù)量直接相關(guān)的。
片元是一個(gè)最終可能在屏幕上成為像素的一個(gè)”待轉(zhuǎn)像素“,如果在深度測(cè)試階段不被剔除的話,它將在屏幕上成為屏幕的最終像素。現(xiàn)在一些引擎通過(guò)其他的方式優(yōu)化了光照計(jì)算,比如:剔除非常遠(yuǎn)的燈光,組合燈管或使用 Light maps(非常流行的,但是只能是靜態(tài)的物體)。如果你有大量的燈光需要?jiǎng)討B(tài)光照的話,我們需要一個(gè)更好的解決方案。
Deferred Rendering to the Rescue(前向渲染的救星–延遲渲染)
延遲渲染(Deferred Rendering)是一個(gè)減少光照著色對(duì)象數(shù)量有趣的方法。尤其是對(duì)于總的片元對(duì)象來(lái)說(shuō),執(zhí)行光照的片元數(shù)量直接由屏幕的分辨率決定。
延遲渲染(Deferred Rendering)的復(fù)雜性,在big O notation中是O(screen_resolution * num_lights)。
現(xiàn)在你能明白了,你有多少的光照數(shù)量是由你對(duì)燈光數(shù)量的使用來(lái)決定的。所以你能很高興的增加你的燈光數(shù)量。(這不意味著你可以有無(wú)限的幾何對(duì)象,它們還是要經(jīng)過(guò)管線的及其他處理才能到G-Buffer中。)
The Guts of Deferred Rendering(延遲渲染的細(xì)節(jié))
每個(gè)幾何對(duì)象被渲染,但是沒有使用光照,使用多目標(biāo)渲染(multiple render targets),繪制出多個(gè)屏幕空間大小的Buffer。深度,法線和顏色分別寫入各自的buffers(圖像)。然后,這些Buffers和每個(gè)燈光像的素顏色進(jìn)行合成,最后生成最終的圖像。
顏色,深度和正常緩沖區(qū)。(圖片由astrofa,通過(guò)維基共享資源。)
最終照明(陰影)使用三個(gè)緩沖區(qū)生成結(jié)果。(圖片由astrofa,通過(guò)維基共享資源。)
選擇哪一個(gè)呢?
一個(gè)最簡(jiǎn)短的回答是:如果你使用了大量燈光那么你就該使用延遲渲染(Deferred Rendering)了。但是延遲渲染(Deferred Rendering)也有一些明顯的缺點(diǎn):
? 這個(gè)處理需要顯卡支持多目標(biāo)渲染,老的顯卡是不支持的,所有不能在上面工作,對(duì)于這個(gè)是沒有變通的方案的,除非強(qiáng)制要求客服換顯卡。
? 它需要高帶寬的顯卡,你要發(fā)送大的Buffer數(shù)據(jù),老大的顯卡可能處理不了。對(duì)于這個(gè)也沒有變通的方案的,除非強(qiáng)制要求客服換顯卡。
? 你不能使用透明對(duì)象。(除非你聯(lián)合 使用deferred rendering 和Forward Rendering )。
? 沒有抗鋸齒。
? 僅有一個(gè)類型的材質(zhì)被允許,除非你使用了被叫做Deferred Lighting的延遲渲染修改。
? 陰影依賴于光照的數(shù)量,延遲渲染沒有解決任何陰影的問(wèn)題。
如果你沒有大量的燈光或者你想能夠在比較老的顯卡上允許,你應(yīng)該選擇使用前向渲染(Forward Rendering)并且替換你的燈光使用靜態(tài)光照貼圖。這個(gè)結(jié)果看起來(lái)還是令人吃驚的。
總結(jié)
我希望擺脫一些光照的主題。在這里你的選擇是解決渲染問(wèn)題,但是在游戲開始之前就做出正確的選擇是非常重要的,因?yàn)榭梢员苊馊蘸蟮男薷摹?/p>
-
顯卡
+關(guān)注
關(guān)注
16文章
2431瀏覽量
67576 -
渲染
+關(guān)注
關(guān)注
0文章
69瀏覽量
10917
原文標(biāo)題:正向渲染和延遲渲染的區(qū)別
文章出處:【微信號(hào):Imgtec,微信公眾號(hào):Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論