1、導(dǎo)讀
神經(jīng)輻射場渲染是一種用神經(jīng)網(wǎng)絡(luò)表示場景的方法,可以生成逼真的新視角圖像。然而,神經(jīng)輻射場渲染的計(jì)算復(fù)雜度較高,導(dǎo)致訓(xùn)練和推理速度較慢。因此,本文旨在提出一種自適應(yīng)外殼(Adaptive Shells)的方法,以加速神經(jīng)輻射場渲染,并在保持視覺質(zhì)量的同時(shí)提高效率。
2、貢獻(xiàn)
我們提出了一種神經(jīng)輻射公式,可以在基于體積和基于表面的渲染之間平滑過渡,大大加快渲染速度,甚至提高視覺保真度。
我們的方法構(gòu)建了一個(gè)顯式的網(wǎng)格包絡(luò),它在空間上限制了神經(jīng)體積表示。在實(shí)體區(qū)域中,包絡(luò)幾乎會(huì)聚到一個(gè)表面,并且通常可以使用單個(gè)樣本進(jìn)行渲染。
實(shí)驗(yàn)表明,我們的方法能夠以非常高的保真度實(shí)現(xiàn)高效渲染。
3、方法
我們通過對(duì)顯式薄殼內(nèi)的體積渲染進(jìn)行有效采樣來演示高保真、高效的神經(jīng)隱式場景重建,該薄殼會(huì)自動(dòng)適應(yīng)視覺目標(biāo)。
在這篇論文中,作者提出了一種自適應(yīng)殼層方法來提高神經(jīng)輻射場渲染的效率。該方法利用了顯式幾何來加速性能,同時(shí)保持或提高感知質(zhì)量。該方法通過提取一個(gè)窄帶網(wǎng)格來適應(yīng)場景的局部復(fù)雜性,并在渲染過程中分配所需的樣本數(shù)量,以準(zhǔn)確地表示地面真實(shí)外觀。與傳統(tǒng)的體積渲染方法相比,該方法能夠更好地分配計(jì)算成本,從而實(shí)現(xiàn)高效的新視角合成。該方法的主要步驟包括:
提取窄帶網(wǎng)格:根據(jù)場景的局部復(fù)雜性,從體積表示中提取一個(gè)窄帶網(wǎng)格。這個(gè)窄帶網(wǎng)格可以很好地近似表面,并且只需要在網(wǎng)格中間的一個(gè)點(diǎn)采樣即可。
分配樣本數(shù)量:根據(jù)場景的不同區(qū)域,分配不同數(shù)量的樣本來表示地面真實(shí)外觀。對(duì)于復(fù)雜的模糊表面,需要更多的樣本來準(zhǔn)確表示外觀;而對(duì)于光滑的不透明表面,只需要在射線與表面相交的點(diǎn)采樣一個(gè)樣本即可。
輔助加速數(shù)據(jù)結(jié)構(gòu):引入輔助加速數(shù)據(jù)結(jié)構(gòu),以促進(jìn)空間跳過,從而進(jìn)一步提高渲染效率。通過這些步驟,該方法能夠在保持感知質(zhì)量的同時(shí),更高效地進(jìn)行神經(jīng)輻射場渲染。
3.1、提取窄帶網(wǎng)格
作者提出了一種自適應(yīng)的窄帶渲染方法,用于加速神經(jīng)輻射場(Neural Radiance Field)的渲染過程。該方法通過提取窄帶網(wǎng)格來指導(dǎo)光線的采樣,從而在保持感知質(zhì)量的同時(shí)實(shí)現(xiàn)高效的渲染。具體而言,作者首先使用一種流體動(dòng)力學(xué)方法來計(jì)算出適應(yīng)場景局部復(fù)雜性的自適應(yīng)殼(adaptive shell)。這個(gè)自適應(yīng)殼由兩個(gè)邊界網(wǎng)格組成,一個(gè)是外殼邊界網(wǎng)格,一個(gè)是內(nèi)殼邊界網(wǎng)格。這兩個(gè)網(wǎng)格定義了一個(gè)窄帶區(qū)域,其中包含了需要進(jìn)行采樣的點(diǎn)。在渲染過程中,對(duì)于每條光線,我們使用硬件加速的光線追蹤方法來計(jì)算光線與自適應(yīng)殼的交點(diǎn)。在這里推薦工坊課程基于深度學(xué)習(xí)的三維重建MVSNet系列論文+源碼+應(yīng)用+科研
通過計(jì)算光線與殼的交點(diǎn),我們將光線分割成多個(gè)區(qū)間,每個(gè)區(qū)間都包含在窄帶區(qū)域內(nèi)。在每個(gè)區(qū)間內(nèi),我們均勻采樣點(diǎn)來進(jìn)行渲染。這種方法不需要?jiǎng)討B(tài)自適應(yīng)采樣或者基于采樣的終止條件,從而實(shí)現(xiàn)了高性能的并行計(jì)算。為了確定每個(gè)區(qū)間內(nèi)的采樣數(shù)量,我們使用了一個(gè)目標(biāo)采樣間距和一個(gè)單樣本閾值。
3.2、分配樣本數(shù)量
根據(jù)給定的表格,我們可以看到在MipNeRF360數(shù)據(jù)集上,我們的方法對(duì)每個(gè)場景分配的樣本數(shù)量如下:Bicycle: 16.33 Garden: 14.05 Stump: 22.81 Room: 17.14 Counter: 22.24 Kitchen: 14.49 Bonsai: 14.80 這些樣本數(shù)量是根據(jù)我們的自適應(yīng)殼層方法計(jì)算得出的,以確保在保持圖像質(zhì)量的同時(shí)盡可能減少樣本數(shù)量。
3.3、輔助加速數(shù)據(jù)結(jié)構(gòu)
輔助加速數(shù)據(jù)結(jié)構(gòu)是指在渲染過程中使用的一種數(shù)據(jù)結(jié)構(gòu),用于提高渲染效率。這些數(shù)據(jù)結(jié)構(gòu)可以幫助減少不必要的計(jì)算和內(nèi)存消耗,從而加快渲染速度。在本篇論文中,作者提到了一種輔助加速數(shù)據(jù)結(jié)構(gòu),即用于跳過空白空間的網(wǎng)格結(jié)構(gòu)。這個(gè)網(wǎng)格結(jié)構(gòu)可以幫助減少需要進(jìn)行渲染的體素?cái)?shù)量,從而提高渲染效率。通過跳過空白空間,可以減少需要進(jìn)行采樣的體素?cái)?shù)量,從而減少了計(jì)算量。這種輔助加速數(shù)據(jù)結(jié)構(gòu)的使用可以在一定程度上提高渲染速度,但同時(shí)也需要權(quán)衡渲染質(zhì)量。因?yàn)樘^空白空間可能會(huì)導(dǎo)致一些細(xì)節(jié)丟失,從而影響渲染結(jié)果的質(zhì)量。因此,在設(shè)計(jì)輔助加速數(shù)據(jù)結(jié)構(gòu)時(shí)需要綜合考慮渲染速度和渲染質(zhì)量之間的平衡。
3.4、損失函數(shù)
在訓(xùn)練過程中,我們使用兩個(gè)階段來優(yōu)化模型的參數(shù)。第一階段是使用完全體積形式的NeRF模型,通過最小化以下目標(biāo)函數(shù)進(jìn)行訓(xùn)練:
其中,是標(biāo)準(zhǔn)的像素級(jí)顏色損失,用于與校準(zhǔn)的真實(shí)圖像進(jìn)行比較。是Eikonal正則化項(xiàng),用于約束場的梯度。規(guī)范了我們公式中引入的空間變化的內(nèi)核大小。是用于訓(xùn)練預(yù)測(cè)的幾何法線的損失,以使其與通過有限差分計(jì)算得到的法線保持一致。
在第二階段,我們使用窄帶采樣的NeRF模型進(jìn)行微調(diào)。由于我們已經(jīng)提取出了自適應(yīng)殼并將采樣限制在了一個(gè)小范圍內(nèi),因此不再需要鼓勵(lì)幾何上良好的表示。因此,我們只使用來優(yōu)化模型,以提高視覺保真度。通過這兩個(gè)階段的訓(xùn)練,我們可以得到一個(gè)高質(zhì)量的NeRF模型,用于渲染新視角的圖像。
4、實(shí)驗(yàn)結(jié)果
本研究采用了兩個(gè)數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)評(píng)估:Shelly數(shù)據(jù)集和DTU數(shù)據(jù)集。
Shelly數(shù)據(jù)集:
Shelly數(shù)據(jù)集是本研究新引入的合成數(shù)據(jù)集,包含了六個(gè)物體級(jí)別的場景:Khady、Pug、Kitty、Horse、Fernvase和Woolly。
對(duì)于每個(gè)場景,我們從隨機(jī)的相機(jī)位置渲染了128個(gè)訓(xùn)練視角和32個(gè)測(cè)試視角。
我們使用了峰值信噪比(PSNR)、學(xué)習(xí)感知圖像補(bǔ)丁相似度(LPIPS)和結(jié)構(gòu)相似度(SSIM)等常用評(píng)估指標(biāo)來量化渲染質(zhì)量。
此外,我們還報(bào)告了每個(gè)像素所需的沿射線采樣數(shù),以評(píng)估方法的計(jì)算復(fù)雜性。
DTU數(shù)據(jù)集:
我們選擇了DTU數(shù)據(jù)集中的15個(gè)桌面場景進(jìn)行實(shí)驗(yàn)評(píng)估。
這些場景是由機(jī)器人持有的單目RGB相機(jī)捕捉的,并且通常用于評(píng)估隱式表面表示方法。- 我們要求方法表示整個(gè)場景,但僅在提供的物體掩碼內(nèi)評(píng)估性能。
我們使用了相同的評(píng)估指標(biāo)(PSNR、LPIPS和SSIM)來量化渲染質(zhì)量。
總結(jié)起來,本研究通過在Shelly數(shù)據(jù)集和DTU數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)評(píng)估,使用了多個(gè)評(píng)估指標(biāo)來量化渲染質(zhì)量,并報(bào)告了每個(gè)像素所需的沿射線采樣數(shù),以評(píng)估方法的計(jì)算復(fù)雜性。實(shí)驗(yàn)結(jié)果表明,我們的方法在各項(xiàng)指標(biāo)上均優(yōu)于基線方法,具有更高的渲染質(zhì)量和更高的效率。
5、結(jié)論
本研究結(jié)論是提出了一種自適應(yīng)外殼方法,用于提高神經(jīng)輻射場渲染的效率。通過在神經(jīng)輻射場中提取窄殼,可以根據(jù)場景的局部復(fù)雜性來調(diào)整表示,從而加速渲染過程。實(shí)驗(yàn)結(jié)果表明,該方法在保持渲染質(zhì)量的同時(shí),顯著減少了采樣數(shù)量和計(jì)算復(fù)雜度。這對(duì)于神經(jīng)輻射場的訓(xùn)練和推斷都具有重要意義。
-
網(wǎng)格
+關(guān)注
關(guān)注
0文章
139瀏覽量
16039 -
渲染
+關(guān)注
關(guān)注
0文章
70瀏覽量
10936 -
窄帶
+關(guān)注
關(guān)注
0文章
16瀏覽量
12802
原文標(biāo)題:英偉達(dá)聯(lián)合多倫多大學(xué)最新提出用于高效神經(jīng)輻照?qǐng)鲣秩镜淖赃m應(yīng)外殼!
文章出處:【微信號(hào):3D視覺工坊,微信公眾號(hào):3D視覺工坊】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論