網格著色器是最近添加到編程管道中的一種,旨在克服經典幾何管道使用的固定布局的瓶頸。本文介紹了 DirectX 和 Vulkan 開發人員的最佳實踐。
圖 1 網格著色器替代幾何體管道
推薦:
分割數據時,使用 64 個唯一頂點和 126 個三角形基本體的值,中間甜點為 40 和 84 。這里的重點是組織實現,以便直接使用不同的分段進行實驗。
盡可能減少放大和網格著色器中的有效負載大小:
使用位壓縮和量化表示
用重心替換屬性,并允許像素著色器獲取和插值屬性
網格和放大著色器階段為 LoD 選擇和進一步剔除策略提供了機會。這些可在不同粒度下實現,例如:
在 AS 階段:剔除簇或進行管道 LoD 決策
在 MS 階段:剔除單個原語
如果很簡單,可以提前做出決策,并使用應用程序中可用的推斷數據。這樣可以節省大量的工作。請記住,不需要模擬更復雜的剔除方案,默認情況下,硬件會有效地模擬這些方案。
在處理程序實例化時,依賴放大著色器和網格著色器,例如頭發或植被、 iso 曲面(流體模擬、醫學成像中的體素數據)、從 3D 掃描獲得的資源、 LOD 以及 CAD 應用程序中經常遇到的一般詳細模型。
考慮特殊網格的拓撲連通性。與顯示稀疏拓撲的網格(如粒子)相比,我有單獨的實現來處理密集拓撲。
請注意,放大著色器階段會增加開銷,盡管通常這可以忽略不計。
Vulkan:
與 DX 相比,VK_NV_mesh_shader中的網格著色器允許對網格輸出進行任意讀寫訪問,這些輸出是預先分配的。您可以通過直接使用或重新調整這些輸出的用途來獲得性能,并避免額外的共享內存分配。
不推薦:
避免放大著色器的大輸出,因為這會導致嚴重的性能損失。通常,我們鼓勵靈活的實現,允許微調。考慮到這一點,有許多通用因素會影響性能:
有效載荷的大小。 AS 有效負載最好保持在 108 / 236 字節以下。
放大著色器的調用次數。
由相應放大著色器發射的網格著色器數(放大率)。
不要嘗試使用放大和網格著色器模擬固定函數管道,因為這可能會增加冗余。
避免在每一幀的新網格中分割,并考慮脫機烘焙這些數據,這允許在空間或頂點重用中優化網格。
關于作者
wnger:
Ana Mihut 是 NVIDIA 的圖形開發工程師,她專注于游戲引擎中新渲染技術的優化和集成。在 NVIDIA 之前,她在 Foundry 擔任渲染軟件工程師,致力于電影 VFX 渲染。安娜擁有博士學位。紐卡斯爾大學計算機科學專業
Christoph Kubisch 是 NVIDIA 公司的高級開發技術工程師,專注于 OpenGL 和 Vulkan 實時渲染技術,適用于 CAD / DCC 和科學應用。他與外部合作伙伴和 NVIDIA 的內部團隊合作,優化當前和未來的渲染算法。在加入 NVIDIA 之前, Christoph 是馬格德堡 Otto von Guericke 大學醫學數據集硬件加速可視化技術的研究人員。此外,他還作為技術藝術家創作游戲藝術、技術和 DCC 插件開發。
Manuel Kraemer 目前在 NVIDIA 擔任圖形軟件工程師,專注于高性能幾何圖形處理。在此之前,他曾在皮克斯、迪士尼動畫、雙底片和英國廣播公司擔任多個電影、動畫和電視項目的技術總監。
審核編輯:郭婷
-
NVIDIA
+關注
關注
14文章
5013瀏覽量
103247
發布評論請先 登錄
相關推薦
評論