2022年10月上旬,代表著Ada Lovelace架構頂級性能的GeForce RTX 4090 GPU登場亮相發售,宣告了RTX 40系GPU正式進入消費者的視野。不過正如我們測試之后的結論所說,雖然RTX 4090擁有遠勝RTX 3090 Ti的強悍性能,而且還有DLSS 3這一神奇黑科技的護航,但萬元以上的價格確實不是大眾消費者能輕易接受的。時隔一月之后,同樣代表了旗艦級性能,但價格卻要便宜不少的次旗艦產品GeForce RTX 4080登場了。同樣擁有勝過RTX 3090 Ti的性能表現,但價格卻要相對親民一些,會不會讓你更加心動?
和RTX 4090一樣,同出一脈的GeForce RTX 4080 GPU仍然繼承了來自Ada Lovelace架構的全部特色與技術。在GeForce RTX 4090 Founders Edition首發評測時,我們已經對Ada Lovelace架構的核心特色技術與主要特點進行了非常細致的解析,在這里我們就不一一重復了。不過為了幫助大家更好地理解本測試文章,我們還是將Ada Lovelace架構的核心技術要點做了個簡單總結,供大家參考。
來自Ada架構的RTX 40系GPU技術創新
RTX 40 系列 GPU 具有一系列新的技術創新,包括TSMC 4N 制造工藝,整體實現高達 2 倍的性能功耗比飛躍。?
緩存暴增
?
Ada架構的改革在緩存部分有了較大改變。每個SM擁有128KB L1緩存,AD102總計擁有18432KB L1緩存,相比GA102的10752KB緩存增加了大約70%。在L2緩存方面,AD102目前擁有98304KB的L2緩存,相比之前GA102所擁有的6144KB大約是后者的16倍。如此巨大的緩存,將為所有GPU相關操作都帶來巨大的收益,尤其是光線追蹤、路徑追蹤等復雜的操作收益最為明顯。
更強的SM
AAD102的每個SM單元包含128個CUDA內核,1個ADA第三代RT核心以及4個ADA第四代張量(Tensor)核心、4個紋理單元、256KB寄存器、128KB的L1/共享內存,和之前的產品一樣,L1/共享內存也可以根據使用情況進行配置。流式多處理器具有高達 83 TFLOPS 的著色能力,吞吐量超過上一代產品 2 倍。?
第三代光追核心
第三代 RT Cores 的有效光線追蹤計算能力達到 191 TFLOPS,是上一代產品 2.8 倍。?
第四代AI核心
新的 Tensor Cores 新增 FP8 引擎,具有高達 1.32 petaflops 的張量處理性能,超過上一代5倍。
Shader Execution Reordering著色器執行重排序
SER可以重新調度著色器的工作排序,從而避免部分著色器在等待中浪費算力和電能,以獲得更好的效率和性能。SER 為光線追蹤帶來最高可達 3 倍的性能提升,整體游戲性能提升可高達 25%。
DLSS 3與OFA光流加速器
基于Ada光流加速器的DLSS 3最高可帶來相對于DLSS 2達2 倍的性能提升,使 DLSS 3 能夠預測場景中幀和幀之間的運動變化,使神經網絡能夠在保持圖像質量的同時提高幀率。DLSS 3 技術支持 GeForce RTX 40 系列 GPU,它包括 3 個功能:光學幀生成技術、超級分辨率(DLSS 2 的關鍵創新)和 NVIDIA Reflex。開發者只需整合 DLSS 3,即可默認支持 DLSS 2。
雙NVIDIA編碼器(NVENC)
基于 Ada 架構的全新顯卡配備了支持 AV1 編碼的全新第八代 NVIDIA 編碼器 (NVENC),可為主播、廣播愛好者和視頻通話用戶帶來更多新的嘗試和體驗。該技術的效率比 H.264 高 40%,這有助于主播在保持直播推流比特率不變的情況下,將畫面分辨率從 1080p 提高到 1440p,且畫質依然穩定。?
更強的Studio性能
除了游戲性能之外,RTX 40系GPU也是用于內容創作的優秀GPU,在加速3D設計創作、視頻剪輯處理和AI計算方面,都有非常不錯的表現。
同時嗎,專用的NVIDIA Studio Driver在頂級創意應用上經過全面測試,能夠最大限度地提高可靠性,比如:
●主播可以用支持AV1的全新第八代編碼器來提高現場直播質量,利用 NVIDIA Broadcast AI 特效改善麥克風和網絡攝像頭,并進入AI驅動的 VTubing。?
●得益于RTX 40 系列的雙編碼器和高達2倍的AI工具性能,視頻編輯的輸出速度最高可提升 2倍。?
●得益于第三代RT Core、SER、DLSS 3和NVIDIA Omniverse,3D 設計創作者可以在4K@60fps 下進行創作。
●Modder可以重制經典游戲,并通過RTX Remix開啟RTX。
GeForce RTX 4080 Founders Edition鑒賞
復習完理論,來看今天的主角GeForce RTX 4080 Founders Edition。
從核心架構圖可以看出,相對于完整的AD-102核心配置的12個GPC模塊,代號為AD-103的GeForce RTX 4080 GPU只擁有7個GPC模塊,而且在GPC的配置上做了一些減法。全部7個GPC模塊中有4個配置了完整的12組SM模塊,有兩個GPC配置了10組SM,而最后一個GPC只配置了8組SM。這樣算下來,完整的AD-103核心總共配置了48+20+8即76組SM單元。Ada核心的每個SM單元配置的CUDA核心為128個,因此RTX 4080 GPU具有9728個CUDA 核心, 可提供 49 TFLOPS的著色器傳統光柵渲染能力。同樣,這也意味著GeForce RTX 4080 GPU擁有76個第三代Tensor Cores光追核心和304個第四代Tensor Cores AI核心,能夠為光追游戲或渲染工作提供113RT-TFLOPS的計算能力,同時能夠為DLSS或AI計算提供高達780Tensor-TFLOPS的計算性能。在核心頻率上,RTX 4080的GPU核心頻率為2205MHz~2505MHz,略低于RTX 4090,但相比RTX 30系旗艦不到2GHz的頻率設置,仍然是要高得多,也說明采用TSMC 4N工藝打造的Ada核心在能效比上確實比RTX 30系出色得多。
在顯存的配置上,由于NVIDIA最終撤銷了12GB顯存版的RTX 4080 GPU計劃,因此16GB GDDR6X顯存的版本就成為了目前RTX 4080的唯一配置。在顯存位寬上從RTX 4090的384bit降為256bit,不過頻率從RTX 4090的1313MHz提升到了1400MHz,因此帶寬雖然為768GB/s要低于RTX 4090,但總速率表現還是達到了22.4Gpbs,高于RTX 4090的21Gbps。
按照NVIDIA給出的官方參考數據,在現代游戲中RTX 4080的性能最高可達 GeForce RTX 3080 Ti 的2倍,而功耗則降低了近10%。具體是不是有這樣的性能表現呢?后文我們將進行深度的詳細測試。
說個題外話,其實可以看出,RTX 4080和RTX 4090之間在硬件規格參數上相差很大,所以我們一點也不懷疑RTX 4080 Ti這個等級的GPU是一定存在的。而且不妨大膽猜測一下,104或110組SM單元配置的20GB GDDR6X顯存版RTX 4080 Ti是不是很有吸引力呢?(個人猜測,僅供參考)。
從外觀上來看,RTX 4080 FE與RTX 4090 FE幾乎是一模一樣,而且在長寬的尺寸上也幾乎保持一致。在散熱結構上,RTX 4080 FE仍然是采用的雙軸流通設計,加厚的散熱片也充分保證了散熱的性能需求。在風扇部分,和RTX 4090 FE一樣,RTX 30系旗艦產品的9葉曲折扇改為了兩只大面積的7葉類鐮刀風扇,但是在靜音效果上反而感覺更優秀。較大扇葉面積的風扇能夠提供更高的風壓與風量,而風扇部分此次采用的流體動力軸和反方向旋轉的設計,則讓RTX 4080 FE和RTX 4090 FE一樣可以更安靜、涼爽地運行。
▲和RTX 4090 FE一樣的7葉鐮刀風扇,雙側反向旋轉帶來更高散熱效率。
▲主出風口設置在擋板處,大量的鏤空設計可以充分保證散熱效果。在視頻輸出接口部分,仍然是傳統的1 HDMI+3 DP,支持HDMI 2.1和DP 1.4a。
▲RTX 40系GPU已經全面進化到600W供電的ATX 3.0電源PCIe 5 16Pin 12VHPWR接口,不過RTX 4080 FE的包裝盒內也附帶了一根3×8pin轉16Pin的轉接線,方便用戶平滑升級。
▲和RTX 4090 FE一樣,支撐架安裝部位也采用了隱藏式磁吸設計。
▲從NVIDIA的官方PCB渲染圖來看(FE公版顯卡實在很難拆,而且我們擔心拆解容易損壞散熱結構,所以就沒拆解RTX 4080 FE,用NVIDIA官方資料進行內部設計解析),RTX 4080 FE仍然采用了燕尾PCB的設計模式,18相供電。中間的AD103核心因為是官方渲染圖,因此打上了NVIDIA Logo。顯存部分則采用了來自美光的8顆GDDR6X顆粒,單顆容量2GB。
NVIDIA GeForce RTX 4080 Founders Edition參數規格
核心架構:Ada Lovelace
核心代號:AD103-300
制程工藝:TSMC 4N(NVIDIA定制工藝)
SM單元:76
CUDA核心數:9728
光追核心數(RT Cores):76
AI核心數(Tensor Cores):304
核心頻率:2205MHz~2505MHz
顯存容量:16GB GDDR6X
顯存速率:22.4Gbps
顯存位寬:256bit
顯存帶寬:716.8GB/s
支持DLSS版本:DLSS 3
TGP:320W
建議電源:700W
首發參考價:9499元
性能實測,比RTX 3090 Ti還強20%多!
步入大家最期待的實際應用測試。想必所有玩家心里都有這樣一個疑問:作為首發價格達9499元的RTX 4080 FE,其實際性能表現能否匹配這樣的價格定位呢?
整體的測試我們大致分為三個部分:第一部分是游戲性能的體驗,包括傳統光追游戲+DLSS 2的性能表現檢測以及DLSS 3性能的專項測試,這是本次評測的最重要的核心部分;第二部分則是與設計創作相關的Studio性能評測,考察RTX 4080在設計創作應用方面的優勢;第三部分則是功耗相關的評測,這部分我們不再用傳統的單一Furmark烤機來檢測RTX 4080 Founders Edition的能耗,而是分別在1440p游戲、4K游戲和8K游戲環境下考察RTX 4080的實際功耗表現,并且根據這些成績和性能表現來簡略計算RTX 4080的每瓦性能(僅供參考)。同時,我們還將RTX 4090 FE、RTX 3090 Ti FE和RTX 3080 Ti FE納入了對比參考測試。
下面,就讓我們逐步深入解析RTX 4080 Founders Edition的性能世界吧!
測試平臺概覽
GPU:NVIDIA RTX 4080 FE、RTX 4090 FE、RTX 3090 Ti FE、RTX 3080 Ti FE
主板:技嘉AORUS Z790 MASTER
內存:技嘉AORUS DDR5 6000 64GB
顯示器:戴爾UP3218K(7680×4320@60Hz)
電源:鑫谷昆侖KL-1250G冰山版ATX 3.0(額定1250W)
操作系統:Windows 11 Pro 21H2
驅動程序:Game Ready Driver 526.72
▲截至發稿時,GPU-Z未更新,因此尚不能完全識別RTX 4080 GPU。
3DMark理論性能測試
在3DMark的理論性能測試部分,我們可以看到RTX 4080 FE與RTX 4090 FE的平均理論3D性能差距約在30%上下,PortRoyal光追性能測試部分的差距超過了40%。畢竟RTX 4080 FE與RTX 4090 FE在規格上確實相差了一大截,有這樣的性能差距也算正常,而且也為可能出現的RTX 4080 Ti埋下了伏筆。
在與上一代旗艦級和次旗艦產品的比較上,RTX 4080 FE的表現還是非常搶眼的。在與RTX 3080 Ti FE的較量上,RTX 4080 FE幾乎領先后者整整40%的性能,即使與RTX 3090 Ti這款前一代的頂級旗艦產品相比,所有測試項目的平均領先幅度也達到了25%左右,堪稱表現不俗。
游戲性能測試,輕松駕馭4K全特效光追
在游戲測試部分,出于對RTX 4080 FE的定位思考,我們將整體測試重點放在了4K分辨率下,但考慮到少部分玩家的特殊需求,我們也在部分游戲中加入了8K分辨率的體驗評測。同時,目前的實際情況是,絕大部分玩家都還在使用1440p甚至1080p顯示器,因此我們也將一部分1440p游戲的體驗測試加入了本次的體驗之旅中,以期望得到一個相對完整的體驗測試報告。在所有游戲的測試中,我們都開啟了最高畫質與最高光追效果設置(《刺客信條:英靈殿》設置為高畫質),DLSS模式統一開啟為:8K超級性能、4K/1440p為平衡(《暗影火炬城》《生死輪回》《光明記憶:無限》三款游戲DLSS設置為自動,特此說明)。
傳統光追游戲+DLSS 2性能體驗
在8K光追游戲測試部分,RTX 4080 FE的表現還是比較搶眼的。在DLSS開啟之后,基本都能夠在60fps左右或更高的幀率運行8K游戲。與RTX 3090 Ti FE相比,RTX 4080 FE的8K游戲整體性能領先約30%,與RTX 3080 Ti FE相比,8K游戲性能更是達到了接近90%的領先程度。不過與RTX 4090 FE相比,仍然還有40%~45%的性能差距。
4K分辨率下的游戲性能表現是我們的測試重點,這部分我們一共選擇26款當下的熱點游戲進行了詳細的測試(《Unity:Enemies》這款游戲RTX 40系GPU自動開啟DLSS 3,RTX 30系及更老的GPU自動開啟DLSS 2。)。從整體的測試情況來看,RTX 4080 FE在性能上的表現仍然不俗,相比RTX 3080 Ti而言,整體性能平均領先都達到了50%,在部分游戲中的領先幅度高達80%以上。相比RTX 3090 Ti,RTX 4080 FE的性能平均也達到了25%左右的領先幅度。不過相比RTX 4090 FE,RTX 4080 FE在4K分辨率下性能還是落后約35%。
1440p分辨率理論上不是RTX 4080的主戰場,不過考慮到很多玩家目前都還在1440p顯示器上奮戰,因此我們也將這部分成績納入了測試之中。在1440p分辨率下,隨著游戲對GPU性能需求的降低,RTX 4080 FE和RTX 4090 FE、RTX 3090 Ti FE和RTX 3080 Ti FE的正負性能差距都有縮小的趨勢。在這一分辨率下,RTX 4080 FE平均性能領先RTX 3080 Ti約40%,GPU負荷越高,RTX 4080 FE的優勢越明顯。與RTX 3090 Ti FE相比,在1440p分辨率下RTX 4080 FE的性能領先幅度縮小到了20%左右,同時相比RTX 4090的性能落后也縮小到了20%左右。
DLSS 2/3對比測試
在這部分中,我們和當初測試RTX 4090 FE時一樣,對DLSS 3進行了專項的測試。我們分別對比了同一代產品(RTX 4080)在 DLSS 2和DLSS 3設置下的不同游戲性能表現,同時也對比了不同代產品在兩代DLSS設置下的不同表現(RTX 30系+DLSS 2對比RTX 40系+DLSS 3),以觀察在新一代DLSS技術的支持下,RTX 40系GPU相對上一代產品的有怎樣的迅猛提升。
先來看3DMark的DLSS TEST測試項目。很明顯,DLSS 3同比DLSS 2在性能上有50%以上的性能提升,相比Native原生幀率,更是最高提升幅度達到了400%左右。
來看同代產品間DLSS 2/3在實際游戲表現中的性能差距。我們用RTX 4080在11款支持DLSS 3的游戲中測試了兩代DLSS技術的性能比較。從測試數據來看,RTX 4080在同等級設置的DLSS模式下,DLSS 3下的幀率相對DLSS 2要強40%~70%,平均領先程度約為哦45%左右。如果同比Native原生幀率,DLSS 3模式下大約能達到原生幀率的2.5~4.5倍,平均下來也達到了Native原生幀率的3倍左右。可見DLSS 3確實在幀率提升方面確實令人喜出望外。
再來看跨代GPU搭配跨代DLSS模式的性能比較。這部分測試中我們選擇了RTX 3080 Ti和RTX 3090 Ti在DLSS 2設置下的幀率表現,對比RTX 4080在DLSS 3設置下的幀率表現。從測試結果來看,DLSS 3模式下的RTX 4080 FE相對于RTX 3090 Ti平均達到了1.6倍左右的性能,而相對于RTX 3080 Ti來說,RTX 4080 FE在DLSS 3模式下對比DLSS 2模式的RTX 3080 Ti更是達到了平均1.75倍左右的性能,最高甚至達到了2.2~2.5倍的性能。DLSS 3的加持下,進一步鞏固了RTX 4080 FE的性能優勢。
DLSS 3及PCL測試
NVIDIA在DLSS 3中囊括了NVIDIA Reflex低延遲技術,能夠極大地改善游戲體驗的流暢性,尤其是對FPS游戲來說更是意義重大,畢竟更低的延遲也就意味了更快速的反應操作。另外隨著FrameView 1.4版本的更新,現在FrameView已經能夠在支持的游戲中監測、記錄游戲的PCL系統延遲時間與1%L fps低幀,這兩個指標都是關系到游戲流暢與否的主要因素。因此,我們也選擇了包括《瘟疫傳說:安魂曲》《賽博朋克2077》《幻塔》等在內的11款支持DLSS 3的游戲進行了測試。
從測試結果來看,DLSS 3的幀率提升功能作用顯露無余。不只是在幀率表現上相對于Native原生幀率有100%~400%的提升,而且在1%L fps和PCL系統延遲上也有驚艷的表現。比如在4K分辨率設置的《生死輪回》游戲中,盡管在DLSS關閉的情況下能達到60fps以上的游戲幀率,但游戲的1%L fps僅為28fps左右,說明游戲仍然會時不時產生卡頓的情況,而且PCL系統延遲在DLSS關閉時也高達85ms。在開啟DLSS 3平衡模式之后,游戲幀率飆升到立刻150fps以上,達到了絕對流暢水準。同時1%L fps也提升到了127fps,說明已經不會在任何情況下影響到游戲的流暢運行。另一方面系統延遲也在開啟DLSS 3之后從85ms下降到了27ms,讓游戲更加絲滑順暢。在其余幾款測試游戲中,DLSS 3也有著同樣的表現,請大家自行閱覽分析。
在RTX 4090 FE的首發評測時,我們已經詳細地對比過DLSS 3、DLSS 2和Native原生之間的畫質差異。即使在4K分辨率的DLSS性能模式的設置下,無論是DLSS 2還是DLSS 3,最終呈現的游戲畫面相對于原生畫質幾乎看不出損失,與原生畫質相差不大。對比DLSS 3和DLSS 2的性能模式,也可以看出二者基本沒有差別,甚至DLSS 3模式下的畫質還略微清晰一些。這足以說明DLSS 3對游戲畫質的影響幾乎可以忽略不計,至少多絕大多數玩家來說,完全不用擔心開啟DLSS 3之后在游戲中看到明顯的畫質損失。為了讓大家有更直觀的認識,我們又在本次測試過程中截取了不同DLSS 3設置下的游戲畫面,并與原生畫質進行對比,結果仍然是沒有太大差別,甚至更好。
▲4K分辨率,《賽博朋克2077》
▲1440p,《賽博朋克2077》
▲1440p,《F1 22》
我們在兩款不同游戲中分別截取了同一場景下的原生(圖中)、DLSS 2平衡(圖左)和DLSS 3平衡(圖右)的游戲畫面。從三個不同場景的截圖可以明顯看出,在DLSS 3設置下的游戲畫面相比DLSS 2和原生畫質沒有任何的損耗,甚至在放大到300%左右可以發現,DLSS 3模式下的畫面鋸齒感相比原生畫質更小,相比DLSS 2都還要更清晰一些。
2022年,11月15日,DLSS 3游戲庫新增如下:
《逆水寒》:已正式支持DLSS 3
《微軟模擬飛行》:已推出搶先體驗版,已于 11 月 11 日與《微軟模擬飛行》(Microsoft Flight Simulator )Sim Update 11 和全新《微軟模擬飛行》40 周年紀念版(Microsoft Flight Simulator 40th Anniversary Edition)同時發布。
《WRC Generations》:FIA WRC 官方游戲,11月16日推出,支持DLSS 3。
《極品飛車:不羈》:11月29日推出,支持DLSS 3。
《戰錘40K:暗潮》:11月30日推出,支持DLSS 3和光線追蹤技術。
下列兩款游戲將更新支持DLSS 3:
《毀滅全人類 2:重新探測》:11 月 15 日推出,幀率最高可提升至 2 倍。
《漫威蜘蛛俠:邁爾斯?莫拉萊斯》:11月18日發布,支持DLSS 3。
因此,當今天GeForce RTX 4080正式發布時,將已有10款DLSS 3游戲發布上線,它們是《瘟疫傳說:安魂曲》《光明記憶:無限》《毀滅全人類2:重新探測》《暗影火炬城》《F1 22》《逆水寒》《生死輪回》《漫威蜘蛛俠:重制版》《微軟模擬飛行》和《超級人類》。
《WRC Generations》《極品飛車:不羈》和 《戰錘40K:暗潮》在RTX 4080推出后不久就會發布,圣誕節前玩家就可暢玩這些DLSS 3游戲。?
Studio性能測試
RTX 4080的設計創作性能如何?我們從視頻剪輯、3D建模渲染以及圖片處理三個方面對RTX 4080 FE進行了考察。
在Davinci Resolve Studio 18的視頻剪輯轉碼處理測試中,相比RTX 3080 Ti,RTX 4080在各項測試中平均性能領先約30%,相比RTX 3090 Ti平均領先約20%。
在Blender模型渲染測試中,無論是Opendata benchmark還是Bledner 3.1模型渲染,RTX 4080相對于RTX 3080 Ti都有50%左右的性能提升,相對于RTX 3090 Ti,性能領先幅度也達到了35%或更高的程度。
在ON1 Resize AI 2022的圖片縮放處理測試中,RTX 4080和RTX 3090 Ti的性能差距極其有限,在5%左右,但相對于RTX 3080 Ti,還是有40%的性能領先幅度。
從整體測試結果來看,雖然RTX 4080在Studio設計創作性能上相比RTX 4090仍有一定差距,但確實已經明顯勝過了RTX 3090 Ti和RTX 3080 Ti,尤其是相對于RTX 3080 Ti來說,RTX 4080的設計創作性能幾乎達到了后者的1.5倍甚至更高。
功耗測試
在RTX 4080 FE的功耗測試部分,我們想做點不一樣的。
一直以來我們都是用Furmark全滿載烤機的成績來作為顯卡功耗的基礎指標,其實這樣還是有一些不妥——因為它沒有代表玩家使用顯卡的真實情況。我們通常用TGP來表示GPU運行功耗的上限限制,對于高功耗的應用,GPU的功耗可能會達到TGP的功耗上限,而GPU Boost的時鐘頻率將在功耗和散熱限制范圍內被優化。而在GPU受到CPU瓶頸限制的情況下,或GPU正在運行輕度工作負載的情況下,GPU的功耗可能遠遠低于TGP。在這些情況下,GPU Boost頻率仍可能達到設定的最大值,因此GPU的執行效率將達到最大化。在大多數工作條件下,包括許多游戲在內,都只能使RTX 40系列GPU的功耗大大低于TGP。那么在玩家平時進行典型應用時,RTX 4080 FE的功耗會達到多少呢?在這樣的功耗條件下達到對應的性能表現,誰的能耗比更高?誰的每瓦性能表現更好呢?我們用NVIDIA PCAT功耗測試套件對典型應用狀況進行了測試。
在1440p分辨率、最高畫質、最高光追特效、DLSS 平衡設置的《賽博朋克2077》游戲中,RTX 4080 FE的實際游戲運行功耗約為250W左右,同比相同狀態下,RTX 4090的運行功耗約為290W、RTX 3090 Ti接近400W,RTX 3080 Ti約為350W。在更低的功耗下,RTX 4080 FE實現了更高的性能,其能耗比明顯超越RTX 3090 Ti和RTX 3080 Ti許多。
4K分辨率下的情況大致相當,在4K分辨率下進行《賽博朋克2077》游戲時,RTX 4080 FE的功耗大約達到了280W左右,相比1440p游戲有一定上漲。
8K分辨率下的游戲對GPU帶來了較大的負荷。在這一分辨率下進行《賽博朋克2077》游戲時,RTX 4080 FE的功耗達到了290W以上,但平均功耗仍然低于300W。反觀RTX 3090 Ti,此時的功耗已經達到了450W以上,即使RTX 3080 Ti的功耗也保持在380W左右。
Furmark烤機時,各款顯卡基本都能達到TGP設定的上限甚至更高。
最后,我們把各個狀態下的功耗表現做了一個總結,來一起看看。
如果我們把3DMark TimeSpy Extreme的測試分數,除以運這一程序時的GPU平均功耗,是不是就能得到一個每瓦分數的答案?這個可以近似地用來表示GPU在進行DX12游戲時的每瓦性能。同樣,我們把3DMark PortRoyal的測試分數除以運行它時的平均功耗,是不是就能近似地得到光追游戲時的每瓦性能(非絕對正確的每瓦性能,但具有較大參考意義)?
非常直觀,在代表DX12游戲性能的3DMark TimeSpy Extreme測試中,RTX 4080 FE的每瓦性能參考指數約為123.38,是RTX 3080 Ti的1.7倍,是RTX 3090 Ti的2.1倍,換句話說,近似地可以看作RTX 4080 FE在DX 12非光追游戲中的每瓦性能相對于RTX 3090 Ti達到了翻倍,而相對于RTX 3080 Ti則在每瓦游戲性能上提升了70%以上。
再來看光追環境的情況。在3DMark PortRoyal的測試中,RTX 4080 FE相對于RTX 3080 Ti的每瓦光追游戲性能提升了75%,而相對于RTX 3090 Ti更是提升達到了90%以上。很明顯可以看出,得益于優秀的Ada Lovelace架構和TSMC 4N NVIDIA定制工藝的應用,RTX 40系GPU的每瓦光追游戲性能有了迅猛的增長,增長幅度也遠超過了50%。
哦,最后還有GPU溫度控制。在室溫26℃的環境下,我們用Furmark對RTX 4080 FE進行了持續25分鐘的烤機測試,最后RTX 4080 FE的核心溫度穩定在了62℃上下,由此也足以說明RTX 4080 FE的散熱結構設計非常優秀,這樣的溫度控制也著實讓人驚喜。
高性能,低功耗,這才是高端游戲顯卡應有的樣子
說實話,最開始的時候我們是有想過首發價格9499元的RTX 4080 FE應該是能夠擁有匹敵RTX 3090 Ti這種前一代頂級旗艦的降維打擊能力的,不過最后測試中發現RTX 4080 FE在一般游戲中都有著超越RTX 3090 Ti 25%以上的性能表現還是多少有那么一丁點意外。所以在測試了RTX 3090 Ti對比之后,我們果斷放棄了原本的上一代對位對比顯卡RTX 3080,因為這就根本不是同一個層級的東西了,而且價格上也確實相差太遠。所以最后選定了價格定位相對靠近的RTX 3080 Ti與旗艦頂級RTX 3090 Ti作為對比。
從整體的成績表現來看,我覺得RTX 4080 FE的定位還是比較清晰且準確的。作為搭配了76組SM單元,9728個CUDA核心的AD103核心其定位顯然是RTX 40系GPU旗艦族群中的守門員,因此其價格也達到了9499元起的地步。從性能測試的成績來看,RTX 4080 FE的表現也是完全合格的,在各項測試中均表現出了超過RTX 3080 Ti 40%以上的性能,相對于RTX 3090 Ti的性能領先幅度也在25%左右,實現了大步伐的全面超越。特別要提的是,在DLSS 3的輔助下,RTX 4080 FE的性能甚至相對于RTX 3080 Ti達到了100%以上的提升,而且在每瓦性能表現上相對于RTX 3090 Ti和RTX 3080 Ti都有50%以上的提升。所以對目前還嫌RTX 4090的價格太高而難以接受的話,RTX 4080倒是一個比較合適的頂級性能選擇,至少它已經將RTX 3090 Ti都甩得遠遠的,成為了這個性能段的高性價比選擇。當然,還得希望上市之后不要溢價太多,如果能保持在萬元左右,那么RTX 4080對不差錢的玩家來說,毫無疑問將成為頂級旗艦性能顯卡市場上的最熱門選擇。當然,如果預算還是受限只能眼饞RTX 4080,那就再等等吧!等明年的RTX 4070和RTX 4060,或許又能帶來一波新的驚喜。
編輯:黃飛
?
評論
查看更多