從百度指數上來看GeForce GTX 1050 Ti級別的顯卡的用戶關注度要低于GeForce GTX 1060,但其出貨量依然不能小視,DIY究竟是小眾的差異化市場,但GTX 1050 Ti這個級別的顯卡在聯想/HP/戴爾這樣的整機廠商,還有寧美國度/名龍堂這樣的SI整機廠商的出貨量之中卻占有了很大的比例。特別是在17年絕地求生火爆之前,GTX 1050 Ti由于能夠很好的滿足網游和MOBA類游戲的性能需求,很受消費者歡迎。但在17年下半年吃雞逐漸火爆,1050TI僅能在低畫質較為流暢的運行吃雞,在這種應用的推動之下,游戲用戶的需求被拔高,GTX 1060成為2017-2018年度的最受歡迎的顯卡。
但對于50級別的顯卡需求還是存在,但GTX 1050 Ti現在看來還是太老了,究竟是2016年的東西,現在都9102年了。因此NVIDIA在近日推出了采用全新Turing架構的GTX 1650,用來迭代更新已經老邁的GTX 1050 Ti。
我們首批收到的測試樣卡是由華碩提供的Phoenix和Dual版。Phoenix是單風扇的短卡,而Dual顧名思義是雙風扇,長度也略長。
我們評測的重點是雙風扇的Dual。
Dual采用雙8cm的大風扇設計,長時間烤機轉速大概1600RPM,依然可以保持靜音。
風扇下的散熱器僅僅是整體鋁片,而無熱管。由于GTX 1650的TDP僅為75W,剛好在PCI-E標準的供電能力范圍以內,因此并無額外的供電接口。
輸出端為DP+HDMI+DVI組合,由于考慮到GTX 1650的市場定位和目標用戶需求,DVI還是繼續保留。
雙風扇的Dual長度大概21.5cm,單風扇的長度20.5cm,區別不大。基本不會有兩風扇塞不進去可以裝單風扇的情況。
Phoenix和Dual版都是采用的相同PCB方案,實際PCB的長度僅為18cm。
GTX1650的PCB整體十分簡潔,供電集中在輸出段方向,四顆鎂光的DDR5組成128Bit 4GB的顯存。
[img=666,444]https://file.evolife.cn/2019/04/LZKJ@QWHDI@634CIJG89-666x444.png[/img]
GTX 1650的核心編號是TU117-300-A1,面積大概是14×14 196mm2。核心周圍有華碩特有的點膠固定,這樣可以很大程度避免核心脫焊導致的故障。
再來看看TU117核心的結構,GTX 1650/TI的TU116核心有3個GPC,而GTX 1650的TU116只有兩個,并且兩個還不是完整的。Turing架構一個 SM是64個流處理器,896個流處理器就說有14個SM,一個GPC是8個SM,那么這樣說明TU117是有2個GPC,但并不是完整的,還差2個。完整的TU117應該是 16 個SM,就應該是1024流處理器,估計這個就應該是1650TI規格,這個就是后話。
當然性能不僅僅是看流處理器,還有其他方面,如ROP和TMU,ROP光柵化單元的規模決定像素填充率,這在很大程度決定不同分辨率的性能表現,ROP越多高分辨率性能表現越好,GTX 1650還是維持了GTX 1050 Ti的ROP規模,都是32個。這是定位相關,主要是應對1080P的目標分辨率,不過雖然ROP的數量沒有發生變化,但Turing的ROP效率還是有提升的。
GTX 1650的目標用戶群主要是網游或者是電競游戲,這些游戲的畫面水平相比頂級畫面的 AAA,在性能需求上對于Shader的需求較低,但在紋理方面的需求卻大幅提升,其實這個變化是有個標志性的階段, 就是2014年年底發行的刺客信條大革命和使命召喚高級戰爭,開始高分辨率材質貼圖的應用,使得游戲對于TMU和顯存容量有了更高的需求。而這兩作是游戲主機進入本世代之后的首次迭代更新。GTX 1650的紋理單元從GTX 1050 TI的32增加到了48,更多的紋理單元就能夠更好的應對本世代的游戲需求。
顯存方面1650雖然還是繼續維持4GB DDR5 128Bit的規格,但頻率從7GHz提升到了8GHz,這樣使得顯存的帶寬更大。
Turning相對Pascal最大的改變是增加了RT Core和Tensor Core,但在GTX 1650/1660上這兩個部分都是沒有的,但Turning還是相對Pascal增加了單獨的INT單元。
以古墓麗影暗影為例,·100個指令之中有62個是浮點指令,38個是整數指令,在之前的Pascal架構,由于沒有單獨的整數單元,只能停下浮點指令來運算整數指令,而Turning架構就可以并行處理FP和INT,在62個指令周期就可以完成,性能提升了38%。
當然GTX 1650的核心架構和GTX 1660一樣,去掉了Tensor Core和RT Core,這樣使得其就缺失了硬件級的光線追蹤和DLSS功能,但這樣也降低了核心面積,據reddit分析,單個TPC可以節約1.95mm2的Die Size,而TU117有8個TPC,就可以降低15.6mm2的核心規模。
Turing的緩存結構也發生了很大的變化,改成了統一的的共享存儲架構,每個LOAD/STORE UNIT對應一個64KB L1 Cache,每個TPC有32Bx4的帶寬,是Pascal架構的4倍。Turing的L1 Cache是可以靈活配置的,每個TPC有兩個SM,每個SM有32KB L1 Cache,這可以當成64KB統一使用,也可以當場兩個32KB使用,相比Pascal架構有更低的延遲和更高的帶寬。
Turning還支持自適應著色器,它可以對場景進行分析,依據場景的復雜程度和變化率給不同區域設定不同的著色率,這樣 可以減少40%的工作量來實現幾乎一樣的輸出品質。
可變著色率是和上面的自適應著色器差不多的技術,可以依據場景的復雜程度和變化率調節著色精度來節約資源。這個功能在之前RTX2080TI首發的時候就吹的很多,但實際這個功能在GTX 1650首發430.39才兌現。
理論性能方面我們使用3Dmark來衡量,DX11的Firestrike的圖像分提升了20%不到,而DX12的Timespy提升了44%,采用新技術的游戲和測試能夠從Turing架構的改進中獲得更多的收益。
游戲性能測試
由于考慮到GTX 1650目標用戶的實際情況,本次測試并沒有采用9900K那樣的旗艦平臺,而是選擇比較親民的i5 9400。具體的測試平臺如下:
對比測試選擇的顯卡都是市售普通型號,頻率一般都比公版頻率更高。具體的頻率可以參看上一頁的規格表。
由于GTX 1650定位,我們選擇測試的游戲系統要求都比較低,并且統一設定為1080P分辨率,并且設定在與其性能相匹配的畫質。其實更應該測試MOBA和網游,但這些游戲都沒Benchmark,也沒可以精確重復的場景。可變著色率NVIDIA宣傳特性就是用的地平線3,我們對比GTX 1660的新老驅動對比地平線4的性能,其并未從新驅動獲得明顯的性能收益。GTX 1650在地平線4中相比1050T性能提升也僅13.5%,對于一個最新的DX12游戲這樣的提升明顯低于預期。
地平線4是UWP的DX12游戲,選擇1080P高畫質,使用游戲自帶的Benchmark進行測試。
全境封鎖2是DX12游戲,優化方向偏向AMD,我們選擇1080P中畫質,使用游戲自帶的Benchmark進行測試。全景封鎖2深度對DX12進行優化,Turing架構的GTX 1650獲益很大, GTX 1650相比GTX 1050 TI提升幅度很大,高達44%,雖然高畫質不到可用程度,但中畫質已經可以流暢運行,性能甚至反超GTX 1060 3GB,全景封鎖2的VRAM占用超過了3GB,顯存被爆,使得性能收到較大的影響。
GTA5雖然是2015年初的游戲,但硬件需求對于現在的50級別也不算輕松。我們使用1080p最高畫面設置,使用游戲自帶的Benchmark進行測試,記錄第四個場景的平均FPS,GTA5前三個場景的負載較高,但第四個場景更為接近實際游戲情況。GTX 1650在GTAV的平均FPS為54.49,依然不能在全特效下流暢運行,需要適當的降低特效。
絕地求生是DX11游戲,我們選擇1080P中畫質,選擇SANHOK場景游戲進行回放,從2:30到12:30時間段使用FRAPS進行性能統計,這樣的測試方式可以保證測試場景可以完全精確重復。GTX 1650雖然平均FPS》60,但其在室內場景FPS比較高,而在室外僅僅60出頭,有時候甚至會跌倒60以下,想要在吃雞時候更為流程,我們建議在中特效的基礎上降低視野距離、抗鋸齒和特效到低,已獲得跟更為流暢的FPS,不過其性能已經比GTX 1050 TI快23%,已經是可用狀態,可以說是可以吃雞最便宜的圖靈顯卡。GTX 1660比GTX 1650要快50%,可以獲得更好的體驗,如果想玩爽吃雞的話,最好還是1660起步。
CSGO是2012年的老游戲,其采用的Source引擎更是2004年的古董,雖然游戲歷經多次更新,但圖像的技術和要求還是遠遠落后時代。不過CSGO還是有一大幫FANS,還是有一定的影響力。我們自己錄制一段DUST2的Demo,使用游戲自帶的timedemo命令進行Benchmark,游戲設置為1080P最高畫質 4X MSAA。CSGO的系統要求太低,在顯卡方面的瓶頸并不明顯,各個顯卡差距并不大,GTX 1650可以維持144甚至165FPS以上,2K分辨率都應該可以勝任。
我們測試的這幾個游戲,DX12的地平線4和全景封鎖2顯存占用在3GB以上,其他DX11游戲占用都不到4GB,這種級別的卡4GB足夠,如果顯存占用》4GB,那么核心性能就會先出現瓶頸,把顯存加大也不會獲得性能上的收益。
溫度/功耗和頻率穩定性測試
我們測試方法是使用3Dmark Timespy壓力測試循環10次,使用Afterburner記錄顯卡核心的頻率、溫度和功耗,整個過程歷時10分鐘。測試環境溫度25度,裸機測試。
GTX 1050TI的Boost頻率基本在1700MHz,而華碩GTX 1650在開始階段頻率可以Boost到1900以上,后期隨著溫度上升頻率逐漸下降,但也基本保持在1800MHz以上。GTX 1650自身的頻率很高,但其TDP限制被固定在100%,無法提高,核心也沒什么超頻空間。
溫度方面,GTX 1650和GTX 1050 TI的待機溫度基本都是30度出頭,滿載溫度GTX 1650要比GTX 1050 TI高10度,基本是70度出頭,GTX 1650的GPU規模更大,頻率更高,在工藝沒大變化的情況下,溫度更高也很正常。但這個溫度相距84度溫度墻還是相距甚遠,并不會影響性能。
GTX 1650 TDP是75W,待機功耗小于10W,但滿載功耗也會接近110W,intel主板的PCIE供電規范是75W,但廠商還是會有余量設計。另外用戶搭配GTX 1650的主機額定電源功率還是要在300W以上。GTX 1050 TI沒有功耗讀取這個功能,因此沒有測試。
GTX 1650在不同游戲的性能表現存在差別,一般DX11游戲提升20%,DX12游戲提升幅度比較大,差不多有30-40%,整體大概性能相比GTX 1050 TI強了1/3,大概可以達到GTX 1060 3GB性能的90%水平,與同為Turning架構的1660相比,大概是其性能的70%不到。具體到具體游戲,性能要求需求越高的游戲性能增幅越大,因為這些游戲使用的技術更為先進,更能從Turning架構的改進之中獲得收益。
現在GTX 1650的核心面積是200mm2,和GTX 1060一樣,4700M晶體管數量比4400M的GTX 1060還稍多,但性能僅為1060 90%水平,不過完整的評判TU117,還是要看GTX 1650 TI,
如GTX 1650 TI是完整的16個SM,且頻率差不多,那它的性能就應該大概是GTX 1650的14/16,就說應該會再強14%左右,就差不多有1060的水平級別。
Turing升級基本上都是新一代性能和上一代高一級別差不多,如RTX2080略微強于1080TI,RTX2070強于1080,2060強于1070TI,1660TI差不多是1070水平。新一代產品雖然比上一代同定位產品售價更高,但性能基本可以到上一代更高一階的水平,使得整體性價比還是有提升(RTX2080TI除外),這樣就巧妙的在用戶可以接受的范圍內,悄悄的提升了產品平均單價。
在圖靈架構內部,以3DMark Timespy分數來衡量,流處理器增加的速率和性能提升基本一致(僅僅是2080TI的性能增幅小于規模的增幅)。當然3Dmark Timespy測試明顯是重Shader輕紋理,并不能完全代表實際游戲性能,用戶需要以自己的需求導向來選擇合適自己的產品。
2080TI SLI合適2K144或者4K60的AAA游戲玩家或者4K144的電競玩家
2080TI合適2K分辨率的AAA玩家或者2K 144的電競玩家
2080合適1080P或者2K DLSS的AAA玩家或者1080P 144的電競玩家
2070合適1080P的AAA玩家或者1080P 144的電競玩家
2060合適1080P可以接受適當降低特效的AAA玩家或者2K 144的MOBA玩家
1660/1660TI合適1080P 60FPS電競類游戲的玩家或者1080P 144的MOBA玩家;
1650則是合適于MMORPG和1080P 144 MOBA游戲。
-
華碩
+關注
關注
7文章
1597瀏覽量
62203 -
顯卡
+關注
關注
16文章
2431瀏覽量
67574
發布評論請先 登錄
相關推薦
評論