RTX 30顯卡的在線發(fā)布會上有一個細(xì)節(jié)特別引人矚目,那就是公布了一個名為TFLOPS的數(shù)據(jù)時,如果大家收看的視頻有彈幕,一定馬上就會彈幕爆炸了。這個參數(shù)到底是啥?為什么讓大家那么關(guān)注呢?咱們今天就來說說吧。
TFLOPS是Tera和Floating-point operations per second詞組的組合,后者的意思是每秒浮點運算次數(shù),Tera則是萬億的意思,合起來就是每秒浮點運算多少萬億次。因為現(xiàn)在的圖像是分成像素點來處理的,每個點的色彩都要進行浮點運算,然后組合成一幅圖片,所以這個參數(shù)就說明了顯卡或者GPU每秒能處理多少個像素點。
它的基礎(chǔ)就來自現(xiàn)在的GPU設(shè)計,目前的GPU都是由很多小處理核心或者叫流處理器組成,這個核心比處理器核心簡單得多,每個時鐘周期只負(fù)責(zé)處理一個浮點數(shù)據(jù),所以總的浮點運算次數(shù)就是核心數(shù)量×?xí)r鐘周期了。又因為現(xiàn)在的核心可以一次性處理一個雙精度浮點數(shù)據(jù),它相當(dāng)于兩個最基礎(chǔ)的單精度浮點數(shù)據(jù),所以再×2就得到了GPU的浮點運算次數(shù)。
回過頭來看看這個參數(shù)對游戲有啥意義。在分辨率確定后,每一幅畫面的像素點數(shù)量也就確定了,那么每秒處理的像素點越多,實際上每秒能處理的畫面數(shù)量當(dāng)然就越多。這說明了啥?當(dāng)然就是游戲的幀速(每秒畫面數(shù))越高啦。沒錯,對使用同一代特別是同一核心的顯卡,算出它的浮點運算能力,基本就了解游戲速度了。
不過對于不同代甚至不同架構(gòu)的GPU,這種對比就不合適了,比如RTX 3080擁有兩倍于RTX 2080 Ti的浮點運算次數(shù),幀速能達(dá)到RTX 2080 Ti的兩倍嗎?從之前的測試大家就知道,當(dāng)然不是這樣。
這就牽扯出了另一個問題,也就是核心的效率,因為誰也不能保證所有的核心或者流處理器能一直滿載、有效運行,它的實際發(fā)揮還要考慮到前端的分配、后端的合成、顯存數(shù)據(jù)等單元的配合,所以設(shè)計不同的架構(gòu)下,按照最理想情況算出的浮點運算次數(shù)能發(fā)揮多少也是不同的。
RTX 30還有所不同,因為它實際上是讓每個核心中的整數(shù)運算單元也參加浮點運算,造成了“理論”運算能力翻倍、但因為干的是非專業(yè)工作,整數(shù)單元的浮點運算效率肯定趕不上專業(yè)的浮點運算單元,再加上前端的數(shù)據(jù)分配能力、顯存帶寬啥的沒有跟著翻倍,所以效率大幅下降,最終我們可以看到,翻倍的浮點運算能力帶來的只是不到40%的實際幀速提升。
既然同一個廠家在架構(gòu)上的改動都會造成浮點運算能力的實際發(fā)揮,AMD和NV這種相差更遠(yuǎn)的架構(gòu)就別提了,比如RX 6800系列用了比較特殊的架構(gòu)設(shè)計,就以遠(yuǎn)低于RTX 3080/3070的浮點運算能力,得到了能抗衡甚至壓制它們的性能。
編輯:hfy
-
amd
+關(guān)注
關(guān)注
25文章
5489瀏覽量
134463 -
gpu
+關(guān)注
關(guān)注
28文章
4767瀏覽量
129202 -
顯卡
+關(guān)注
關(guān)注
16文章
2447瀏覽量
67983
發(fā)布評論請先 登錄
相關(guān)推薦
評論