一、前沿:三年三次飛躍 銳龍幾近完美
時至今日,仍然對2017年2月22日發生在美國舊金山的那一幕記憶猶新:AMD CEO蘇姿豐博士手持一顆零售版的Ryzen銳龍處理器,對來自全世界的幾十家科技媒體宣布,AMD Zen架構成功取得了52%的IPC(每時鐘周期指令數)性能提升,遠超最初設定的40%的目標。
頓時,全場掌聲雷動、歡呼四起,因為這一刻,整個行業都等了太久太久……
在那之前的幾乎十年時間里,AMD處理器被Intel一直狠狠地摁在地上摩擦,推土機架構在酷睿架構面前根本抬不起頭來,AMD甚至一度在桌面、筆記本和服務器市場上都完全放棄了高性能CPU的競爭,任由對手蹂躪,“i3默秒全”的恥辱更是始終伴隨著AMD。
知恥而后勇,就在Intel常年慢悠悠擠牙膏、每年性能提升只有個位數的時候,AMD暗中積蓄力量、厚積而薄發,最終實現了華麗麗的轉身。
全新Zen架構的銳龍處理器、霄龍處理器讓AMD終于重返高性能計算市場,尤其是大打“核戰”,迫使Intel不得不匆忙應戰,雙方你來我往好不熱鬧,兩年之間的進步幅度已經遠超之前十年的總和,而且又恰好趕上了對手架構和工藝兩個方面的“青黃不接”,天時地利人和之下的AMD始終牢牢掌握著主動權,從曾經跟在對手后邊土都吃不到,變成如今一路狂奔向前讓對手苦苦追趕。
技術和性能上整體領先,價格上堅持超高性價,AMD銳龍不但叫好,更加叫座,市場份額穩步提升,在德國、日本等地區的零售市場占比甚至已經常態化反超Intel,去年雙11期間在天貓京東兩平臺的全網份額也超過了50%!
過去兩年多的時間里,AMD銳龍帶給整個PC處理器行業的精彩和變革,已經無需贅言,而更讓人驚嘆的是,AMD這次并非逞一時之威風,從一開始就做好了打“持久戰”的準備。
Zen誕生之初,無論是桌面還是筆記本抑或數據中心,AMD就大方公布了未來數年的技術和產品路線圖,從不諱言正在打造Zen+、Zen 2、Zen 3、Zen 4……等一系列后續架構,工藝上也是14nm、12nm、7nm、7nm+……一步一個腳印。
14nm Zen的第一代銳龍讓整個世界看到了AMD吹響的反擊號角,12nm Zen+的第二代銳龍顯示了AMD堅定不移、死磕到底的決心,而今天7nm Zen 2的第三代銳龍的到來,可以說是翻開了全新的篇章,不想廢話的AMD向所有人扔出了一個近乎毫無短板的“木桶”。
核心架構、制造工藝、單核性能、多核性能、功耗發熱、零售價格、平臺兼容……無論從哪個方面看,三代銳龍都有點無可挑剔,“i3默秒全”儼然要變成“R5默秒全”的節奏。
Zen架構才誕生的第三年,就能打磨到如此境界,還有7nm工藝的神助攻,蘇媽這爐火純青的刀法,老黃也得自嘆弗如。
二、技術解析:三代銳龍的花式神奇
有關Zen 2架構的特性、三代銳龍處理器的性能、X570主板和AM4平臺的規格,之前我們已經做過全面、深入的解讀,這里就不再過度贅述,僅總結一下其中最值得關注的亮點,也是為了展示新平臺的提升之巨大。
Zen 2架構是Zen的第三個進化版本,也是第一個大改版,其整體設計目標有三:
一是追求更極致的性能,而且任何一個計算節點都要有更充裕的帶寬;二是結合最領先的制造工藝(7nm),在集成度、能效方面實現飛躍;三是靈活的擴展性,可以在既有AM4封裝下無縫實現更多核心、更多I/O,并滿足各個領域的需求。
從最終的規格和性能表現看,Zen 2完美達成了預期水平,甚至可以說超額完成了任務:IPC架構性能提升達到了約15%,在任何應用上都有顯著進步;緩存容量直接翻番,作為最大軟肋的內存延遲和游戲性能得到了極大的改觀;浮點性能直接翻倍,對于創作性應用來說舊貌換新顏。
Zen 2架構整體設計圖和提升概覽:可以說,在之前Zen+優化完善增強的基礎之上,Zen 2將整個架構的每一個模塊、每一處細節都進行了精心的打磨,整體煥然一新。前端、預取、解碼、浮點單元、整數執行、載入存儲、緩存、安全,Zen 2沒有放過任何一個角落。
于是,我們看到了全新的TAGE分支預測器、重塑的一致性緩存體系、翻番的三級緩存、4K指令微操作緩存、全面擴大的整數單元、翻了一番的浮點單元、更高帶寬更低延遲的載入存儲、更快的安全虛擬化、硬件增強的安全防御、新的緩存與安全指令、強化的Infinity Fabric總線……等等等等。
最值得重點說道的地方有四個地方,一是預取部分,這里是一個架構執行效率和性能高低的關鍵所在。
三代銳龍采用了chiplet多個小芯片組合的設計方式,而為了協調分散的不同模塊,不但彼此之前有加強版的Infinity Fabric總線(高帶寬低延遲)、翻番的三級緩存(高命中率),還特別強化了分支預測,尤其是增加了新的TAGE分支預測器,同時加大了BTB(分支目標緩沖器)容量,加大了1K ITA(間接目標陣列),優化了32KB一級緩存,,從而將預測錯誤率降低了大約30%,使得處理器可以花更少的時間完成前端分派工作,提高效率的同時也能節省功耗。
浮點單元的變化也非常大,吞吐量和性能直接翻了一番,關鍵就在于浮點和載入存儲帶寬從128bit翻倍到256bit,支持AVX2指令集,單個周期就可以一次性完成256bit指令,不必再像以前那樣拆分成兩個128bit指令再耗費兩個周期分別執行。
很多人說Zen 2不支持AVX-512,但是一方面512bit指令非常稀少,除了部分專業領域日常應用中是基本沒有的,而且執行512bit指令非常耗電,打開之后功耗至少增加20%——不信的話試試用i9-9900K跑幾分鐘AVX-512滿載拷機,不尿崩回來找我。
當然,并不是說AVX-512毫無用處,只是需要分場合、分情況,目前消費級處理器支持它的使用價值還太低,架構設計的時候必須有所取舍,或許隨著形勢的變化,未來的Zen架構也會加入它。
Zen 2的緩存架構也有極大調整,支持各級緩存一致性,可以大大降低有效延遲,并加入了新的緩存指令。
一級指令緩存從4-way 64KB調整為8-way 32KB,和一級數據緩存保持一致,關聯性更強,預取和利用率都得到改進。
二級緩存保持每核心8-way 512KB不變,三級緩存則翻番到了每核心對應4MB(16核心就是64MB),可以很好地提升命中率和游戲性能。
對于多芯片設計,最關鍵的因素就是能不能保證不同模塊之間足夠高的帶寬和足夠低的延遲,AMD為此設計了Infinity Fabric總線(可以視為當年赫赫有名的HyperTransport總線的超級進化版),是如今和未來AMD CPU、GPU、APU的根基。
三代銳龍上,Infinity Fabric總線也進化到了第二代,在擴展性、延遲、能效各個方面都有顯著提升。
其中擴展性上,特別針對消費級客戶端應用做了優化調整(之前更多還是數據中心上),并且總線寬度從256-bit翻番到512-bit,從而更好地支持PCIe 4.0,能效上則將單位功耗降低了多達27%。
延遲更是多芯片互連的致命所在,一旦處理不好會導致整體效率的低下,包括核心、緩存、內存等各個模塊都必須保持最高效率和最低延遲。IF總線如今解綁了Fclk時鐘頻率、Uclk非核心頻率,可讓內存運行在更高頻率,同時降低了突發負載下的內存延遲,加速了緩存與緩存之間的傳輸。
說到內存,Zen架構的內存延遲一直是個痛點,但也在不斷改進,Zen 2架構更是在內存頻率和延遲之間設置了巧妙的平衡,根據實際需要可以有多種選擇。
三代銳龍官方支持的標準內存頻率為DDR4-3200(前兩代分別為DDR4-2667/2933),但可以輕松超到DDR4-4200乃至更高,極限情況下甚至做到過DDR4-5133。
但內存頻率并非絕對的越高越好。三代銳龍的IF總線頻率與內存頻率有兩種比例,DDR4-3733及更低頻率的時候,二者是1:1,繼續提高內存頻率,就變成了1:2,IF總線頻率反而會降低,所以延遲會反彈增加。
DDR4-3733的時候,內存延遲是最低的只有67ns,提高到DDR4-3866的時候延遲會增加到80ns,之后緩慢降低,但就算到了DDR4-4400延遲依然有75ns,甚至高于DDR4-3200。
AMD推薦三代銳龍搭配的最佳內存頻率是DDR4-3600(CL16),這時候綜合性能、價格是最為平衡的。除非你需要對內存頻率特別敏感的地方,否則不建議超太高。
說到頻率,還有銳龍處理器本身的頻率。受制于架構和工藝屬性,第一代銳龍的頻率不算高,自動超頻加速最多也不過4.1GHz,二代則來到了4.35GHz,最新的三代憑借架構和工藝的雙重改進最高可以跑到4.6GHz。
相比于競品,這似乎仍然還不是足夠高,很多人可是期待5GHz的,但是一方面,Zen 2架構和7nm工藝也都有自己的限制,不可能隨拔高頻率,否則功耗就吃不消(7nm也還不是專門針對高性能計算的工藝),另一方面即便是現在的頻率,也足夠對手喝一壺了,尤其是游戲性能。
架構說完了,來看看產品層面。如前所述,三代銳龍(和數據中心上的二代霄龍)采用了chiplet小芯片設計理念,模塊化組合不同單元實現不同規格,但比當年的“膠水封裝”高明和復雜多了,不只是簡單地疊加芯片,而是要把不同工藝、架構、功能的模塊按需搭配在一起,還得有利于整體性能發揮。
為什么要這么麻煩而不是單獨設計一個芯片?根本原因就是——錢!
隨著半導體公司的急劇復雜化,不但設計和量產一種新的制造工藝成本急劇增加,新的處理器也是如此,有說法稱在7nm工藝上設計一款芯片的費用超過3億美元。
即便不差錢真的設計出來,也要面臨制造成本、良品率的問題,因為越大、越復雜的芯片越容易有大量缺陷而無法正常使用。
chiplet小芯片設計就可以分擔風險,大大降低成本并提高良品率,而且還有更多好處:一是每一個芯片模塊可以使用最適合自己的工藝,比如Zen 2 CPU部分使用最好的7nm工藝,盡可能提升性能,I/O輸入輸出部分則使用足夠好的12nm(霄龍里還是14nm),優化電路并控制成本。
二是將I/O部分單獨拿出來之后,再結合新的高速低延遲IF總線,可以確保所有核心、緩存通信的一致性,肯定要比全部原生集成要差一些,但是仍然可以有足夠好的性能,而且綜合設計、制造各方面的因素,這無疑是最佳選擇。
三代銳龍處理器內部有兩顆(銳龍7 3700X及之下)或三顆(銳龍7 3800X及之上)芯片,其中一顆是I/O Die,基本相當于曾經的北橋芯片,集成內存控制器、IO Hub控制器(包括PCIe/USB/時鐘發生器/安全等等),另外一顆或兩顆是CPU Die,每一顆里邊有兩個CCX模塊,各有4個物理核心和16MB三級緩存,合計每顆就是8個物理核心和32MB三級緩存。
同時,I/O Die以及每個CPU Die里都有IF總線端口實現高速互通,但注意兩個CPU Die之間是沒有直接聯系的,比如經過IF總線和I/O Die來交流,這樣的好處是CPU Die可以根據需要添加或減少,比如霄龍上就有多達八個,從而做到64核心,下一代線程撕裂者應該會有最多四個也就是32核心。
三代銳龍chiplet設計的詳細架構圖和電路走線圖,尤其后者可以清晰地看到I/O Die與CPU Die之間的各種通道,而兩個CPU Die之間并無直接關聯。
得益于新工藝、新架構和chiplet設計,三代銳龍的每個CPU Die面積只有74平方毫米,制造起來易如反掌,同時里邊的每個CCX模塊面積僅31.3平方毫米,比二代銳龍縮小了足足47%,從而可以更輕松地做到更多核心。
AMD還宣稱,Zen架構的多核擴展性極佳,性能幾乎是隨著核心數量的增加而線性提升,比如從6核心到12核心,性能就增加了98%!
由于Zen系列架構的設計和以往截然不同,除了硬件本身的優化,也非常需要操作系統、軟件程序的支持和優化。
AMD也在持續與微軟合作,最新發布的Windows 10 v1903五月更新版就有兩項針對銳龍的重要功能,可有效提升性能。
一是拓撲感知,它會指示Windows 10進程計劃程序優先在單個CCX(四核心)內生成和分配線程,直到用完這部分之后才會將線程遷移到第二個或者第三個CCX,這將有利于大部分游戲性能的提升。
二是UEFI CPPC2接口(協同電源和性能控制),是一種較新的時鐘速度選擇方法,對短時間和突發的工作負載特別有益,比如如網頁渲染和應用程序啟動。
三代銳龍依然是AM4接口,從2016年的第七代APU引入開始已經使用了四年,而且官方一直承諾至少會延續到2020年,目測對應Zen 3架構的第四代銳龍,而再往后由于要支持DDR5內存的緣故,不換就不行了。
從28nm到7nm甚至到7nm+,從4核心4線程到16核心32線程甚至更多,從DDR4-2400到DDR4-3200甚至更高,從12條PCIe 3.0到24條PCIe 4.0甚至更多,一種接口能用這么多年,也是相當的不易和良心。
三代銳龍繼續兼容300/400系列主板(入門級的A320除外),不過最佳拍檔當然是新的頂級X570,二者組合才能實現PCIe 4.0,以及更多擴展。
三代銳龍處理器本身支持24條PCIe 4.0,保留4條用于連接X570,其余20條中有16條固定給顯卡,另外4條可以全部分給NVMe SSD,也可以2條給NVMe、2條做成SATA。
X570芯片組本身支持20條PCIe 4.0,同樣保留4條用于連接三代銳龍,其余16條來自四個PHY物理層,可以靈活組合為1條x16、2條x8、4條x4、8條x2、16條x1,任由主板廠商靈活配置,并且分為兩部分,其中8條為通用目的可連接網卡、聲卡、擴展卡等設備,另外8條還可以配置為8個SATA 6Gbps。
USB接口方面,三代銳龍支持最多4個USB 3.1 10Gbps,X570支持最多8個USB 3.1、4個USB 2.0 480Mbps。
三代銳龍家族型號、定位、規格與價格,大家都比較熟悉了。
本次我們測試的一個是首發旗艦銳龍9 3900X,12核心24線程,對標8核心16線程的酷睿i9-9900K,3999元對4099元。
另一個是銳龍7 3700X,8核心16線程,對標8核心8線程的酷睿i7-9700K/9700F,價格2599元對3099元。
三、外觀:堅持AM4接口多年不變
一塊主板用三代處理器, AMD此種做法為DIY玩家所稱道,畢竟大大節約了升級換代的成本。銳龍3000這一代處理器依然采用的AM4接口,一共有1331個針腳,可以兼容大部分AMD 300/400主板。
我們快科技收到了銳龍7 3700X和銳龍9 3900X這2款處理器,下面為大家展示。
首先是銳龍9 3900X:
銳龍 9 3900X作為準旗艦,包裝盒也與眾不同,抽取式設計,質地也更硬朗。
多年不變的AM4接口。
側面照,可以看到PCB基板厚度很足。
接下來是銳龍7 3700X:
幽靈棱鏡散熱器
盒裝的銳龍9 3900X與銳龍7 3700X都標配了幽靈棱鏡散熱器(WraithPrism),采用四條純銅熱管加大面積純銅底座直觸設計,并加入了獨立的RGB光環。
四、測試平臺:座駕為最強X570主板+最強RTX 2080 Ti顯卡
微星MEG X570 GODLIKE超神板主板:
微星MEG X570 GODLIKE超神板主板是微星在AM4平臺最為頂級的主板,采用EATX板型構造,8+8Pin供電接口,18相供電電路設計,可以為處理器提供超過千瓦的供電功率,不要說銳龍9 3900X,即便是未來16核的銳龍9 3950X也能輕松應對。
4條全速PCIe 4.0 x16插槽,以及2個M.2 22110以及1個M.2 2280接口。南橋散熱片與CPU供電的散熱片以熱管連接,因此南橋風扇同樣也可以輔助供電電路散熱。實測在銳龍9 3900X超頻滿載到200W的時候,供電模塊的溫度也被壓制在60度以內。
南橋風扇特寫,支持智能啟停,低負載時自動停轉。
這個很像顯卡的配件其實是M.2擴展卡,可以額外再接2塊全速NVMe協議的M.2 SSD。由于銳龍3000系列處理器的PCIe通道數遠遠多于同級別的Intel酷睿處理器,插多個PCIe設備也能跑滿速。
內存使用的是影馳HOF OC Lab DDR4-4000MHz 8GBx2套裝。HOF OC Lab DDR4每一條內存都精選三星B-die優質顆粒,經過影馳超頻實驗室精心調試,擁有強勁且穩定的超頻性能。
影馳HOF PRO PCIe 4.0 SSD 2TB。要測試X570的PCIe 4.0的性能,怎么能少得了這塊頂級的SSD呢。
這塊SSD采用了一條純銅熱管連接散熱面的正面和背面,可以有效降低主控的溫度。
五、理論性能測試:銳龍7 3700X多核戰平i9-9900K
以下所有的測試項目都未開啟PBO功能,也即是銳龍9 3900X的功耗會被限制在145W以內,而銳龍7 3700X的功耗會被限制在90W內。
1、CPU-Z v1.89
銳龍3900X單線程分數為534,多線程分數為8220。
銳龍7 3700X單線程分數為524,多線程分數為5582。
在CPU-Z v1.89的測試中,2款銳龍3000系列處理器的單線程性能與i9-9900K之間有6%左右的差距。但是多線程方面,頻率更低的銳龍 7 3700X可以與i9-9900K打平;銳龍9 3900X則能領先i9-9900K 48%。
2、wPrime v2.10
在wPrime 32M單線程性能測試中,銳龍9 3900X耗時28.4秒;多線程跑完wPrime 1024M則用掉了57.5秒。
銳龍7 3700X單線程跑完wPrime 32M耗時28.4秒;使用多線程在wPrime 1024M則用掉了83.6秒。
以往在wPrime v2.1的測試中,銳龍2000系列處理的單線程性能表現并不好,而銳龍3000系列處理器的單線程性能卻可以媲美Intel的頂級處理器。
在wPrime 32M單線程性能測試中,銳龍7 3700X相比上代的銳龍7 2700X足足少用了6.5秒的時間,提升幅度將近20%。
而在wPrime 1024M多線程測試中,頻率更低的銳龍7 3700X再次與i9-9900K戰平,銳龍9 3900X相比i9-9900K則少用了26.2秒。
3、7-zip
銳龍9 3900X的多線程成績為106288MIPS,單線程則為7188MIPS。
銳龍7 3700X的多線程成績為74449MIPS,單線程則為7023MIPS。
在單線程方面,2顆銳龍3000系列的處理器與i9-9900K之間仍然有10%左右的差距。
不過到了多線程,新銳龍徹底翻身,銳龍73700X可以領先i9-9900K將近5%,而銳龍9 3900X則能領先i9-9900K將近50%。
4、AIDA64 GPGPU
AIDA64 GPGPU測試可以較為準確的反映CPU的單精度、雙精度浮點運算能力。這是臨時增加的測試項目,由于時間有限,就僅僅對比了銳龍9 3900X與銳龍7 2700X的性能表現。
銳龍9 3900X的單精度浮點性能達到了1596GFLOPS(1.7萬億FLOPS),雙精度浮點性能則為796GFLOPS。
銳龍72700X的單精度浮點性能為512GFLOPS,雙精度浮點性能則為256 GFLOPS。
很明顯的差異,雖然銳龍9 3900X的核心數只比銳龍7 2700X多了50%,但是浮點性能卻提升了3倍有余。
另外說一點,銳龍9 3900X的浮點性能已經與32核的ThreadRipper 2990WX相差無幾。
5、3DMark
在3DMark Fire Strike Extreme中,銳龍9 3900X的物理分數為29239。
銳龍7 3700X的物理分數為24316。
銳龍7 3700X的物理分數基本與i9-9900K持平。
六、生產力工具效能測試:Zen 2構架遠遠優于酷睿構架
1、CineBench R15
銳龍9 3900X單線程分數為202cb,多線程成績則為3099cb。
銳龍7 3700X單線程分數為200cb,多線程則為2052cb。
在單線程性能方面,銳龍3000遠遠強于前代,和i9-9900K相比也沒多少差距。
而在多線程性能方面,銳龍7 3700X則略微領先i9-9900K,銳龍9 3900X是毫無疑問的性能王者。
2、CineBench R20
銳龍9 3900X單線程分數為511cb,多線程成績則為7118cb。
銳龍7 3700X單線程分數為505cb,多線程則為4804cb。
單線程方面,銳龍3000同樣有非常大的進步,和i9-9900K之間的差距已經微乎其微。
多線程方面,銳龍 7 3700X罕見的落后于i9-9900K,雖然僅僅是差了121分。
3、POV-Ray
銳龍9 3900X的多線程成績為6100PPS,單線程則為478PPS。
銳龍7 3700X的多線程成績為4296PPS,單線程則為464PPS。
在單線程方面,銳龍3000系列與i9-9900K之間存在著8%的差距,但是和前代的銳龍7 2700X相比,提升了將近20%。
至于多線程性能,銳龍7 3700X成績與i9-9900K相當。
4、X264 FHD Benchmark
X264 FHD Benchmark最多只能支持到16個線程,不過好在可以多開,我們同時開啟2個程序并行測試,取總和作為測試成績。
銳龍9 3900X的成績為95.5FPS。
銳龍7 3700X的成績為56.7FPS。
銳龍7 3700X惜敗給了i9-9900K,差距為4幀,不過銳龍9 3900X表現生猛,達到了95.5FPS,幾乎是銳龍7 2700X的二倍。
5、X265 FHD Benchmark
X264 FHD Benchmark同樣也是最多只能支持到16個線程,我們開啟2個程序同時進行編碼測試。(現在主流的X265視頻壓縮制作軟件都支持多開并行運行處理,因此我們的測試方式有一定的參考價值)。
銳龍9 3900X的成績為98FPS。
銳龍7 3700X的成績為64.4FPS。
在X265轉碼方面,銳龍9 3900X幾乎是銳龍7 2700X 2.5倍的性能。
一般來說壓制一部X265編碼的4K電影使用銳龍7 2700X或者i9-9900K需要1~2天的時間,裝備銳龍9 3900X可以大大節省用戶的時間成本。
我們將所有理論測試的成績匯總如下:
1)、單核性能:
銳龍3000系列處理器相比前代有了相當大的提升,銳龍7 3700X相比銳龍7 2700X提升了16%,而銳龍9 3900X的提升幅度更是達到了18%。
和Intel主流平臺最強的i9-9900K相比,銳龍7 3700X還有的8%的差距,而銳龍9 3900X只有不到6%的性能差距。
2)、多核性能:
到了多核性能方面,銳龍3000系列處理器則是有了天翻地覆的變化。
首先和前代的銳龍7 2700X相比,銳龍7 3700X的全核頻率提升了5%(4175MHz vs 3975MHz),但是性能卻提升了23%之多,也就是說IPC足足提高了18%。
和Intel i9-9900K相比,銳龍7 3700X的多核性能還能領先1%,但是要知道的是,前者的全核頻率可是高達4700MHz,而后者只有4175MHz。銳龍7 3700X以13%的頻率差距,卻達到了對手同樣的性能。
在IPC方面Zen 2構架徹底超越了Intel的引以為傲的酷睿構架。
七、磁盤性能測試:磁盤讀寫速度飆到5GB/s
PCI Express發展到3.0之后,到現在已經過去了將近10年的時間,這個標準其實早已不能滿足玩家對于速度的需求,特別是搭載多個PCIe通道的設備時,更是如此。
PCIe版本和傳輸速度:
PCIe 1.0 :250MB/s
PCIe 2.0 :500MB/s
PCIe 3.0: 984.6MB/s
PCIe 4.0 :1.969GB/s
顯卡若采用全尺寸的PCIe x16接口,3.0版本可以達到接近16GB/s的帶寬,而4.0則能達到32GB/s。
現在大部分NVMe協議的M.2 SSD都是PCIe x4通道,3.0版本最高可以達到4GB/s(實際上大部分只能達到3.2GB/s);而4.0版本則可以達到8GB/s的理論傳輸帶寬。
銳龍3000+X570的組合,PCIe 4.0是一個亮點,我們使用了影馳最新推出的HOF PRO PCIe 4.0 SSD 2TB來測試磁盤性能。
以上是在銳龍9 3900X+X570主板上的測試成績。
在AS SSD中,最高順序讀寫速率分別超過了4200MB/s、3900MB/s。
在CrystalDiskMark中,HOF PRO PCIe 4.0 SSD 2TB最大讀取速度可以達到4900MB/s,寫入速度可以達到4262MB/s,遠遠超越了目前所有的PCIe 3.0 SSD。
要注意的是,我們在微星MEG X570 GODLIKE超神板主板上插滿了3個M.2 SSD,磁盤的性能并沒有任何的損失。
這是在銳龍7 2700X+X570主板上的測試成績。
可以看到,在搭配2代銳龍之后,HOF PRO PCIe 4.0 SSD 2TB被降級到了PCIe3.0,在讀寫速度上有比較大的損失。要體驗PCIe 4.0的極速只能使用銳龍9 3900X+X570的搭配組合。
這是在華碩MXH+i9-9900K上的測試成績,MXH主板在接入2個NVMe SSD之后,第二個M.2插槽會降到PCIe 3.0x2,最高讀寫速度只能達到1700MB/s。如果是PCIe 4.0x2,讀寫速度則能超越3400MB/s。
八、內存性能測試:最佳內存頻率是3600MHz
內存性能一直是AMD的心結所在,一代銳龍在發布時連支持雙通道2400MHz都很困難。后來經過AMD不斷的優化,到了二代銳龍,已經可以支持DDR4 3466MHz,但是相比Intel還是有不小的差距。
到了3代銳龍,按照AMD的說法,最高可以支持5000MHz+的高頻內存條,下面讓我們用實際測試要驗證一下。
我們測試平臺所使用的內存是影馳HOF OC Lab DDR4-4000MHz 8GBx2套裝。
首先是2400MHz,在這個頻率上,讀取、寫入以及復制速度分別為36GB/s、35GB/s、37GB/s。三級緩存的讀寫速度則接近1TB/s,緩存延遲為9.7ns,延遲相比前代降低了一半。另外還需要關注的是此時Infinity Fabric總線也就是傳統北橋頻率為1200MHz,與內存頻率為1:1關系。
超頻到3200MHz之后,讀取、寫入以及復制速度分別為48GB/s、47GB/s以及50GB/s,內存延遲為74.9ns,三級緩存的延遲為10ns,北橋頻率1600MHz。
超頻到了3600MHz之后,讀取、寫入以及復制速度分別為55GB/s、53GB/s以及55GB/s,內存延遲為67.6ns,三級緩存的延遲為9.9ns,北橋頻率1800MHz。
超頻到3733MHz之后,內存的性能并沒有提高。讀取、寫入以及復制速度分別為55GB/s、53.7GB/s以及55GB/s,內存延遲為81.1ns,三級緩存的延遲為10nmns,北橋頻率933MHz。
這個3733MHz這個頻率上,內存的延遲反而變高了,從3600MHz的67.6ns增加到了81.1ns。主要的原因是此時北橋頻率不再與內存頻率保持1:1的比例,而且變更為1:2,也就是北橋頻率只有內存頻率的1/2,這樣的好處就是內存頻率不再受北橋頻率的約束,X570主板可以很輕松的支持高頻內存條,但是副作用也很明顯,北橋頻率太低導致了更高的內存延遲,對系統的性能也有一定的影響。
最后我們直接在XMP的默認時序下(19-25-25-25)將內存頻率超頻至4400MHz,內存的讀取、寫入以及復制速度分別為56GB/s、56GB/s以及62GB/s,內存延遲依舊較高,達到了78.1ns,北橋頻率1100MHz,與內存頻率保持1:2的關系。
我們將測試的結果匯總如下:
從上表可以看出,銳龍3000系列處理器的確可以很輕易的上到更高的內存頻率。但在內存頻率超過3600MHz之后,北橋將不再保持與內存保持1:1的同步頻率,而是變成1:2的異步頻率。北橋頻率的大幅度降低,也導致了內存延遲變高,實際游戲的幀率表現反而更低了。
因此對于Zen 2構架的銳龍3000系列處理器來說,3600MHz是最合適的頻率,這個頻率擁有最低的內存延遲,最高的游戲性能。
九、游戲性能測試:終于追上 幾乎無差距
第一、二代的銳龍處理器雖然擁有強悍的理論性能,但是由于單核性能的弱勢以及一些其他的原因,導致其游戲表現不盡如人意。
那么IPC得到了大幅度提升的銳龍3000系列處理器能不能實現徹底翻盤呢?
為了盡可能消除顯卡瓶頸,我們使用了一塊索泰RTX 2080 Ti玩家力量至尊PGF顯卡,這是目前的頂級非公RTX 2080 Ti之一(感謝索泰提供測試顯卡)。
絕地求生
在銳龍3000系列處理器誕生之前,Intel的處理器在《絕地求生》有著最好的幀率表現,但是現在不一樣了。
銳龍9 3900X在1080P分辨率下達成了235FPS的幀率,比i9-9900K還要快了9幀;銳龍7 3700X的表現則與i9-9900K相同,略強于i7-8086K。
APEX 英雄
《Apex英雄》沒有提供測試程序,為了減少測試時變量的干擾,我們選取在訓練場進行幀數測試,測試時手動調整為最高畫質。我們在訓練場錄得的幀率與實戰時的幀率較為接近,因此有一定的參考價值。
這款游戲對顯卡的要求大過處理器,5款處理器的結果沒有太大區別,不過總體來說,Intel的這邊略占優勢,可以領先銳龍處理器10幀的樣子。
GTA V
這是一款傳統的A黑游戲,AMD處理器在《GTA 5》中的表現一向不太好。
就幀率來說,2款銳龍3000處理器相比前代的銳龍7 2700X有了巨大的進步,甚至可以媲美i7-8086K,不過與i9-9900K之間還是有13幀的差距。
刺客信條:奧德賽
在《刺客信條:奧德賽》中,銳龍9 3900X的幀率表現超越了i7-8086K,與i9-9900K之間有2幀的差距;銳龍7 3700X相比銳龍7 2700X則提高了7幀。
孤島驚魂5
《孤島驚魂5》一直都是Intel的優勢項目,銳龍2 2700X與i9-9900K之間有著巨大的性能鴻溝,雖然三代銳龍已經有了巨大的提升,但仍不足以彌補差距。
銳龍9 3900X的幀率為135FPS,與i7-8086K之間有12幀的差距,與i9-9900K則相差了23幀。但是與銳龍 2700X相比,則有這19幀的提升。
古墓麗影:暗影
索泰RTX 2080 Ti玩家力量至尊PGF顯卡太強了,在《古墓麗影:暗影》中1080P分辨率下,以上五款處理器都不同程度上的存在一些瓶頸,無法完全發揮這塊顯卡的全部性能。
銳龍9 3900X的幀率為141FPS,表現與i7-8086K完全相同,比i9-9900K則少了11幀。
鬼泣5
《鬼泣5》這款游戲不太需求處理器性能,拿它來測試CPU其實是不太合適。
以上5款處理器的表現并沒有太大差異,銳龍9 3900X稍強一些。
奇點灰燼
很多人認為《奇點灰燼》是AMD的專用游戲,其實它只是對多核的支持更好一些,但是也只能支持到6核。
除了銳龍7 2700X之外,其他4款處理器的性能差距不大,銳龍9 3900X表現更好。
文明6
《文明6》是一款特別需求處理器性能的游戲,同時對多核的支持也非常到位。
銳龍9 3900X在1080P分辨率下跑出了90FPS的幀率,比i9-9900K快了8幀,比i7-8086K則快了16幀。
巫師3
《巫師3》是一款需求顯卡的游戲,即便是在1080P分辨率下,他都能讓索泰RTX 2080 Ti玩家力量至尊PGF顯卡的占用率達到100%,因此5款處理器同樣也沒有測出太多的差別。
在這5款處理器中,銳龍9 3900X的幀率更加穩定一些,幀率表現也更好。
為了方便大家對比,我們將游戲的測試結果匯總如下:
首先說明,測試處理器的真實游戲性能必須使用頂級顯卡以消除顯卡的瓶頸,不同檔次的顯卡測試出來的結果會有區別,比如《古墓麗影:暗影》,如果使用GTX 1080級別的顯卡,以上5款處理器都能跑出110FPS的幀率,測試的結果并沒有多大的意義。
當然,測試項目的選擇也會影響整體的結果,《絕地求生》、《GTA V》以及《孤島驚魂5》這三款游戲可以稱作是A黑游戲,大部分媒體在測試AMD處理器游戲性能時會盡量回避這3款游戲。
好了,讓我們來看結果。
銳龍3000系列處理器的表現確實讓人吃驚,銳龍9 3900X的游戲性能已經超越了酷睿i7-8086K,與i9-9900K之間僅僅有2%的差距;而銳龍7 3700X的表現則能持平i7-8086K。
在熱門游戲《絕地求生》中,最新的銳龍處理器的表現甚至要比Intel最強的i9-9900K更好。
十、超頻測試:銳龍9 3900X可以穩定4.4GHz
1、全核頻率
在超頻之前,必須要知道銳龍9 3900X與銳龍7 3700X在默頻下的全核最高頻率可以達到多少,這樣才能知道最終的超頻幅度是多少。Intel的處理器可以通過各種軟件查看全核頻率,而AMD不僅從來不公布銳龍處理器的全核頻率,也無法直接在軟件中查看到。
在這里我們選擇運行一些低負載的項目來檢測處理器的全核最高頻率,測試項目我們選擇的是wPrime并跑滿全部線程。
在未開啟PBO的情況下,銳龍7 3700X的功耗上限為90W,在wPrime 1024M多線程測試中,處理器的最大的功耗為80.4W,離功耗墻還有一段距離,此時處理器的頻率為4150~4175MHz之間徘徊。由此判斷銳龍7 3700X在默頻下的全核最高頻率為4.175GHz。
接下來是銳龍9 3900X:
很幸運,在wPrime 1024M多線程測試中,銳龍9 3900X的最大功耗為135W,沒有觸碰到功耗墻(未開啟PBO時,功耗上限145W)。此時處理器的頻率在4075MHz~4099MHz之間徘徊,由此判斷銳龍9 3900X在默頻下的全核最高頻率為4.075GHz(或者4.1GHz)。
2、Precision Boost Overdrive
Precision Boost Overdrive精確增壓超頻(簡稱PBO),這是AMD為新手玩家而準備的超頻功能,作用類似于NVIDIA的Boost 4.0。它能在安全的電壓、安全的溫度之內盡可能的增加處理器功耗,突破功耗墻限制,讓處理器運行在更高的頻率上。
PBO功能在BIOS中默認是關閉的,需要玩家手動打開。
銳龍7 3700X未開啟PBO時,功耗上限為90W,而銳龍9 3900X的功耗上限則為145W。
下面讓我們來看看開啟PBO之后能給銳龍9 3900X帶來多大的提升,測試項目為CineBench R15。
在未開啟PBO時,測試CineBench R15 時,銳龍9 3900X已經觸碰到了功耗墻,此時處理器功耗為145W,核心頻率在3.9GHz~3.925GHz之間徘徊。
在開啟PBO之后,銳龍9 3900X可以跑滿4.075GHz的全核頻率,功耗也相應的上升到了177W。
開啟PBO后CineBench R15最后的得分為3204分,比未開啟時的3099分多了105分,提升幅度為3%。
3、超頻測試
由于時間所限,超頻測試并沒有做的很詳細。
在MEG X570 GODLIKE超神板主板的BIOS中設置3級防掉壓,我們手上這塊銳龍9 3900X可以在1.41V的電壓下穩定的在4.4GHz的頻率上。但是此時運行CineBench R15時,處理器核心功耗已經達到了230W,溫度也高達93度。
最終CineBench R15的得分為3356cb,比默頻的3099提高了257分,提升幅度接近9%。
另外有一點需要注意,我們所使用的散熱器為玩家風暴船長240Pro水冷散熱器,在R15的測試中,處理器的溫度已經高達93度,銳龍9 3900X的溫度墻為95度,且無法修改。想要在4.4GHz下穩定運行,必須使用更高加高端的散熱器,否者觸碰溫度墻后,主機會瞬間重啟。
另外一款銳龍7 3700X的超頻表現有點辣眼睛。
測試銳龍7 3700X時,我們使用的散熱器為貓頭鷹U12S風冷散熱器。
經過多次嘗試,發現銳龍7 3700X的超頻上限竟然只能到4.3GHz,即便將電壓調到1.41V也沒有改善。
要知道銳龍7 3700X默認全核就有4.175GHz,結果卻只能超頻到4.3GHz,100MHz的超頻幅度實在不夠看。
十一、溫度與功耗測試:銳龍7 3700X烤機功耗僅有i9-9900K一半
1、溫度測試
使用AIDA64 FPU程序測試默頻時2款銳龍處理器的溫度表現,測試使用貓頭鷹U12S風冷散熱器,硅脂為Arctic MX-4,室溫27度。
運行AIDA64 FPU 5分鐘之后,處理器的溫度為73度,運行頻率為4.0GHz,核心功耗90W。微星MEG X570 GODLIKE超神板的供電區域MOSFET溫度為46度。
接下來是銳龍9 3900X:
測試時打開了PBO,于是測試時處理器的功耗便達到了161W,核心溫度為95度,運行你頻率3.9GHz。
對于銳龍9 3900X而言,想要在高功耗下運行,最好以一款240mm或者更高規格的水冷散熱器。
2、功耗測試:
分別測試使用待機、拷機的功耗。測試使用的電源為酷冷至尊V850鉑金牌電源。以下數據是平臺整機功耗。
測試時我們在X570主板上將內存頻率超頻到了3600MHz,導致待機功耗有些偏高。
待機時銳龍平臺的功耗整體上比酷睿平臺要高15W左右。
但是在烤機時,銳龍7 3700X的功耗表現令人驚喜,在性能與i9-9900K相當的情況下,整機功耗竟然只有對手的一半。而銳龍9 3900X的烤機功耗雖然達到了250W,但依然不及i9-9900K。
十二、總結:Intel還有機會嗎?
在大多數人固有思維中,銳龍處理器的長處是就是暴力堆核心數量,以數量打倒對手,但在單核性能以及游戲幀率方面卻無力對抗對手。
銳龍3000系列處理器給了我們足夠的驚喜!
經過重新設計的Zen 2構架在IPC方面相比前代至少 有15~18%的提升,雖然在頻率方面仍然不及對手,但是單核性能已經與Intel最強的i9-9900K相差不多。而在多核性能方面,新的銳龍處理器展現了強大的性能優勢,銳龍7 3700X即便頻率比i9-9900K低了500MHz,但多核性能還能與對手持平。
銳龍9 3900X更加不用說了,多核性能1.5倍與Intel主流平臺最強的i9-9900K處理器。
對于時間就是金錢的用戶來說,銳龍9 3900X強大的性能可以大大提高生產力相關的運算效率。銳龍9 3900X在壓制X265編碼的視頻時,性能是銳龍7 2700X的2.5倍,i9-9900K的1.7倍。
在游戲性能方面,AMD也終于揚眉吐氣!銳龍9 3900X在主流游戲中的幀率表現超越了i7-8086K,與i9-9900K之間僅有2%的差距;而銳龍7 3700X則能打平i7-8086K。如果AMD能夠改進銳龍處理器在《孤島驚魂5》中的幀率表現,那么銳龍9 3900X的游戲性能就能一舉超越對手最強的i9-9900K(至少也能持平吧)。
另外請記住,銳龍9 3900X的運行頻率是大大低于i9-9900K的,能有這樣的表現,也不得不嘆服于Zen 2構架的強大!
銳龍3000系列處理器的超頻表現很謎!核心數更少的銳龍7 3700X超頻能力竟然不如銳龍9 3900X。猜測銳龍7 3700X應該是體制較差的一批,好體質的8核Zen 2處理器可能被做成了銳龍7 3800X,只是暫時還未推向市場。
銳龍9 3900X的超頻表現還算說得過去,在1.41V的電壓下可以達到4.4GHz的穩定運行頻率,能比默頻高出了8~10%的性能。不過想給銳龍9 3900X超頻的玩家,需要準備一款強力的散熱器來伺候。
在7nm制程工藝的加持下,銳龍9 3900X/7 3700X的功耗表現也相當的亮眼!銳龍7 3700X的烤機功耗竟然只有相同性能的i9-9900K的一半;即便是12核心的銳龍9 3900X,其烤機功耗也比i9-9900K更低!
14nm Intel擠牙膏玩了這么多年,終于被AMD完全超越了,功耗、價格、性能方面都處于全面的劣勢!如果Intel不盡快推出10nm的桌面處理器,將很難對抗如此強大的銳龍3000處理器。
-
處理器
+關注
關注
68文章
19312瀏覽量
230034 -
amd
+關注
關注
25文章
5470瀏覽量
134233 -
intel
+關注
關注
19文章
3482瀏覽量
186066
發布評論請先 登錄
相關推薦
評論