CPU 篇
時間過的很快,對于老玩家來說,今年已經迎接第六代 Intel 處理器,當然這還不算古早時期的 Intel 產品。第六代處理器架構命名為 Skylake,根據 Intel 的 Tick-Tock 策略,這次來到了更換架構的 Tock 時程。相較于更換工藝的 Tick,變換架構的 Tock 往往能帶來更大的效能提升,以及新功能、新技術的實裝,這次我們就來看看 Skylake 處理器,新增了哪 4 大特色。
特色 1:工藝、架構雙重升級
等等,你是不是搞錯了什么?為什么 Skylake 會是工藝與架構都升級,剛剛不是才說 Skylake 屬于更新架構的 Tock 時程嗎?從策略面來說,Skylake 的確是延續 Broadwell 的 14nm 工藝。對于消費者而言,Haswell 之后就是緊接著 Skylake,因此可說是工藝、架構全都升級。現實點的朋友可能會問,從 Haswell 到 Skylake 有什么改變?
過往工藝升級,最顯而易見的優點就是 TDP 降低。TDP 降低意味著你可以用更小的散熱風扇,TDP 雖不等于耗電量,但 TDP 基本上與功耗成正比。比較 Haswell 與 Skylake 的主流四核心處理器 TDP,可看到從 84W 降低到了 65W,省電又減少廢熱自然是很強勢的優點。
▲根據 Tick-Tock 策略,Skylake 已經是第六代產品,由先至后依序為 Nehalem、Sandy Bridge、Ivy Bridge、Haswell、Broadwell。
14nm 工藝 FinFET 縮小到 78%
剛剛提到工藝升級的實際好處,那你可能會反過來問工藝上 Intel 做了哪些改變?Skylake 用的是第二代 FinFET 晶體管管技術,14nm 與 22nm 的工藝相比,Skylake 的晶體管縮小到原先的 78%、FinFET 鰭片間距縮減到 70%、SRAM 面積更縮小到 54%。數字一再顯示,單位面積內,Skylake 的晶體管數量遠高于 Haswell,晶體管密度更高。
工藝升級要解決的大問題是漏電,雖然 Intel 未明確公布 Skylake 漏電控制的數據,但 Intel 曾說明 14nm 的每瓦效能是 22nm 工藝的 2 倍,同為 14nm 工藝的 Skylake 可預期功耗表現會優于 Haswell 才是。
▲這是 Intel 的 22nm 工藝 FinFET 圖片,第二代的設計密度比這更高。
特色 2:DDR3、DDR4 無縫接軌
雖然在先前推出的 Haswell-E 平臺上,已經可以支持 DDR4 內存。然而 Haswell-E 畢竟是高階平臺,在消費級產品 Skylake 平臺上搭載還是比較有指標意義。特別的是,這次 Skylake 平臺并非完全向 DDR4 靠攏,而是 DDR3、DDR4 雙規格并行,可讓主板制造商自行選擇要搭配 DDR3 或 DDR4。
雙規并行對消費者的好處顯而易見,若你是從 Haswell 升級的人,大可不必丟棄你的 DDR3 內存,買張支持 DDR3 的 Skylake 平臺主機版即可。如果你是從 DDR2 平臺升級,或是要組臺新計算機,那直上 DDR4 對未來的支持度更高。將選擇權交給消費者,這點設計倒是讓人由衷喜歡。
▲圖為 DDR4-2133 的 8GB 內存模塊,DDR3 與 DDR4 的防呆插槽不同,不可混用。
DDR3、DDR4 選哪個好?
很多人一定會問,到底要選 DDR3 或 DDR4 比較好?個人認為,如果你沒預算或平臺負擔,當然是選擇 DDR4 比較好。DDR4 規范早在 2012 年 9 月就大致底定,因此不會碰到規格突然改變的問題。
DDR4 內存相較于前代,有著高頻率、低功耗、高帶寬與易于超頻的特性。普遍來說,DDR4 都是 DDR4-2133 起跳,最高約 DDR4-4000,且多數為 8GB 的大容量模塊,4GB 只是過渡產品。但若你只是要組個基本的平臺,選 DDR4 的成本可預見會比較高,且內存較難實際感受出效能差異,這數百至千元的價差是否劃算,就端看你的選擇而定。
特色 3:取消 FIVR,設計交還主板
FIVR 的全名是 Full Integrated Voltage Regulator,全整合型電壓調節模塊。FIVR 從 Haswell 開始搭載,Broadwell 持續使用,直到 Skylake 處理器才被取消。Intel 滿早就透露取消 FIVR 的消息,我們無法得知取消的主因,但大多猜測 FIVR 設計方向沒錯,但目前技術會導致部分效率不彰,因而 Intel 選擇在 Skylake 上取消這設計,然而未來可能會重新使用。
說了這么多那 FIVR 是什么?在 Haswell 時期為了強化處理器供電效率,過往主板必須設計 Core VR、Graphics VR、PLL VR、System Agent VR 等供電模塊,并透過這些供電模塊提供不同的電壓給處理器。Intel 當然會想,如果設計個全能的電壓調節模塊,并內建于處理器內,會不會讓供電更有效率?這就是 FIVR 的設計起源。
事實上,FIVR 對于精確控制電壓的確有其效用,并能提高供電效率,主板廠商也不用設計一堆供電模塊,簡化了設計復雜度。因此你可以看到 Haswell 平臺上,主板供電相數 4 相就能用,中高階版本也不過 8 至 12 相。過往 24 甚至 36 相的供電已經不存在,但取消 FIVR 后會不會再度復蘇值得觀察。
▲FIVR 是 Haswell 平臺開始使用,圖中可看出它整合了原先 Ivy Bridge 主板的大量供電模塊。供電單一化之后,有助于提升供電效率,但也因為 FIVR 內建于處理器內,因此造成處理器的 TDP 因而提升。
FIVR 的隱憂與缺陷
然而 FIVR 會被取消肯定有其弊病,部分認為 FIVR 增加了處理器設計的復雜程度,畢竟必須將 FIVR 整合于處理器內。其次,主流的處理器 TDP(Thermal Design Power),從 Ivy Bridge 時期的 77W 提升到 84W,據稱也是 FIVR 的影響。
此外,先前在 IDF 2015 大會上,有提到 FIVR 在 TDP 僅 4.5W 的 Skylake-Y 中表現不佳,因此可能是 Intel 決定整個架構刪除 FIVR 的主因。
特色 4:BCLK 獨立,超頻更容易
先前 3 項特點對于部分玩家來說可能無感,但 Skylake 讓 BCLK 獨立,不會像過往與 PCI-E 頻率連動,造成超頻的瓶頸。雖然處理器倍頻依然被鎖,但 BCLK 可從 100MHz 超到 133MHz,相較于過去只有 5 至 10% 的超頻幅度形成強烈對比。
Skylake 設計革新不僅于此
Skylake 除了上述比較容易理解的 4 項特點外,在 GPU、架構方面還有很多新的設計,舉凡 EU 數量增加、供電設計更有效率、強化分支預測器等,都是 Skylake 的設計革新。但礙于篇幅有限,CPU 篇到此做個段落。
整體而言,Skylake 對我們而言不僅有架構上的改變,也有工藝上的提升,對于消費者來說,DDR3 與 DDR4 并存提供了更多的選擇空間。對于玩家而言,BCLK 獨立強化超頻性,也是值得期待的特色。但新設計可能會帶來額外的副作用,就如同當年的 FIVR 一般,新的設計會不會有其他問題,過陣子應該就會知道。但目前而言,Skylake 還是值得期待的新產品。
▲Skylake 的特色不僅只有上述 4 點,在 GPU、PCH 甚至是功能方面都有新功能或改進。個人認為,雖然近年處理器規格與效能進步幅度如擠牙膏般,但 Skylake 算是值得試試的產品。畢竟前面的 Haswell Refresh 與 Broadwell 太令人失望了,你說是不是?
GPU 篇
前文提到了Intel新處理器 Skylake 的 4 大特點,包括工藝提升、支持 DDR3 與 DDR4、取消 FIVR、BCLK 獨立等功能。當然這僅止于處理器層面的變化,Skylake 平臺還有繪圖核心的改變,以及主板芯片組的改進。這次讓我們來看看,Skylake 在繪圖核心有哪些改變。
Intel 這幾年處理器的效能增長如擠牙膏般一滴滴被壓榨出來,而且絕大多數的增長都是顯示核心層面,而非處理器本身的運算效能提升。從 HD Graphics 時代開始,Intel 顯示核心的地位逐漸提升,近幾年甚至能達到中低階 NVIDIA 與 AMD 獨立顯卡的效能表現。
試想,當每顆處理器都有內建不亞于低階獨立顯卡的顯示效能,何必選擇獨立顯卡呢?一方面可減少耗電量,再者也能釋放計算機的可用空間。這次 Skylake 繪圖核心主要在架構規模上提升,并且給了它個新的命名原則。
▲Skylake 的處理器分配如上圖,最左側即為繪圖核心。
GPU 特色 1:EU 規模暴增
EU 是什么?EU(Eexecution Uunit) 是 Intel 繪圖核心基本的運算單位,地位等同于 NVIDIA 的 CUDA Core,以及 AMD 的 ALU(Arithmetic Logic Unit)。過去在 Haswell 上使用的架構為 Gen 7.5,是將 10 個 EU、Thread Dispatch(線程調度器)、Sampler(采樣器) 等組件,共同組成 1 組 Subslice。
若將 2 組 Subslice、Fixed function units,加上 L3 Data Cache,就成了完整的運算單元 Slice。因此 Slice 內有 20 個 EU,這也是為什么在 Haswell 上,完整的繪圖核心規格都是 20 或 40 個 EU,例如 Core i7-4770K 的 GT2 有 20 個 EU,Core i7-4770R 的 GT3e 是 40 個 EU。至于低階產品,核心架構肯定是會刪減,因此只有 1 組 Subslice 構成 Slice,像是低階的繪圖核心 GT1 就只有 10 個 EU。
▲EU 是基本的運算單位,即便如此,內部還是有許多次層級的組件。
Gen 9 架構換湯不換藥
Broadwell 時代進化到了 Gen 8 架構,此時 Slice 內的架構設計略有變化,每組 Subslice 內僅存 8 個 EU。你可能會問,這樣效能不就更差了嗎?的確,若 Slice 內僅有 2 組 Subslice 的話確實會讓效能降低,但 Intel 讓 Slice 內增為 3 組 Subslice,讓整體的運作效率提升。
▲Gen 7.5 架構內 Subslice 有 10 個 EU,后來到了 Gen 8 時期為了效率,刪減為8 個 EU。
為何 Broadwell 重新排列組合后效率會增加?從架構圖中我們可以看到,每組 Subslice 內只有 8 個 EU,也就是說每個 Thread Dispatch(線程調度器)、Sampler(采樣器) 可以更有效率分配。而運算效能的部分,可以藉由堆棧更多的 Subslice 來達成(也就是更多的 EU),讓 Broadwell 運算效能更高。因而在 Broadwell 上,看到的 EU 數量大多是 24 或 48 等等 8 的倍數。
▲Gen 8 與 Gen 9 皆采用 8 個 EU 的配置,并且由增加 Subslice 的總數,來達到提升整體效能的目的。簡單來說,就是靠一堆運算單位來堆出效能。
到了 Skylake 時期,繪圖核心架構被稱為 Gen 8.5 或 Gen 9,從已知的架構來看,設計與 Broadwell 的 Gen 8 相同,差別僅在于顯示核心內 Slice 數量最多增加到 3 組,EU 從原本的 24、48 個,增加到最多 72 個。
▲Skylake 時期 Slice 內有 3 組 Subslice,每個繪圖核心內又有 3 組 Slice,因此EU總計有 8x3x3=72 個。
GPU 特色 2:型號新命名原則
剛剛說過,EU 從原本的 24 增加到最多 72 個,因此繪圖核心的型號增加最高的 GT4 等級,再往下依序是 GT3、GT2、GT1。當然這是給廠商以及內部使用的型號,對消費者 Intel 仍保留了 Iris Pro、Iris、HD Graphics 等品牌營銷代號。
且為了精簡型號代碼,型號從原本的 4 碼變更為3碼,像是 Iris 540、HD Graphics 515 等型號。你可以從型號中得知繪圖效能高低,Iris Pro 優于 Iris 優于 HD Graphics。內建 72 個 EU 最高級的 GT4e 就是 Iris Pro,48 個 EU 的 GT3 與 GT3e 就是 Iris,再往下就是 HD Graphics。
重生的 GPU 效能
過往 Intel 的繪圖效能都只有被嘲笑的份,但從 HD Graphics 時代開始已經有明顯的進步,到了近幾年,Iris 系列更是能與中低階獨立顯示適配器抗衡。內建就能有不錯的效能,何必多花錢買獨立顯卡。但仍有許多消費者認為獨立顯示芯片還是比較好,這造成了部分筆電上,搭配的獨立顯示芯片,竟然比內建的 Intel 顯示效能還要差的怪現象。目前最高級的 Iris Pro,也就是 GT4e 等級,約莫等同 GTX 740、HD 7750。
▲Skylake 基本的 Gen 9 架構配置如上,可視情況再增加 Slice 以提升效能。
GPU 特色 3:eDRAM 運作改變
eDRAM 是 Haswell 開始搭載的硬件設計,簡單來說它的作用為 L4 Cache。會增加這功能,主要是因為 IGP(整合型繪圖芯片) 經常面臨內存帶寬不足的問題,Intel 提供的解決方式就是在處理器內,有個獨立的內存區塊也就是 eDRAM,頻率最高 1.6GHz。
之所以位于獨立區塊,原因是這區塊工藝不同于其他區域,且獨立的好處是能隨市場增加或減少內存容量,操作彈性較高。有意思的是,這 eDRAM 并非完全隸屬于 GPU,而是可隨狀況動態調整支持 CPU(處理核心) 或 GPU(繪圖核心)。這意味著,當安裝獨顯的時候,eDRAM 就會完全替 CPU 工作,因為此時 GPU 是關閉的。
在Skylake時期,繪圖核心可與處理核心共享 LLC(L3快取),但跟 Haswell 時期相比,差異在于 eDRAM 運作方式改變。現在 eDRAM 控制器位于 System Agent,此時 LLC 能空出 512KB 的空間,讓 eDRAM 被視為 LLC 與系統主存儲器之間的快取機制。
然而,并非所有 Skylake 處理器都有 eDRAM 設計,像是 Core i7-6700K 就沒有 eDRAM。一般而言 eDRAM 容量約 64 至 128MB 不等,最高頻率 1.6GHz,讀寫的總線采分離設計,各有 32byte 的傳輸量。
▲eDRAM 可動態服務 CPU 或 GPU,但并非所有產品都有配制 eDARM。
GPU 特色 4:設計小改效率提升
雖說 Gen 9 跟 Gen 8 的架構設計大同小異,但深層仍有些變動,在此一并解說差異。基本的運算單位 EU,現在可將當下執行的線程中斷,改執行其他線程,也就是 EU 可支持多任務的運作。此外,支持列表還有 round-robin,以及執行途中不中斷的 32bit 浮點數原子式操作。
先前說過 LLC 空出多余的空間,這讓 Shared Virtual Memory 的寫入效能提升。材質樣本現在可支持 NV12 YUV 格式。
此外,單一 Slice 內 L3 Cache 容量從先前的 384 至 576KB,增加到 768KB。并有共享內存,用以存放各 EU 間互通的數據。Skylake 的繪圖核心靠的是 Graphics Technology Interface 與其他硬件溝通,它位于架構圖最底下的位置,即為繪圖核心的溝通接口,意義上與 LLC 連接。
Gen 9 架構的規格、效能,大多與 Gen 8 相同,但靠著比較多的 EU 總數,效能面還是可以勝過自家前代產品。且靠著已經成熟的 Slice 架構配置,可增減需要的 Subslice 數量,藉此作出產品區隔與效能差異。
▲中央橘黃色即為 Intel 這幾年很重視的 Ring,用以連接處理器內各原件的信息,簡單來看可視為數據的交換、傳輸管道。
靠堆量取勝的小改款
整體而言,Skylake 的繪圖核心設計與 Haswell 相比變化不大,這讓我們看到了當年 AMD 與 NVIDIA 的影子。靠著堆棧與切割運算單位,藉此達到效能增減的效果。以 Intel 目前的架構規模來說,這方式仍可運作一段時間,但仍有幾點值得關注。
第一,繪圖核心規模增加后,是否會影響到處理核心原本的表現,像是 TDP 的問題。其二,處理器內,能夠容納的繪圖核心有多大的區塊,雖然工藝精進晶體管密度更高,但總會有物理極限的問題,以及 Die 可用面積有限。
Skylake 的 Gen 9 架構,沒帶給我們太多的驚喜,但效能差距擺在眼前,對于消費者來說,關心的永遠不會是架構上的改變。而是效能增加的多少,價格又便宜了多少。以這點來說,Skylake 應該還算相當成功的產品。
主板篇
前面介紹了 Skylake 處理器架構,以及 Gen 9 的 GPU 特色,大家對于 Skylake 平臺應該有了基本的了解。但計算機并非有處理器就能運作,還得搭配主板支持才行。Intel 針對 Skylake 平臺,推出了 100 系列的芯片組 (PCH)。部分讀者表示,對于這次芯片組實在不知道該怎么挑才好,接下來我們除了介紹芯片組特色外,還帶大家了解 Z170、H170、B150、H110 等主板有什么以及少了什么。
特色 1:插槽換新不相容
這次 100 系列有 Z170、Q170、H170、Q150、B150、H110 多種 PCH 型號,皆采用 Skylake 專屬的 LGA 1151 插槽,雖然與 Haswell 相比只差了1個針腳,但很可惜地并未能向下兼容。更換腳位已經是 Intel 與 AMD 近年常用的手法,可促使消費者轉移至新平臺,且現在 2 年才換腳位,已經比之前好了一些。
▲雖然只差了 1 根針腳,但 Skylake 與 Haswell 平臺并不相容。圖片來源:legitreviews
特色 2:支持 DDR4 內存
在 CPU 篇我們曾經提到 Skylake 可支持 DDR3 或 DDR4 內存,Intel這次終于在主流平臺上導入 DDR4。如果你有很大量的 DDR3 內存,那么你可以選擇 100 系列支持 DDR3 內存的主板,但個人還是建議,DDR4 擁有高速、低功耗等優勢,若沒內存包袱還是直上新內存比較好。
如果你跟筆者一樣三心二意,沒關系!因處理器支持 DDR3 與 DDR4 控制器,在實務上的確可以做出Combo 也就是同時支持 DDR3 與 DDR4 內存的主板,讓你保留未來的內存升級空間。
▲有不少廠商推出 DDR3、DDR4 雙棲的主板,仔細看可發現內存插槽的防呆位置不同。
特色 3:DMI 3.0 帶寬、速度暴增
Intel 在處理器與 PCH 之間溝通使用的是 DMI 通道,先前 DMI 2.0 通道僅有 PCI-E 2.0 x 4,帶寬為雙向 4GB/s,這次 100 系列主板將 DMI 升級為 3.0 版本,通道變為 PCI-E 3.0 x 4,帶寬提升為 8GB/s。以往南橋芯片只提供 8 條的 PCI-E 通道,這次南橋竟然讓規格提升到 PCI-E 3.0,且最多有 20 條可供使用。
PCH 需要運用大量的 PCI-E 通道給顯示適配器、M.2 等第三方 SATA控制芯片,過去在 Z97 上經常會出現捉襟見肘的狀況。100 系列主板提供大量高速的 PCI-E 3.0 通道,可望解除外接裝置的限制,也讓主板制造商能有更多的選擇性。不再需要像過去安裝大量高速裝置,需要共享 PCI-E 帶寬。現在USB 3.1 Gen 1 數量從 6 個變 10 個,也是大帶寬帶來的優勢。
▲歸功于 DMI 3.0 的大帶寬,得以讓主板擁有更快且更多的界面。
特色 4:Flexible I/O 最多 26 埠
Flexible I/O 是 Intel 為了彈性調配接口種類的設計,簡單來說,100 系列上有 26 個埠位可供使用,像第一個就是給 USB 3.0 使用,第十二個就是給 PCI-E 使用,這些是固定只能定義給這類接口使用。但像是第十五個埠位,主板廠商就能選擇要用于 PCI-E、Lan 或是 SATA,增加了調動的彈性,而不是Intel 說了算。
然而并非所有 100 系列主板都有 26 個埠位可供使用,會依照芯片等級進行屏蔽。高階的 Z170 等主板自然有較多的埠位,而 H110 這類低階產品,自然就只剩幾個可用。因此 Flexible I/O 主要是針對中高階產品而生,畢竟低階產品都被屏蔽光了,自然也就相對少用到這功能。
▲Flexible I/O 可讓廠商調配接口的種類,不再受限于Intel的接口配制設定。
主板到底差在哪?
以 Intel 公板設計來說,各 PCH 的最大差別在于接口的多寡,從規格比較表中,不難看出各主板間的差別在哪。對于一般消費者來說,挑張 B150 甚至 H110 就夠用了,給你再多的界面你不去用它也只是浪費。
除 PCH 功能外,主板制造商常在中高階主板上多些特殊功能,像是特殊的網卡、第三方控制器等硬件設計,或是更炫的外觀。在這薄利時代,高階產品已經不能代表用料用的好,碰到有良心的廠商大多會用相對好的用料。但低階產品方面,常為了價格競爭在一些看不到的地方偷工減料,已經是很常見的狀況。
對筆者來說,會寧愿挑張中低階的主板當免洗的用,就算壞了也不心疼。畢竟高階主板的價位常常高達中低階產品的數倍以上,但事實上提供的功能設計,似乎不值得花這么大的價差去取得。至于這樣買對不對,就真的是見仁見智了。
▲主板差在哪?從表格中應該不難看出就是接口的排列組合差異。
評論