早期內存通過存儲器總線和北橋相連,北橋通過前端總線與CPU通信。從Intel Nehalem起,北橋被集成到CPU內部,內存直接通過存儲器總線和CPU相連。
所以,在AMD采用Socket FM1,Intel采用LGA 1156插槽之后的處理器都集成了北橋,獨立的北橋已經消失,主板上僅余下南橋。
計算機體系的主要矛盾在于CPU太快了,而磁盤太慢了。所以它倆是不能夠直接通信的,需要增加一個過渡層,這就是內存的作用。哈佛結構是一種將程序指令存儲和數據存儲分開的存儲器結構。
內存(Memory)也被稱為內存儲器,其作用是用于暫時存放CPU中的運算數據,以及與硬盤等外部存儲器交換的數據。計算機中所有程序的運行都是在內存中進行的,因此內存的性能對計算機的影響非常大。
1996年底,SDRAM開始在系統中出現,不同于早期的技術,SDRAM的出現是為了與CPU的計時同步化所設計。
SDRAM亦可稱為SDR SDRAM(Single Data Rate SDRAM),Single Data Rate為單倍數據傳輸率,SDR SDRAM的核心、I/O、等效時脈皆相同, SDR SDRAM在1個周期內只能讀寫1次,若需要同時寫入與讀取,必須等到先前的指令執行完畢,才能接著存取。
DDR SDRAM為雙通道同步動態隨機存取內存,是新一代的SDRAM技術。別于SDR(Single Data Rate)單一周期內只能讀寫1次,DDR的雙倍數據傳輸率指的就是單一周期內可讀取或寫入2次。在核心頻率不變的情況下,傳輸效率為SDR SDRAM的2倍。
總結:DDR采用時鐘脈沖上升、下降沿各傳一次數據,1個時鐘信號可以傳輸2倍于SDRAM的數據,所以又稱為雙倍速率SDRAM。它的倍增系數就是2。
DDR2 SDRAM為雙通道兩次同步動態隨機存取記憶體。DDR2內存Prefetch又再度提升至4bit(DDR的兩倍),DDR2的I/O時脈是DDR的2倍。
總結:DDR2仍然采用時鐘脈沖上升、下降時各傳一次數據的技術(不是傳2次),但是一次預讀4bit數據,是DDR一次預讀2bit的2倍,因此,它的倍增系數是2X2=4。
DDR3SDRAM為雙通道三次同步動態隨機存取記憶體。DDR3記憶體Prefetch提升至8bit,即每次會存取8 bits為一組的數據。DDR3傳輸速率介于800~1600 MT/s之間。
此外,DDR3 的規格要求將電壓控制在1.5V,較DDR2的1.8V更為省電。DDR3也新增ASR (Automatic Self-Refresh)、SRT(Self-Refresh Temperature)等兩種功能,讓內存在休眠時也能夠隨著溫度變化去控制對內存顆粒的充電頻率,確保系統數據完整性。
總結:DDR3作為DDR2的升級版,最重要的改變是一次預讀8bit,是DDR2的2倍,DDR的4倍,所以,它的倍增系數是2*2*2=8。
DDR4 SDRAM提供比DDR3/DDR2更低的供電電壓1.2V以及更高的頻寬。DDR4 新增了4 個Bank Group 組的設計,各個Bank Group具備獨立啟動操作讀、寫等動作特性,Bank Group 組可套用多工的觀念來想像,亦可解釋為DDR4 在同一時脈工作周期內,至多可以處理4 組數據,效率明顯好過于DDR3。
另外,DDR4增加了DBI(Data BusInversion)、CRC(Cyclic Redundancy Check)、CA parity等功能,讓DDR4內存在更快速與更省電的同時亦能夠增強信號的完整性和儲存的可靠性。
Intel在2017年推出對應于六代酷睿Skylake的服務器平臺“Purley”,采用14nm工藝、最多28核心56線程、6通道DDR4內存、光纖互連通道,采用UPI總線替代QPI總線等等。UPI是 UltraPath Interconnect(超級通道互連)縮寫,數據傳輸率可達9.6GT/s、10.4GT/s,帶寬更足,靈活性更強,每條消息可以發送多個請求。
內存未來三大演進方向分別為容量、電壓和頻率。
- 容量越來越大(4GB -> 8GB -> 16GB ->32GB -> 64GB->…512GB)
- 電壓越來越低(1.5v -> 1.35v -> 1.2v->…)
- 頻率越來越高(1333 -> 1600 -> 1866-> 2133 -> 2400->..3200)
主流內存生產廠家分為內存顆粒廠商和模組廠商,三大內存顆粒(DRAM)原廠依次為Samsung、SK Hynix和Micron。模組廠商Ramaxel和Kingston通過從顆粒廠商購買顆粒制作內存條(DIMM)。
內存有三種不同的頻率指標,它們分別是核心頻率、時鐘頻率和有效數據傳輸頻率。
- 核心頻率即為內存Cell陣列(Memory Cell Array)的工作頻率,它是內存的真實運行頻率;
- 時鐘頻率即I/OBuffer(輸入/輸出緩存)的傳輸頻率;
- 有效數據傳輸頻率則是指數據傳送的頻率。
系統最大內存帶寬 = 內存標稱頻率*內存總線位數*通道數*CPU個數
實際內存帶寬 = 內存標稱頻率*內存總線位數*實際使用的通道數
實際內存帶=內存核心頻率*內存總線位數*實際使用的通道數*倍增系數。
從SDRAM-DDR時代,數據總線位寬時鐘沒有改變,都為64bit,但若是采用雙通道技術,可以獲得64*2=128bit的位寬。
下面計算一條標稱DDR31066的內存條在默認頻率下的帶寬,1066是指有效數據傳輸頻率,除以8才是核心頻率,一條內存只用采用單通道模式,位寬為64bit。所以,實際內存帶寬=(1066/8)*64*1*8=68224Mbit。
由此可知,如果內存工作在標稱頻率的時候,可以直接用標稱頻率*位寬*實際使用的通道數,簡化公式=1066*64*1=68224Mbit。
如果說內存帶寬是處理器與內存交換數據的關鍵,那么顯存帶寬對顯卡同樣也很重要。GPU核心負責運算,顯存負責數據存儲,二者之間需要頻繁交換數據,這就要依賴顯存帶寬了,更高的帶寬可以讓顯卡在處理高分辨率、高畫質時更加得心應手。
顯存帶寬從大的方面來說是顯存頻率及顯存位寬來決定的,不過實際帶寬就要看具體情況了,目前主流顯卡的位寬多是128bit、256bit、384bit及512bit,更能決定帶寬的還是顯存類型,它們決定了顯存帶寬的極限。
目前最主流的顯存當然是GDDR5,之前還有過曇花一現的GDDR4,現在低端市場上還有gDDR3顯存殘存,AMD在其顯卡上使用了HBM顯存,相比GDDR5顯存更強大,帶寬大幅提升。
就這二者來說,GDDR5內部I/O帶寬是32bit,目前的NVIDIA顯卡的GDDR5顯存頻率可以達到1750MHz,它是4倍速率機制,數據頻率是7Gbps,單個芯片的帶寬是28GB/s。目前的HBM顯存的頻率只有500MHz,2倍頻率率機制,數據頻率是1Gbps,不過它的I/O帶寬極高,彌補了頻率不足。
GDDR5和HBM顯存是目前最主流的顯存技術。目前gDDR3顯存基本上是NVIDIA及AMD部分低端顯卡在用。GDDR5絕對是目前的主流,單顆芯片的容量逐漸從之前的2Gb提高到4Gb,美光前不久還量產出貨了8Gb(1GB)顆粒的,高端顯卡也只要4-8顆芯片即可實現4-8GB容量顯存,這將進一步推動大容量顯卡的出現。
HBM是后起之秀,目前只有是AMD家獨使用,第一代HBM技術其堆棧的顯存核心容量2Gb(1個堆棧是4顆核心),數據頻率1Gbps,位寬1024bit。
顯存帶寬=顯存等效數據頻率(Gbps)*顯存總位寬(bit)/8=顯存實際頻率(MHz)*顯存數據倍率(1、2、4不等)*顯存等效位寬(64-512bit不等)/8
由于顯卡廠更習慣用數字更大更好看的數據頻率來標記產品規格,上述公司實際上還可以更簡單,直接變成:
顯存帶寬(GB/s)=顯存數據頻率(Gbps)*顯存等效位寬(bit)/8
拿NVIDIA的GeForce GT 720顯卡來舉例說明,該卡位寬僅為64bit,同時支持gDDR3和GDDR5顯存,前者的典型頻率900MHz,后者的典型頻率是1250MHz,兩種配置下帶寬分別是:
gDDR3:GT 720顯卡的帶寬為:900MHz *2*64 bit/8= 14.4GB/s,或者是1.8Gbps *64bit/ 8= 14.4GB/s。
GDDR5:GT 720顯卡的帶寬為1250MHz *4*64 bit/8 = 40GB/s,或者是5Gbps* 64bit/8=40GB/s。
評論
查看更多