CPU 流水線
什么是流水線?
類似于工廠流水線。
為什么要弄出這個東西?
流水線是為了提高效率,能并發同時進行多個任務。
CPU的一個任務,或者說指令,被分為很多個步驟完成,就跟生產線上裝配汽車,分成若干個零件工序依次安裝。
幾種CPU流水線
Intel:流水線較少,但是每條流水線的長度很長。可以想象成,Intel有較少的生產線,而每個生產線上把裝配一輛汽車分成了較多的步驟,所以生產線很長。這樣的優點是,生產線上的每個步驟需要完成的任務相對較少,這樣,工作的節奏很容易加快,也就是號子喊的可以快一些,所以Intel的P4主頻提高非常迅速。
這種架構的缺點是,因為流水線太長,如果中間有一步發生錯誤,只有到最后一個工序才能發現。雖然這種錯誤幾率很小很小,但是不可避免,而且會被非常高的主頻放大無數倍,帶來的影響就是工作效率并沒有隨著節奏的加快而明顯提升,也就是Intel“高頻低能”的原因之一。Intel的Pentium M系列就沒有采用這種架構模式,而是采用類似AMD的短管線多管線模式。
AMD:擁有較多的流水線,就是說,生產線較多,但是每條生產線的長度較短。帶來的影響是,在短生產線上裝備一輛汽車的話,每個工序需要干的活比較多,所以大家工作的節奏就不能太快。所以AMD的主頻提高非常困難。可是AMD較多的流水線同樣保證了指令執行數量,也就是裝配汽車的數量,效率較高。短的流水線受工序錯誤的影響也很低,因為流水線短,發現錯誤會更及時。主頻低,錯誤率被放大的也小。
CPU的主頻
CPU的主頻相當于流水線工作的統一干活節奏。你可以想象成主頻就是干活時候喊的號子,大家都跟著號子一步一步的干活。
描述主頻的單位:
MIPS(Million Instruction Per Second)表示CPU每秒執行多少百萬條指令。比如0.9MIPS,表示每秒九十萬條指令。
MIPS/MHz表示CPU在每MHz的運行速度下可以執行多少個MIPS,如0.9MIPS/MHz則表示如果CPU運行在1MHz的頻率下,每秒可執行90萬條指令。如果CPU在20MHz的頻率下,每秒可運行1800萬條指令。MIPS/MHz可以很好的反映CPU的速度。
ARM CPU 三級流水線(基于ARMV7)
3級流水線如上圖所示(PC為程序計數器),流水線使用3個階段,因此指令分3個階段執行。
⑴ 取指-從存儲器裝載一條指令
⑵ 譯碼-識別將要被執行的指令
⑶ 執行-處理指令并將結果寫回寄存器或者存儲器
以前學過的51單片機,因為比較簡單,所以它的處理器只能完成一條指令的讀取和執行后,才會執行下一條指令。這樣,PC始終指向的正在“執行”的指令。
而對于ARMV7來說因為是3級流水線,所以把指令的處理分為了上面所述的3個階段。
所以處理時實際是這樣的:ARM正在執行第1條指令的同時對第2條指令進行譯碼,并將第3條指令從存儲器中取出。
所以,ARMV7流水線只有在取第4條指令時,第1條指令才算完成執行。
下圖生動形象的說明了3級流水線的處理機制。
下面一句話很關鍵: 無論處理器處于何種狀態,程序計數器R15(PC)總是指向“正在取指”的指令,而不是指向“正在執行”的指令或者“正在譯碼”的指令 。
人們一般會習慣性的將正在執行的指令作為參考點,即當前第1條指令。
所以,PC總是指向第3條指令,或者說PC總是指向當前正在執行的指令地址再加2條指令的地址。
處理器處于ARM狀態時,每條指令為4個字節,所以PC值為正在執行的指令地址加8字節,即是:
PC值 = 當前程序執行位置 + 8字節
處理器處于Thumb狀態時,每條指令為2字節,所以PC值為正在執行的指令地址加4字節,即是:
PC值 = 當前程序執行位置 + 4字節
下面一個例子就很好的說明了這個問題。
- 0x4000 ADD PC,PC,#4 ;正在被執行的指令,將地址值PC+4寫入PC
- 0x4004 ...;正在被譯碼的指令
- 0x4008 ...;正在被取指的指令,PC=0x4008
- 0x400C ...;PC+4=0x400C
另外補充說明就是根據以上描述,流水線只有被指令填滿時才能發揮最大效能,即每時鐘周期完成一條指令的執行(僅單周期指令)。
如果程序發生跳轉,流水線會被清空,這將需要幾個時鐘才能使流水線被再次填滿。因此,盡量地少使用跳轉指令可以提高程序的執行效率。
-
存儲器
+關注
關注
38文章
7484瀏覽量
163763 -
流水線
+關注
關注
0文章
120瀏覽量
25726 -
計數器
+關注
關注
32文章
2256瀏覽量
94477 -
ARM處理器
+關注
關注
6文章
360瀏覽量
41720 -
MIPS芯片
+關注
關注
0文章
6瀏覽量
1820
發布評論請先 登錄
相關推薦
評論