作為一名工程師,與計算機打交道的日子不計其數,不管你玩硬件還是做軟件,你的世界自然都少不了計算機最核心的 —— CPU。
01 CPU是什么?
CPU與計算機的關系就相當于大腦和人的關系,它是一種小型的計算機芯片,通常嵌入在電腦的主板上。CPU的構建是通過在單個計算機芯片上放置數十億個微型晶體管來實現。這些晶體管使它能夠執行運行存儲在系統內存中的程序所需的計算,所以,也可以說CPU決定了你電腦的計算能力。
02 CPU實際做什么?
CPU的工作核心是從程序或應用程序中獲取指令并且執行計算。這個過程一共有三個關鍵階段:提取,解碼和執行。CPU先從系統的RAM中提取指令,隨后解碼該指令的實際內容,最后再由CPU的相關部分執行該指令。
03 CPU的內部結構
剛才提到了很多CPU的重要性,那么CPU的內部結構是什么呢?又是由什么組成的呢?下圖展示了一般程序的運行流程(以C語言為例),一般來說,了解程序的運行流程是掌握程序運行機制的基礎和前提。
在這個流程中,CPU負責解釋和運行最終轉換成機器語言的內容,CPU主要由兩部分構成:控制單元和算數邏輯單元(ALU)。控制單元:從內存中提取指令并解碼執行;
算數邏輯單元(ALU):處理算數和邏輯運算。
CPU和內存都是由許多晶體管組成的電子部件,可以把它比作計算機的心臟和大腦。它能夠接收數據輸入、執行指令并且處理相關信息,它與輸入/輸出(I/O)設備進行通信,這些設備向 CPU 發送數據和從 CPU 接收數據。從功能上來看,CPU的內容是由寄存器、控制器、運算器和時鐘四部分組成的,各個部分之間通電信號來連通。接下來簡單介紹一下內存,為什么說到CPU需要講一下內存呢?因為內存是與CPU進行溝通的橋梁,計算機中所有程序的運行都在內存中得到運行的。內存一般又被稱為主存,它的作用是存放CPU中的運算數據,以及與硬盤等外部存儲設備交換的數據。CPU會在計算機運轉時,把需要運算的數據調到主存中進行運算。在運算完成之后,CPU將結果傳送出來,主存的運行也決定了計算機的穩定運行。
主存一般通過控制芯片與CPU相連,由可讀寫的元素構成,每個字節都有一個地址編號。CPU通過地址從主存中讀取數據和指令,也可以根據地址寫入數據,注意一點:當計算機關機時,內存中的指令和數據也會被清除。04CPU是寄存器的集合體在CPU的四個結構中,寄存器的重要性遠遠高于其余三個,為什么這么說?因為程序通常是把寄存器作為對象來進行描述的。而說到寄存器,就不得不說到匯編語言,說到匯編語言,就不得不說到高級語言,說起高級語言也就不得不提及語言的概念。05計算機語言人和人之間最古老和直接的溝通媒介是語言,但是和計算機溝通,就必須按照計算機指令來交換,其中就涉及到語言的問題。最早,為了解決計算機和人類的交流的問題,出現了匯編語言。但是匯編語言晦澀難懂,所以又出現了像是C、C++、Java的這種高級語言,因此計算機語言一般分為低級語言和高級語言。使用高級語言編寫的程序,經過編譯轉換成機器語言后才能運行,而匯編語言經過匯編器才能轉換為機器語言。06匯編語言我們先來看一段采用匯編語言表示的代碼清單:
這是采用匯編語言編寫程序的一部分,匯編語言采用助記符來編寫程序,每個原本是電信號的機器語言指令會有一個與其對應的助記符。比如,mov,add分別是數據的存儲(move)和相加(addition)的簡寫。匯編語言和機器語言一一對應,這點和高級語言不同,我們通常把匯編語言編寫的程序轉換為機器語言的這個過程,稱之為匯編。與之相反,將機器語言轉化為匯編語言的過程稱之為反匯編。匯編語言可以幫助你理解計算機做了什么工作,機器語言級別的程序通過寄存器來處理,上面代碼中的eax,ebp都是表示的寄存器,它們是CPU內部寄存器的名稱。因此,可以說 CPU 是一系列寄存器的集合體。一般,在內存中的存儲通過地址編號來表示,寄存器的種類是通過名字來區分。那些不同類型的CPU,其內部寄存器的種類、數量以及寄存器存儲的數值范圍也都是不同的。不過,根據功能的不同,我們可以將寄存器劃分為下面幾類:
其中,程序計數器、標志寄存器、累加寄存器、指令寄存器和棧寄存器只有一個,其他寄存器一般有好幾個。
07
程序計數器程序計數器是用來存儲下一條指令所在單元的地址。程序在執行時,PC的初值作為程序第一條指令的地址,在順序執行程序時,控制器先按照程序計數器所指出的指令地址,從內存中取出一條指令,隨后分析和執行該指令,并同時將PC的值加1指向下一條要執行的指令。我們可以通過一個事例來仔細看一下程序計數器的執行過程:
這是一段進行相加的操作,程序啟動,在經過編譯解析后,會經由操作系統把硬盤中的程序復制到內存中。以上示例程序,就是將123和456執行相加的操作,隨后將結果輸出到顯示器上,因為使用機器語言很難描述,所以這些都是經過翻譯后的結果。事實上,每個指令和數據都有可能分布在不同的地址上,但是為了更好的說明,就把組成一條指令的內存和數據放在了一個內存地址上。地址0100是程序運行的起始位置,Windows等操作系統把程序從硬盤復制到內存以后,就會將程序計數器作為設定為起始位置0100,然后再執行程序,每次執行一條指令后,程序計數器的數值就會增加1,或者是直接指向下一條指令的地址。隨后,CPU會根據程序計數器的數值,從內存中讀取命令并且執行,換言之,程序計數器控制著程序的流程。
08
條件分支和循環機制小伙伴們都學過高級語言,高級語言匯總的條件控制流程主要分為順序執行、條件分支、循環判斷三種。順序執行是按照地址的內容順序的執行命令。
條件分支是根據條件執行任意地址的指令。
循環是重復執行同一地址的指令。
一般情況下,順序執行的情況較簡單,每次執行一條指令程序計數器的值就是+1。條件和循環分支會使得程序計數器的值指向任意的地址,這樣一來,程序就可以返回到上一個地址來重復執行同一個指令,或者跳轉到其它任意指令。下面,我們就以條件分支舉例來說明程序的執行過程:
程序的開始過程和順序流程是一樣的,程序的順序流程和開始過程相同。CPU從0100處就開始執行命令,在0100和0101中都是順序執行,PC的值順序+1,執行到0102地址的指令時,判斷0106寄存器的數值大于0,跳轉到0104地址的指令,再將數值輸到顯示器中,隨后結束程序,0103的指令就被跳過了。這和我們程序中的if()判斷相同,在不滿足條件的情況下,指令一般會直接跳過。因此,PC的執行過程沒有直接+1,而是下一條指令的地址。
09
標志寄存器條件和循環分支會使用到 jump(跳轉指令),會根據當前的指令來判斷是否跳轉,上面我們提到了標志寄存器,無論當前累加寄存器的運算結果是正數、負數還是零,標志寄存器都會將其保存。CPU在進行運算時,標志寄存器的數值會根據當前運算的結果自動設定,運算結果的正、負和零三種狀態由標志寄存器的三個位表示。標志寄存器的第一個字節位、第二個字節位、第三個字節位各自的結果都為1時,分別代表著正數、零和負數。
CPU的執行機制比較有意思,假設累加寄存器中存儲的XXX和通用寄存器中存儲的YYY做比較,執行比較的背后,CPU的運算機制就會做減法運算。而無論減法運算的結果是正數、零還是負數,都會保存到標志寄存器中。結果為正表示 XXX 比 YYY 大,結果為零表示 XXX 和 YYY 相等,結果為負表示 XXX 比 YYY 小,程序比較的指令,實際上是在 CPU 內部做減法運算。
10
函數調用機制函數的調用和條件分支,循環機制有所不同,單純的跳轉指令無法實現函數的調用。函數的調用需要在函數內部處理后,處理流程在返回到函數調用點(函數調用指令的下一個地址)。函數的調用處理是通過把程序計數器的值設定成函數的存儲地址來實現的。
11
通過地址和索引實現數組接下來是基址寄存器和變址寄存器,通過這兩個寄存器,可以對主存上的特定區域進行劃分,以此實現類似數組的操作。首先,可以用十六進制數將計算機內存上的 00000000 - FFFFFFFF 的地址劃分出來。這樣,凡是該范圍的內存地址,只要有一個 32 位的寄存器,就可以查看全部地址。但是,要是想像數組那樣,分割特定的內存區域以達到連續查看的目的的話,使用兩個寄存器會更方便一些,比如,我們用兩個寄存器來表示內存的值。
這種表示方式很像數組的構造,數組是指同樣長度的數據,在內存中進行連續排列的數據構造。用數組名表示數組全部的值,通過索引來區分數組的各個數據元素,例如: a[0] - a[4],[]內的 0 - 4 就是數組的下標。
12
CPU指令執行過程那說了這么多,CPU到底是怎么一條條的執行指令的呢?幾乎全部的馮·諾伊曼型計算機的CPU,工作都可以分為5個階段:取指令、指令譯碼、執行指令、訪存取數、結果寫回。取指令階段就是將內存中的指令讀取到CPU中寄存器的過程,程序寄存器用于存儲下一條指令所在的地址;在取指令完成后,立馬進入指令譯碼階段,在指令譯碼階段,指令編碼器按照預先的指令格式,對取回的指令進行拆分和解釋,識別區分出不同的指令類別和各種獲取操作數的方法;
執行指令階段的任務是完成指令所規定的各種操作,具體實現指令的功能;
訪問取數階段的任務是:根據指令地址碼,得到操作數在主存中的地址,并從主存中讀取該操作數用于運算;
結果寫回階段作為最后一個階段,把執行指令階段的運行結果數據“寫回”到某種存儲形式:結果數據經常被寫到CPU的內部寄存器中,以便被后續的指令快速地存取。
編輯:黃飛
評論
查看更多