上一次的大合集我們從半導體講到了邏輯門,再從邏輯門講到了組合邏輯電路和時序邏輯電路,又緊接著介紹了CPU內(nèi)核的設計體系,最后以CPU的指令集作為結尾,一個CPU已經(jīng)頗具雛形。
經(jīng)過11-19章的更新,我們又介紹了線程和進程,處理器的中斷和異常、特權模式以及最主要的緩存。我將用更清楚連貫的語言將這些內(nèi)容重新串講一次,幫助大家更好地理解,當然這也是大合集的本來初衷。
下面開始。
首先是線程和進程。早期的計算機在一段時間內(nèi)只能運行一段代碼,比如計算導彈軌跡,計算完了出結果就好了。這也是計算機最本來最初級的用法。但是隨著計算機不斷發(fā)展,尤其是人民生活水平的不斷提高,計算機這樣的用法實在是有些過于枯燥了。比如我想邊用計算機聽歌的同時打下這段文字,就需要計算機能同時做兩件事,于是人們就發(fā)明了線程,而線程之間通過少量的必要的溝通可以組合形成一個進程,也就是我們通常意義上的應用程序。比如說音樂播放器中,音樂的播放是一個線程,用戶的操作界面是另外一個線程,兩個線程合起來構成了音樂播放器。當然,一個應用程序(進程)也可以只有一個線程。每個線程包括系統(tǒng)線程都被劃定了一個空間,并且高權限線程(系統(tǒng)線程)能訪問低權限線程(應用程序)的空間,低權限線程只能訪問屬于自己的空間,不然病毒線程將大行其道。所以線程的一個基本屬性需要在CPU中被明確記錄的是權限等級。
對于計算機系統(tǒng)或者CPU來說,越值得信賴的線程的權限等級是越高的。什么是越值得信賴的線程呢?計算機本身的操作系統(tǒng)肯定是值得信賴的,畢竟如果連操作系統(tǒng)都不能信賴,還有什么值得信賴?不過操作系統(tǒng)雖然值得信賴,但本身肯定多多少少存在一些Bug,不然Windows也不會天天藍屏了,但是對于CPU來講,操作系統(tǒng)即使有無心的錯誤,但肯定不會是有害的錯誤。
那么權限等級能決定什么呢?能決定這個線程能訪問哪些內(nèi)容。
話說回來,早期的那個計算導彈的程序在現(xiàn)在看來就可以算是一個線程。而具體是如何做到并行處理的呢?看過三體的同學應該都知道三體人是怎么用一顆智子封鎖地球科技的,靠的就是智子光速來回穿梭干擾在位于地球各處的高能粒子對撞機。因為智子速度太快了,所以只需要一顆就能封鎖整個地球的科技。CPU也是同理,隨著CPU性能的提升,它也可以快速來回切換并處理不同的線程,底層都是串行的,但給我們的感覺卻是并行的。
當然隨著科技的進一步發(fā)展,CPU的核心數(shù)早已從單核心變成了多核心,甚至在一些服務器里我們還能見到多CPU的主板,所以依靠多個CPU核心,現(xiàn)在也能實現(xiàn)真正意義上的并行,不過線程數(shù)總是多于CPU核心數(shù),因此線程的切換即使到了今天也是一直在用的。
那么線程是如何切換的呢?最常見的就是靠中斷了。中斷顧名思義,做到中間的時候被打斷了,有更高優(yōu)先級的人物需要處理。什么被打斷了?當前執(zhí)行的線程被打斷了。被什么打斷了?不好說,有可能是定時時鐘,有可能是你敲擊的鍵盤或你移動的鼠標,有可能是某一個線程自己發(fā)出來的“軟中斷”。為什么要有中斷?就我個人理解,中斷是人與電腦進行實時交互的窗口,沒有中斷就像你沒有鼠標和鍵盤,啥也做不了。但是中斷并不是只有人可以用,計算機本身也能用,只要是優(yōu)先級更高的任務需要介入就可以用。
所以線程是如何靠中斷切換的呢?
第一個方法,我稱之為被動切換。系統(tǒng)里的計時器會對該線程計時,時間差不多了(大概是5ms左右,看系統(tǒng)設定)就該把CPU讓位置出來給另一個線程了。具體過程是,當系統(tǒng)時鐘達到設定的時間時,向CPU發(fā)送一個中斷信號,CPU將現(xiàn)在線程的上下文作為棧保存在內(nèi)存中,暫時儲存起來,同時將pc寄存器跳轉到內(nèi)存中存有中斷服務例程的入口處,執(zhí)行中斷服務例程的程序,程序會查找得知中斷來源(這一步在高級的CPU上可以用硬件實現(xiàn)從而省略軟件查找的過程),進而跳轉到系統(tǒng)調(diào)度線程,這個線程會根據(jù)執(zhí)行情況將一個新線程調(diào)度到CPU上執(zhí)行,自己則退隱。從而實現(xiàn)線程的切換。
第二個辦法,我稱之為主動切換。當本線程沒事干了,或者說在等另一邊的結果,那么這個時候就會執(zhí)行一個軟中斷,自覺地把線程讓出來(要是不自覺就沒辦法了),流程和上面一致,只不過中斷源不再是時鐘了,而是線程本身,稱之為軟(軟件)中斷。
還有一種辦法不是靠中斷切換線程,也可以并行處理的一種技術叫做超線程技術。這個技術是Intel率先提出來的,他們聲稱增加5%的晶體管數(shù)量可以提升20%的性能。
可以理解為如果當前線程沒事干,而且這個線程“不自覺退出”,那么硬件直接介入讓另外一個線程運行。與上面靠中斷的第二種方法不同的是,這種切換是CPU硬件自發(fā)的,操控粒度可以更細(前者只能在軟件層面判斷是否會有空閑情況發(fā)生,后者則能在硬件層面監(jiān)控,硬件發(fā)生堵塞情況軟件是無法知道的),智能程度會更高,線程切換的過程消耗也會更小。如此一來,CPU可以在本該空等的地方擇機執(zhí)行另外一個線程的指令,實現(xiàn)了時間管理,縮短了兩個程序執(zhí)行的總體時間。
上文中提到的線程切換技術中除了第一種被時鐘叫停的以外,基本都是太閑了主動讓位或者被讓位的。那么為什么會出現(xiàn)線程太閑的情況呢?因為他們在等。等的可能是遠方服務器的響應,可能是用戶的輸入,可能是內(nèi)存數(shù)據(jù)的返回……前兩種無關性能,解決不了也不用解決,但是等內(nèi)存可不行,所以介于CPU核心和內(nèi)存之間的緩存出現(xiàn)了。
緩存讀寫速度要比內(nèi)存快,因為緩存采用的是SRAM存儲器內(nèi)建在CPU上,而內(nèi)存采用的是DRAM。前者可以達到很高的讀取速度但是面積占用比較大因此容量上不去,在幾M容量就止步了。后者讀取速度慢且每次讀取后都要刷新電容,但面積占用小,因此容量可以達到好幾個G甚至幾百幾千個G。
那為什么緩存能提高CPU性能呢?程序運行具有一定規(guī)律——順序和反復性,即順序執(zhí)行和循環(huán)執(zhí)行。對于順序執(zhí)行,可以采取預讀策略。即將后面的程序一并讀取至緩存中,減少內(nèi)存讀取次數(shù)(注意CPU的讀指令并沒有減少,只是內(nèi)存響應次數(shù)少了)。緩存行是緩存的基本單位,目前主流緩存行大小是64字節(jié)因為內(nèi)存一次讀操作是64字節(jié),而64位CPU對數(shù)據(jù)的讀取是8字節(jié)即64bit,因此若CPU要讀的八字節(jié)落入某一緩存行中,該緩存行的內(nèi)容將會全部從內(nèi)存中被讀取到緩存中,接下來的程序也被這次讀寫一并帶到了緩存中去。對于循環(huán)執(zhí)行,則正是緩存的強項,之前訪問過的程序都存儲在緩存中,再次讀取時,直接可以從緩存而不是從內(nèi)存中讀取,大大提高了運行效率。
緩存又有分為一級緩存、二級緩存等等。他們的速度也有所不同,從一級緩存以后讀取速度依次降低。為什么呢?雖然都是采用的SRAM存儲器,但是數(shù)據(jù)檢索需要時間,數(shù)據(jù)存儲量大的三級緩存找的時間就比數(shù)據(jù)存儲量小的一級緩存找的時間久。如果把內(nèi)存比作圖書館的書架,那么緩存就像是CPU面前的一張桌子。給你地址讓你去找CPU想要的數(shù)據(jù),如果你是在書架上找,你可以很清楚這個數(shù)據(jù)放在哪一行哪一列,如果恰好你運動速度是光速的話,那么你總能在一個確定的時間內(nèi)拿到CPU想要的數(shù)據(jù)。可是緩存就不一樣了,書就在你面前,還亂糟糟的,你需要翻閱查看地址是否對應上了。因此桌子越大,你找得也就越慢。
就沒有別的辦法了嗎?當然有。桌子亂可以整理整理嘛。比如規(guī)定一下,第一書架的書只能放在桌子上的A區(qū),第二書架放B區(qū)……以此類推。這樣一來,找的人便會方便很多,放的人也沒有什么困難。
舉個例子,假設內(nèi)存可以被劃分成四個緩存塊(即內(nèi)存大小是緩存大小的四倍),記為00,01,10,11四塊。每個緩存塊又可以劃分成四個緩存行,記為00,01,10,11四行。結合起來,最上面緩存塊的最上面的緩存行就可以寫成0000,則這個部分的數(shù)據(jù)應該存在于緩存中的第一個緩存行的位置即00位置。如果1000號緩存行需要寫入,那么就要把0000號緩存行擦除再寫入,不能存儲在緩存中別的地方即使還有空間存放。
審核編輯:劉清
-
處理器
+關注
關注
68文章
19265瀏覽量
229671 -
cpu
+關注
關注
68文章
10855瀏覽量
211605 -
中斷
+關注
關注
5文章
898瀏覽量
41474 -
計時器
+關注
關注
1文章
420瀏覽量
32690
發(fā)布評論請先 登錄
相關推薦
評論