1.什么是進(jìn)程?為什么要有進(jìn)程?
進(jìn)程有一個相當(dāng)精簡的解釋:進(jìn)程是對操作系統(tǒng)上正在運(yùn)行程序的一個抽象。
這個概念確實挺抽象,仔細(xì)想想?yún)s也挺精準(zhǔn)。
我們平常使用計算機(jī),都會在同一時間做許多事,比如邊看電影,邊微信聊天,順便打開瀏覽器百度搜索一下,我們所做的這么多事情背后都是一個個正在運(yùn)行中的軟件程序;這些軟件想要運(yùn)行起來,首先在磁盤上需要有各自的程序代碼,然后將代碼加載到內(nèi)存中,CPU會去執(zhí)行這些代碼,運(yùn)行中會產(chǎn)生很多數(shù)據(jù)需要存放,也可能需要和網(wǎng)卡、顯卡、鍵盤等外部設(shè)備交互,這背后其實就涉及到程序?qū)τ嬎銠C(jī)資源的使用,存在這么多程序,我們當(dāng)然需要想辦法管理程序資源的使用。并且CPU如果只有一個,那么還需要操作系統(tǒng)調(diào)度CPU分配給各個程序使用,讓用戶感覺這些程序在同時運(yùn)行,不影響用戶體驗。
理所當(dāng)然,操作系統(tǒng)會把每個運(yùn)行中的程序封裝成獨(dú)立的實體,分配各自所需要的資源,再根據(jù)調(diào)度算法切換執(zhí)行。這個抽象程序?qū)嶓w就是進(jìn)程。
所以很多對進(jìn)程的官方解釋中都會提到:進(jìn)程是操作系統(tǒng)進(jìn)行資源分配和調(diào)度的一個基本單位。
2.什么是線程?為什么要有線程?
在早期的操作系統(tǒng)中并沒有線程的概念,進(jìn)程是擁有資源和獨(dú)立運(yùn)行的最小單位,也是程序執(zhí)行的最小單位。任務(wù)調(diào)度采用的是時間片輪轉(zhuǎn)的搶占式調(diào)度方式,而進(jìn)程是任務(wù)調(diào)度的最小單位,每個進(jìn)程有各自獨(dú)立的內(nèi)存空間,使得各個進(jìn)程之間內(nèi)存地址相互隔離。
后來,隨著計算機(jī)行業(yè)的發(fā)展,程序的功能設(shè)計越來越復(fù)雜,我們的應(yīng)用中同時發(fā)生著多種活動,其中某些活動隨著時間的推移會被阻塞,比如網(wǎng)絡(luò)請求、讀寫文件(也就是IO操作),我們自然而然地想著能不能把這些應(yīng)用程序分解成更細(xì)粒度、能 準(zhǔn)并行運(yùn)行 多個順序執(zhí)行實體,并且這些細(xì)粒度的執(zhí)行實體可以共享進(jìn)程的地址空間,也就是可以共享程序代碼、數(shù)據(jù)、內(nèi)存空間等,這樣程序設(shè)計模型會變得更加簡單。
其實很多計算機(jī)世界里的技術(shù)演變,都是模擬現(xiàn)實世界。比如我們把一個進(jìn)程當(dāng)成一個項目,當(dāng)項目任務(wù)變得復(fù)雜時,自然想著能不能將項目按照業(yè)務(wù)、產(chǎn)品、工作方向等分成一個個任務(wù)模塊,分派給不同人員各自并行完成,再按照某種方式組織起各自的任務(wù)成果,最終完成項目。
需要多線程還有一個重要的理由就是:每個進(jìn)程都有獨(dú)立的代碼和數(shù)據(jù)空間(程序上下文),程序之間的切換會有較大的開銷;線程可以看做輕量級的進(jìn)程,同一類線程共享代碼和數(shù)據(jù)空間,每個線程都有自己獨(dú)立的運(yùn)行棧和程序計數(shù)器,線程之間切換的開銷小。所以線程的創(chuàng)建、銷毀、調(diào)度性能遠(yuǎn)遠(yuǎn)優(yōu)于進(jìn)程。
在引入多線程模型后,進(jìn)程和線程在程序執(zhí)行過程中的分工就相當(dāng)明確了,進(jìn)程負(fù)責(zé)分配和管理系統(tǒng)資源,線程負(fù)責(zé)CPU調(diào)度運(yùn)算,也是CPU切換時間片的最小單位。對于任何一個進(jìn)程來講,即便我們沒有主動去創(chuàng)建線程,進(jìn)程也是默認(rèn)有一個主線程的。
3.它們在Linux內(nèi)核中實現(xiàn)方式有何不同?
在Linux 里面,無論是進(jìn)程,還是線程,到了內(nèi)核里面,我們統(tǒng)一都叫任務(wù)(Task),由一個統(tǒng)一的結(jié)構(gòu) task_struct 進(jìn)行管理,這個task_struct 數(shù)據(jù)結(jié)構(gòu)非常復(fù)雜,囊括了進(jìn)程管理生命周期中的各種信息。
在Linux操作系統(tǒng)內(nèi)核初始化時會創(chuàng)建第一個進(jìn)程,即0號創(chuàng)始進(jìn)程。隨后會初始化1號進(jìn)程(用戶進(jìn)程祖宗:/usr/lib/systemd/systemd),2號進(jìn)程(內(nèi)核進(jìn)程祖宗:[kthreadd]),其后所有的進(jìn)程線程都是在他們的基礎(chǔ)上fork出來的。
我們一般都是通過fork系統(tǒng)調(diào)用來創(chuàng)建新的進(jìn)程,fork 系統(tǒng)調(diào)用包含兩個重要的事件,一個是將 task_struct 結(jié)構(gòu)復(fù)制一份并且初始化,另一個是試圖喚醒新創(chuàng)建的子進(jìn)程。
我們說無論是進(jìn)程還是線程,在內(nèi)核里面都是task,管起來不是都一樣嗎?到底如何區(qū)分呢?其實,線程不是一個完全由內(nèi)核實現(xiàn)的機(jī)制,它是由內(nèi)核態(tài)和用戶態(tài)合作完成的。
創(chuàng)建進(jìn)程的話,調(diào)用的系統(tǒng)調(diào)用是 fork,會將五大結(jié)構(gòu) files_struct、fs_struct、sighand_struct、signal_struct、mm_struct 都復(fù)制一遍,從此父進(jìn)程和子進(jìn)程各用各的數(shù)據(jù)結(jié)構(gòu)。而創(chuàng)建線程的話,調(diào)用的是系統(tǒng)調(diào)用 clone,五大結(jié)構(gòu)僅僅是引用計數(shù)加一,也即線程共享進(jìn)程的數(shù)據(jù)結(jié)構(gòu)。
4.所以它們到底有哪些區(qū)別?
功能:進(jìn)程是操作系統(tǒng)資源分配的基本單位,而線程是任務(wù)調(diào)度和執(zhí)行的基本單位
開銷:每個進(jìn)程都有獨(dú)立的內(nèi)存空間,存放代碼和數(shù)據(jù)段等,程序之間的切換會有較大的開銷;線程可以看做輕量級的進(jìn)程,共享內(nèi)存空間,每個線程都有自己獨(dú)立的運(yùn)行棧和程序計數(shù)器,線程之間切換的開銷小。
運(yùn)行環(huán)境:在操作系統(tǒng)中能同時運(yùn)行多個進(jìn)程;而在同一個進(jìn)程(程序)中有多個線程同時執(zhí)行(通過CPU調(diào)度,在每個時間片中只有一個線程執(zhí)行)
創(chuàng)建過程:在創(chuàng)建新進(jìn)程的時候,會將父進(jìn)程的所有五大數(shù)據(jù)結(jié)構(gòu)復(fù)制新的,形成自己新的內(nèi)存空間數(shù)據(jù),而在創(chuàng)建新線程的時候,則是引用進(jìn)程的五大數(shù)據(jù)結(jié)構(gòu)數(shù)據(jù),但是線程會有自己的私有數(shù)據(jù)、棧空間。
進(jìn)程和線程其實在cpu看來都是task_struct結(jié)構(gòu)的一個封裝,執(zhí)行不同task即可,而且在cpu看來就是在執(zhí)行這些task時候遵循對應(yīng)的調(diào)度策略以及上下文資源切換定義,包括寄存器地址切換,內(nèi)核棧切換。所以對于cpu而言,進(jìn)程和線程是沒有區(qū)別的。
附:我們通常所說的上下文切換具體指什么?
操作系統(tǒng)抽象出一個進(jìn)程的概念,讓應(yīng)用程序?qū)P挠趯崿F(xiàn)自己的業(yè)務(wù)邏輯既可,對應(yīng)用程序屏蔽了CPU調(diào)度、內(nèi)存管理等硬件細(xì)節(jié),而且在有限的CPU上可以“同時”進(jìn)行許多個任務(wù)。但是它為用戶帶來方便的同時,也引入了一些額外的開銷。
在操作系統(tǒng)中,由于CPU的時間片調(diào)度策略,從一個進(jìn)程切換到另一個進(jìn)程需要保存當(dāng)前進(jìn)程的狀態(tài)并恢復(fù)另一個進(jìn)程的狀態(tài):當(dāng)前運(yùn)行任務(wù)轉(zhuǎn)為就緒(或者掛起、刪除)狀態(tài),另一個被選定的就緒任務(wù)成為當(dāng)前任務(wù)。上下文切換包括保存當(dāng)前任務(wù)的運(yùn)行環(huán)境,恢復(fù)將要運(yùn)行任務(wù)的運(yùn)行環(huán)境。
在上下文切換過程中,CPU會停止處理當(dāng)前運(yùn)行的程序,并保存當(dāng)前程序運(yùn)行的具體位置以便之后繼續(xù)運(yùn)行。從這個角度來看,上下文切換有點像我們同時閱讀幾本書,在來回切換書本的同時我們需要記住每本書當(dāng)前讀到的頁碼。
在三種情況下可能會發(fā)生上下文切換:中斷處理,多任務(wù)處理,內(nèi)核/用戶態(tài)切換。
在中斷處理中,其他程序”打斷”了當(dāng)前正在運(yùn)行的程序。當(dāng)CPU接收到中斷請求時,會在正在運(yùn)行的程序和發(fā)起中斷請求的程序之間進(jìn)行一次上下文切換。
在多任務(wù)處理中,CPU會在不同程序之間來回切換,每個程序都有相應(yīng)的處理時間片,CPU在兩個時間片的間隔中進(jìn)行上下文切換。
在Linux中進(jìn)行內(nèi)核/用戶態(tài)切換也會進(jìn)行上下文切換,進(jìn)行系統(tǒng)調(diào)用時,CPU寄存器里原來用戶態(tài)的指令位置需要先保存起來。接著,為了執(zhí)行內(nèi)核態(tài)代碼,CPU寄存器需要更新為內(nèi)核態(tài)指令的新位置。最后才是跳轉(zhuǎn)到內(nèi)核態(tài)運(yùn)行內(nèi)核任務(wù)。而系統(tǒng)調(diào)用結(jié)束后,CPU寄存器需要恢復(fù)原來保存的用戶態(tài),然后再切換到用戶空間,繼續(xù)運(yùn)行進(jìn)程,所以一次系統(tǒng)調(diào)用的過程,其實是發(fā)生了兩次CPU上下文切換。
CPU上下文切換,是保證Linux系統(tǒng)正常工作的核心功能之一,一般情況下不需要我們特別關(guān)注。
但過多的上下文切換,會把CPU時間消耗在寄存器、內(nèi)核棧以及虛擬內(nèi)存等數(shù)據(jù)的保存和恢復(fù)上,從而縮短進(jìn)程真正運(yùn)行的時間,導(dǎo)致系統(tǒng)的整體性能大幅下降。
-
cpu
+關(guān)注
關(guān)注
68文章
10854瀏覽量
211589 -
操作系統(tǒng)
+關(guān)注
關(guān)注
37文章
6801瀏覽量
123285 -
線程
+關(guān)注
關(guān)注
0文章
504瀏覽量
19675 -
進(jìn)程
+關(guān)注
關(guān)注
0文章
203瀏覽量
13960
發(fā)布評論請先 登錄
相關(guān)推薦
評論