ARM處理器使用協(xié)處理器15(CP15)的寄存器來控制cache、TCM和存儲(chǔ)器管理。CP15的寄存器只能被MRC和MCR(Move to Coprocessor from ARM Register )指令訪問,包含16個(gè)32位的寄存器,其編號(hào)為0~15。本篇重點(diǎn)講解其中的 C7,C2,C13三個(gè)寄存器。
上來看段匯編,讀懂內(nèi)核源碼不會(huì)點(diǎn)匯編是不行的 , 但不用發(fā)怵,沒那么恐怖,由淺入深, 內(nèi)核其實(shí)挺好玩的。見于 arm.h,里面全是這些玩意。
#define DSB __asm__ volatile("dsb" ::: "memory") #define ISB __asm__ volatile("isb" ::: "memory") #define DMB __asm__ volatile("dmb" ::: "memory") STATIC INLINE VOID OsArmWriteBpiallis(UINT32 val) { __asm__ volatile("mcr p15, 0, %0, c7,c1,6" ::"r"(val)); __asm__ volatile("isb" ::: "memory"); }
指 令 | 說 明 | 語法格式 |
mcr | 將ARM處理器的寄存器中的數(shù)據(jù)寫到CP15中的寄存器中 |
mcr{ |
mrc | 將CP15中的寄存器中的數(shù)據(jù)讀到ARM處理器的寄存器中 |
mcr{ |
cond:為指令執(zhí)行的條件碼。當(dāng)cond忽略時(shí)指令為無條件執(zhí)行。
Opcode_1:協(xié)處理器的特定操作碼. 對(duì)于CP15寄存器來說,opcode1=0
Rd:作為源寄存器的ARM寄存器,其值將被傳送到協(xié)處理器寄存器中,或者將協(xié)處理器寄存器的值傳送到該寄存器里面 ,通常為R0
CRn:作為目標(biāo)寄存器的協(xié)處理器寄存器,其編號(hào)是C~C15。
CRm:協(xié)處理器中附加的目標(biāo)寄存器或源操作數(shù)寄存器。如果不需要設(shè)置附加信息,將CRm設(shè)置為c0,否則結(jié)果未知
Opcode_2:可選的協(xié)處理器特定操作碼。(用來區(qū)分同一個(gè)編號(hào)的不同物理寄存器,當(dāng)不需要提供附加信息時(shí),指定為0
這句匯編的指令字面意思是: 將ARM寄存器R0的數(shù)據(jù)寫到CP15中編號(hào)為7的寄存器中,值由外面?zhèn)鬟M(jìn)來。
例如 OsArmWriteBpiallis(0)做了4個(gè)動(dòng)作
1.把0值寫入R0寄存器,注意這個(gè)寄存器是ARM即CPU的寄存器,::"r"(val)意思代表向GCC編譯器聲明,會(huì)修改R0寄存器的值,改之前提前打好招呼,都是紳士文明人。其實(shí)編譯器的功能是非常強(qiáng)大的,不僅僅是大家普遍認(rèn)為的只是編譯代碼的工具而已。
2.volatile的意思還是告訴編譯器,不要去優(yōu)化這段代碼,原封不動(dòng)的生成目標(biāo)指令。
3."isb" ::: "memory" 還是告訴編譯器內(nèi)存的內(nèi)容可能被更改了,需要無效所有Cache,并訪問實(shí)際的內(nèi)容,而不是Cache!
4.再把R0的值寫入到C7中,C7是CP15協(xié)處理器的寄存器。C7寄存器是負(fù)責(zé)什么的?對(duì)照下面的表。
CP15有哪些寄存器
寄存器編號(hào) | 基本作用 | 在MMU中的作用 | 在PU中的作用 |
0 | ID編碼(只讀) | ID編碼和cache類型 | |
1 | 控制位(可讀寫) | 各種控制位 | |
2 | 存儲(chǔ)保護(hù)和控制 | 地址轉(zhuǎn)換表基地址 | Cachability的控制位 |
3 | 存儲(chǔ)保護(hù)和控制 | 域訪問控制位 | Bufferablity控制位 |
4 | 存儲(chǔ)保護(hù)和控制 | 保留 | 保留 |
5 | 存儲(chǔ)保護(hù)和控制 | 內(nèi)存失效狀態(tài) | 訪問權(quán)限控制位 |
6 | 存儲(chǔ)保護(hù)和控制 | 內(nèi)存失效地址 | 保護(hù)區(qū)域控制 |
7 | 高速緩存和寫緩存 | 高速緩存和寫緩存控制 | |
8 | 存儲(chǔ)保護(hù)和控制 | TLB控制 | 保留 |
9 | 高速緩存和寫緩存 | 高速緩存鎖定 | |
10 | 存儲(chǔ)保護(hù)和控制 | TLB鎖定 | 保留 |
11 | 保留 | ||
12 | 保留 | ||
13 | 進(jìn)程標(biāo)識(shí)符 | 進(jìn)程標(biāo)識(shí)符 | |
14 | 保留 | ||
15 | 因不同設(shè)計(jì)而異 | 因不同設(shè)計(jì)而異 | 因不同設(shè)計(jì)而異 |
這句話真正的意思是:關(guān)閉高速緩存和寫緩存控制!,其他部分寄存器下面會(huì)講,先有個(gè)大概印象。
mmu從哪里獲取 page table 的信息?答案是: TTB
TTB寄存器(Translation table base)
參考上表可知TTB寄存器是CP15協(xié)處理器的C2寄存器,存頁表的基地址,即一級(jí)映射描述符表的基地址。圍繞著TTB鴻蒙提供了以下讀取函數(shù)。簡單說就是內(nèi)核從外面不斷的修改和讀取寄存器值,而MMU只會(huì)直接通過硬件讀取這個(gè)寄存器的值,以達(dá)到MMU獲取不一樣的頁表進(jìn)行進(jìn)程虛擬地址和物理地址的轉(zhuǎn)換。還記得嗎?每個(gè)進(jìn)程的頁表都是獨(dú)立的!
那么什么情況下會(huì)修改里面的值呢?換頁表意味著mmu在進(jìn)行上下文的切換!還是直接看代碼吧。
mmu上下文
只被這一個(gè)函數(shù)調(diào)用。毫無疑問LOS_ArchMmuContextSwitch是關(guān)鍵函數(shù)。
typedef struct ArchMmu { LosMux mtx; /**< arch mmu page table entry modification mutex lock */ VADDR_T *virtTtb; /**< translation table base virtual addr */ PADDR_T physTtb; /**< translation table base phys addr */ UINT32 asid; /**< TLB asid */ LOS_DL_LIST ptList; /**< page table vm page list */ } LosArchMmu; // mmu 上下文切換 VOID LOS_ArchMmuContextSwitch(LosArchMmu *archMmu) { UINT32 ttbr; UINT32 ttbcr = OsArmReadTtbcr();//讀取TTB寄存器的狀態(tài)值 if (archMmu) { ttbr = MMU_TTBRx_FLAGS | (archMmu->physTtb);//進(jìn)程TTB物理地址值 /* enable TTBR0 */ ttbcr &= ~MMU_DESCRIPTOR_TTBCR_PD0;//使能TTBR0 } else { ttbr = 0; /* disable TTBR0 */ ttbcr |= MMU_DESCRIPTOR_TTBCR_PD0; } /* from armv7a arm B3.10.4, we should do synchronization changes of ASID and TTBR. */ OsArmWriteContextidr(LOS_GetKVmSpace()->archMmu.asid);//這里先把a(bǔ)sid切到內(nèi)核空間的ID ISB; OsArmWriteTtbr0(ttbr);//通過r0寄存器將進(jìn)程頁面基址寫入TTB ISB; OsArmWriteTtbcr(ttbcr);//寫入TTB狀態(tài)位 ISB; if (archMmu) { OsArmWriteContextidr(archMmu->asid);//通過R0寄存器寫入進(jìn)程標(biāo)識(shí)符至C13寄存器 ISB; } } // c13 asid(Adress Space ID)進(jìn)程標(biāo)識(shí)符 STATIC INLINE VOID OsArmWriteContextidr(UINT32 val) { __asm__ volatile("mcr p15, 0, %0, c13,c0,1" ::"r"(val)); __asm__ volatile("isb" ::: "memory"); }
再看下那些地方會(huì)調(diào)用LOS_ArchMmuContextSwitch,下圖一目了然。
有四個(gè)地方會(huì)切換mmu上下文
第一:通過調(diào)度算法,被選中的進(jìn)程的空間改變了,自然映射頁表就跟著變了,需要切換mmu上下文,還是直接看代碼。代碼不是很多,就都貼出來了,都加了注釋,不記得調(diào)度算法的可去系列篇中看鴻蒙內(nèi)核源碼分析(調(diào)度機(jī)制篇),里面有詳細(xì)的闡述。
//調(diào)度算法-進(jìn)程切換 STATIC VOID OsSchedSwitchProcess(LosProcessCB *runProcess, LosProcessCB *newProcess) { if (runProcess == newProcess) { return; } #if (LOSCFG_KERNEL_SMP == YES) runProcess->processStatus = OS_PROCESS_RUNTASK_COUNT_DEC(runProcess->processStatus); newProcess->processStatus = OS_PROCESS_RUNTASK_COUNT_ADD(newProcess->processStatus); LOS_ASSERT(!(OS_PROCESS_GET_RUNTASK_COUNT(newProcess->processStatus) > LOSCFG_KERNEL_CORE_NUM)); if (OS_PROCESS_GET_RUNTASK_COUNT(runProcess->processStatus) == 0) {//獲取當(dāng)前進(jìn)程的任務(wù)數(shù)量 #endif runProcess->processStatus &= ~OS_PROCESS_STATUS_RUNNING; if ((runProcess->threadNumber > 1) && !(runProcess->processStatus & OS_PROCESS_STATUS_READY)) { runProcess->processStatus |= OS_PROCESS_STATUS_PEND; } #if (LOSCFG_KERNEL_SMP == YES) } #endif LOS_ASSERT(!(newProcess->processStatus & OS_PROCESS_STATUS_PEND));//斷言進(jìn)程不是阻塞狀態(tài) newProcess->processStatus |= OS_PROCESS_STATUS_RUNNING;//設(shè)置進(jìn)程狀態(tài)為運(yùn)行狀態(tài) if (OsProcessIsUserMode(newProcess)) {//用戶模式下切換進(jìn)程mmu上下文 LOS_ArchMmuContextSwitch(&newProcess->vmSpace->archMmu);//新進(jìn)程->虛擬空間中的->Mmu部分入?yún)? } #ifdef LOSCFG_KERNEL_CPUP OsProcessCycleEndStart(newProcess->processID, OS_PROCESS_GET_RUNTASK_COUNT(runProcess->processStatus) + 1); #endif /* LOSCFG_KERNEL_CPUP */ OsCurrProcessSet(newProcess);//將進(jìn)程置為 g_runProcess if ((newProcess->timeSlice == 0) && (newProcess->policy == LOS_SCHED_RR)) {//為用完時(shí)間片或初始進(jìn)程分配時(shí)間片 newProcess->timeSlice = OS_PROCESS_SCHED_RR_INTERVAL;//重新分配時(shí)間片,默認(rèn) 20ms } }
這里再啰嗦一句,系列篇中已經(jīng)說了兩個(gè)上下文切換了,一個(gè)是這里的因進(jìn)程切換引起的mmu上下文切換,還一個(gè)是因task切換引起的CPU的上下文切換,還能想起來嗎?
第二:是加載ELF文件的時(shí)候會(huì)切換mmu,一個(gè)嶄新的進(jìn)程誕生了,具體將在 鴻蒙內(nèi)核源碼分析(啟動(dòng)加載篇) 會(huì)細(xì)講,敬請(qǐng)關(guān)注系列篇?jiǎng)討B(tài)。
其余是虛擬空間回收和刷新空間的時(shí)候,這個(gè)就自己看代碼去吧。
mmu是如何快速的通過虛擬地址找到物理地址的呢?答案是:TLB,注意上面還有個(gè)TTB,一個(gè)是寄存器, 一個(gè)是cache,別搞混了。
TLB(translation lookaside buffer)
TLB是硬件上的一個(gè)cache,因?yàn)轫摫硪话愣己艽螅⑶掖娣旁趦?nèi)存中,所以處理器引入MMU后,讀取指令、數(shù)據(jù)需要訪問兩次內(nèi)存:首先通過查詢頁表得到物理地址,然后訪問該物理地址讀取指令、數(shù)據(jù)。為了減少因?yàn)镸MU導(dǎo)致的處理器性能下降,引入了TLB,可翻譯為“地址轉(zhuǎn)換后援緩沖器”,也可簡稱為“快表”。簡單地說,TLB就是頁表的Cache,其中存儲(chǔ)了當(dāng)前最可能被訪問到的頁表項(xiàng),其內(nèi)容是部分頁表項(xiàng)的一個(gè)副本。只有在TLB無法完成地址翻譯任務(wù)時(shí),才會(huì)到內(nèi)存中查詢頁表,這樣就減少了頁表查詢導(dǎo)致的處理器性能下降。詳細(xì)看
照著圖說吧,步驟是這樣的。
1.圖中的page table的基地址就是上面TTB寄存器值,整個(gè)page table非常大,有多大接下來會(huì)講,所以只能存在內(nèi)存里,TTB中只是存一個(gè)開始位置而已。
2. 虛擬地址是程序的地址邏輯地址,也就是喂給CPU的地址,必須經(jīng)過MMU的轉(zhuǎn)換后變成物理內(nèi)存才能取到真正的指令和數(shù)據(jù)。
3.TLB是page table的迷你版,MMU先從TLB里找物理頁,找不到了再從page table中找,從page table中找到后會(huì)放入TLB中,注意這一步非常非常的關(guān)鍵。因?yàn)閜age table是屬于進(jìn)程的會(huì)有很多個(gè),而TLB只有一個(gè),不放入就會(huì)出現(xiàn)多個(gè)進(jìn)程的page table都映射到了同一個(gè)物理頁框而不自知。一個(gè)物理頁同時(shí)只能被一個(gè)page table所映射。但除了TLB的唯一性外,要做到不錯(cuò)亂還需要了一個(gè)東西,就是進(jìn)程在映射層面的唯一標(biāo)識(shí)符 -asid。
asid寄存器
asid(Adress Space ID) 進(jìn)程標(biāo)識(shí)符,屬于CP15協(xié)處理器的C13號(hào)寄存器,ASID可用來唯一標(biāo)識(shí)進(jìn)程,并為進(jìn)程提供地址空間保護(hù)。當(dāng)TLB試圖解析虛擬頁號(hào)時(shí),它確保當(dāng)前運(yùn)行進(jìn)程的ASID與虛擬頁相關(guān)的ASID相匹配。如果不匹配,那么就作為TLB失效。除了提供地址空間保護(hù)外,ASID允許TLB同時(shí)包含多個(gè)進(jìn)程的條目。如果TLB不支持獨(dú)立的ASID,每次選擇一個(gè)頁表時(shí)(例如,上下文切換時(shí)),TLB就必須被沖刷(flushed)或刪除,以確保下一個(gè)進(jìn)程不會(huì)使用錯(cuò)誤的地址轉(zhuǎn)換。
TLB頁表中有一個(gè)bit來指明當(dāng)前的entry是global(nG=0,所有process都可以訪問)還是non-global(nG=1,only本process允許訪問)。如果是global類型,則TLB中不會(huì)tag ASID;如果是non-global類型,則TLB會(huì)tag上ASID,且MMU在TLB中查詢時(shí)需要判斷這個(gè)ASID和當(dāng)前進(jìn)程的ASID是否一致,只有一致才證明這條entry當(dāng)前process有權(quán)限訪問。
看到了嗎?如果每次mmu上下文切換時(shí),把TLB全部刷新已保證TLB中全是新進(jìn)程的映射表,固然是可以,但效率太低了!!!進(jìn)程的切換其實(shí)是秒級(jí)亞秒級(jí)的,地址的虛實(shí)轉(zhuǎn)換是何等的頻繁啊,怎么會(huì)這么現(xiàn)實(shí)呢,真實(shí)的情況是TLB中有很多很多其他進(jìn)程占用的物理內(nèi)存的記錄還在,當(dāng)然他們對(duì)物理內(nèi)存的使用權(quán)也還在。所以當(dāng)應(yīng)用程序 new了10M內(nèi)存以為是屬于自己的時(shí)候,其實(shí)在內(nèi)核層面根本就不屬于你,還是別人在用,只有你用了1M的那一瞬間真正1M物理內(nèi)存才屬于你,而且當(dāng)你的進(jìn)程被其他進(jìn)程切換后,很大可能你用的那1M也已經(jīng)不在物理內(nèi)存中了,已經(jīng)被置換到硬盤上了。明白了嗎?只關(guān)注應(yīng)用開發(fā)的同學(xué)當(dāng)然可以說這關(guān)我鳥事,給我的感覺有就行了,但想熟悉內(nèi)核的同學(xué)就必須要明白,這是每分每秒都在發(fā)生的事情。
最后一個(gè)函數(shù)留給大家,asid是如何分配的?
/* allocate and free asid */ status_t OsAllocAsid(UINT32 *asid) { UINT32 flags; LOS_SpinLockSave(&g_cpuAsidLock, &flags); UINT32 firstZeroBit = LOS_BitmapFfz(g_asidPool, 1UL << MMU_ARM_ASID_BITS); if (firstZeroBit >= 0 && firstZeroBit < (1UL << MMU_ARM_ASID_BITS)) { LOS_BitmapSetNBits(g_asidPool, firstZeroBit, 1); *asid = firstZeroBit; LOS_SpinUnlockRestore(&g_cpuAsidLock, flags); return LOS_OK; } LOS_SpinUnlockRestore(&g_cpuAsidLock, flags); return firstZeroBit; }
編輯:hfy
-
ARM
+關(guān)注
關(guān)注
134文章
9104瀏覽量
367794 -
寄存器
+關(guān)注
關(guān)注
31文章
5355瀏覽量
120517 -
存儲(chǔ)器
+關(guān)注
關(guān)注
38文章
7494瀏覽量
163916 -
協(xié)處理器
+關(guān)注
關(guān)注
0文章
75瀏覽量
18186 -
鴻蒙系統(tǒng)
+關(guān)注
關(guān)注
183文章
2636瀏覽量
66393
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論