四虎地址8848在线观看,爰的色放,一级毛片免费观看

一、gcc 內聯匯編

內聯匯編即在C中直接使用匯編語句進行編程，使程序可以在C程序中實現C語言不能完成的一些工作，例如，在下面幾種情況中必須使用內聯匯編或嵌入型匯編。

程序中使用飽和算術運算(Saturating Arithmetic)

程序需要對協處理器進行操作

在C程序中完成對程序狀態寄存器的操作

格式：

__asm____volatile__("asmcode" :output :input :changedregisters);

asm或__asm__開頭，小括號+分號，括號內容寫匯編指令。指令+ 用雙引號引上。

參數

「asm code」主要填寫匯編代碼：

"movr0,r0 " "movr1,r1 " "movr2,r2"

「output(asm->C)」用于定義輸出的參數，通常只能是變量：

:"constraint"(variable) "constraint"用于定義variable的存放位置： r表示使用任何可用的寄存器 m表示使用變量的內存地址 +可讀可寫 =只寫 &表示該輸出操作數不能使用輸入部分使用過的寄存器，只能用"+&"或"=&"的方式使用

「input(C->asm)」用于定義輸入的參數，可以是變量也可以是立即數：

:"constraint"(variable/immediate) "constraint"用于定義variable的存放位置： r表示使用任何可用的寄存器(立即數和變量都可以) m表示使用變量的內存地址 i表示使用立即數

Note:

使用__asm__和__volatile__表示編譯器將不檢查后面的內容，而是直接交給匯編器。

如果希望編譯器為你優化，__volatile__可以不加

沒有asm code也不能省略""

沒有前面的和中間的部分，不可以相應的省略:

沒有changed 部分，必須相應的省略:

最后的;不能省略，對于C語言來說這是一條語句

匯編代碼必須放在一個字符串內，且字符串中間不能直接按回車換行，可以寫成多個字符串，注意中間不能有任何符號，這樣就會將兩個字符串合并為一個

指令之間必須要換行，還可以使用使指令在匯編中保持整齊

舉例

例1：無參數，無返回值這種情況，output和input可以省略：

asm (//匯編指令 "mrsr0,cpsr " "bicr0,r0,#0x80 " "msrcpsr,r0 " );

例2：有參數，有返回值讓內聯匯編做加法運算，求a+b，結果存在c中

inta=100，b=200，c=0; asm ( "add%0,%1,%2 " :"=r"(c) :"r"(a),"r"(b) :"memory" );

%0 對應變量c%1 對應變量a%2 對應變量b

例3：有參數 2 ，有返回值

讓內聯匯編做加法運算，求a+b，結果存在sum中，把a-b的存在d中

asmvolatile ( "add%[op1],%[op2],%[op3] " "sub%[op4],%[op2],%[op3] " :[op1]"=r"(sum),[op4]"=r"(d) :[op2]"r"(a),[op3]"r"(b) :"memory" );

%0 對應變量c%1 對應變量a%2 對應變量b

三、ATPCS規則：（ARM、thumber程序調用規范）

為了使單獨編譯的C語言程序和匯編程序之間能夠相互調用,必須為子程序之間的調用規定一定的規則.ATPCS就是ARM程序和THUMB程序中子程序調用的基本規則。

基本ATPCS規定了在子程序調用時的一些基本規則，包括下面3方面的內容：

各寄存器的使用規則及其相應的名稱。

數據棧的使用規則。

參數傳遞的規則。

1. 寄存器的使用必須滿足下面的規則：

1）子程序間通過寄存器R0一R3來傳遞參數，這時，寄存器R0～R3可以記作A1-A4。被調用的子程序在返回前無需恢復寄存器R0～R3的內容。

2）在子程序中，使用寄存器R4～R11來保存局部變量．這時，寄存器 R4 ～ R11可以記作V1 ～ V8。如果在子程序中使用到了寄存器V1～V8中的某些寄存器，子程序進入時必須保存這些寄存器的值，在返回前必須恢復這些寄存器的值；對于子程序中沒有用到的寄存器則不必進行這些操作。在Thumb程序中，通常只能使用寄存器R4～R7來保存局部變量。

3）寄存器R12用作過程調用時的臨時寄存器（用于保存SP，在函數返回時使用該寄存器出棧），記作ip。在子程序間的連接代碼段中常有這種使用規則。

4）寄存器R13用作數據棧指針，記作sp。在子程序中寄存器R13不能用作其他用途。寄存器sp在進入子程序時的值和退出子程序時的值必須相等。

5）寄存器R14稱為連接寄存器，記作lr。它用于保存子程序的返回地址。如果在子程序中保存了返回地址，寄存器R14則可以用作其他用途。

6）寄存器R15是程序計數器，記作pc。它不能用作其他用途。

ATPCS下ARM寄存器的命名：

寄存器	別名	功能
R0	a1	工作寄存器
R1	a2	工作寄存器
R2	a3	工作寄存器
R3	a4	工作寄存器
R4	v1	必須保護;局部變量寄存器
R5	v2	必須保護;局部變量寄存器
R6	v3	必須保護;局部變量寄存器
R7	v4	必須保護;局部變量寄存器
R8	v5	必須保護;局部變量寄存器
R9	v6	必須保護;局部變量寄存器
R10	sl	棧限制
R11	fp	幀指針
R12	ip	指令指針
R13	sp	棧指針
R14	lr	連接寄存器

2、堆棧使用規則：

ATPCS規定堆棧為FD類型，即滿遞減堆棧。并且堆棧的操作是8字節對齊。

而對于匯編程序來說,如果目標文件中包含了外部調用,則必須滿足以下條件:

外部接口的數據棧一定是8位對齊的，也就是要保證在進入該匯編代碼后,直到該匯編程序調用外部代碼之間,數據棧的棧指針變化為偶數個字;

在匯編程序中使用PRESERVE8偽操作告訴連接器,本匯編程序是8字節對齊的.

3、參數的傳遞規則：

根據參數個數是否固定,可以將子程序分為參數個數固定的子程序和參數個數可變的子程序.這兩種子程序的參數傳遞規則是不同的.

1.參數個數可變的子程序參數傳遞規則

對于參數個數可變的子程序,當參數不超過4個時,可以使用寄存器R0~R3來進行參數傳遞,當參數超過4個時,還可以使用數據棧來傳遞參數.

在參數傳遞時,將所有參數看做是存放在連續的內存單元中的字數據。然后,依次將各名字數據傳送到寄存器R0,R1,R2,R3; 如果參數多于4個,將剩余的字數據傳送到數據棧中,入棧的順序與參數順序相反,即最后一個字數據先入棧.

按照上面的規則,一個浮點數參數可以通過寄存器傳遞,也可以通過數據棧傳遞,也可能一半通過寄存器傳遞，另一半通過數據棧傳遞。

舉例：

voidfunc(a,b,c,d,e) a--r0 b--r1 c--r2 d--r3 e--棧

2.參數個數固定的子程序參數傳遞規則

對于參數個數固定的子程序,參數傳遞與參數個數可變的子程序參數傳遞規則不同,如果系統包含浮點運算的硬件部件。

浮點參數將按照下面的規則傳遞:（1）各個浮點參數按順序處理;（2）為每個浮點參數分配FP寄存器;

分配的方法是,滿足該浮點參數需要的且編號最小的一組連續的FP寄存器.第一個整數參數通過寄存器R0~R3來傳遞,其他參數通過數據棧傳遞.

3、子程序結果返回規則

1.結果為一個32位的整數時,可以通過寄存器R0返回.

2.結果為一個64位整數時,可以通過R0和R1返回，依此類推.

3.對于位數更多的結果,需要通過調用內存來傳遞.

舉例：
使用r0 接收返回值

intfunc1(intm,intn) m--r0 n--r1 返回值給r0

「為什么有的編程規范要求自定義函數的參數不要超過4個？」答：因為參數超過4個就需要壓棧退棧，而壓棧退棧需要增加很多指令周期。對于參數比較多的情況，我們可以把數據封裝到結構體中，然后傳遞結構體變量的地址。

四、C語言和匯編相互調用

C和匯編相互調用要特別注意遵守相應的ATPCS規則。

1. C調用匯編

例1：c調用匯編文件中函數帶返回值簡化代碼如下，代碼架構可以參考《7. 從0開始學ARM-GNU偽指令、代碼編譯，lds使用》。

;.asm add: addr2,r0,r1 movr0,r2 MOVpc,lr

main.c

externintadd(inta,intb); printf("%d ",add(2,3));

a->r0,b->r1

返回值通過r0返回計算結果給c代碼

例2，用匯編實現一個strcopy函數

;.asm .globalstrcopy strcopy:;R0指向目的字符串;R1指向源字符串 LDRBR2,[R1],#1;加載字字符并更新源字符串指針地址 STRBR2,[R0],#1;存儲字符并更新目的字符串指針地址 CMPR2,#0;判斷是否為字符串結尾 BNEstrcopy;如果不是，程序跳轉到strcopy繼續循環 MOVpc,lr;程序返回//.c #include externvoidstrcopy(char*des,constchar*src); intmain(){ constchar*srcstr="yikoulinux"; chardesstr[]="test"; strcopy(desstr,srcstr); return0; }

2. 匯編調用C

//.c intfcn(inta,intb,intc,intd,inte) { returna+b+c+d+e; };.asm; .text.global_start _start: STRlr,[sp,#-4]!;保存返回地址lr ADDR1,R0,R0;計算2*i(第2個參數) ADDR2,R1,R0;計算3*i(第3個參數) ADDR3,R1,R2;計算5*i STRR3,[SP,#-4]!;第5個參數通過堆棧傳遞 ADDR3,R1,R1;計算4*i(第4個參數) BLfcn;調用C程序 ADDsp,sp,#4;從堆棧中刪除第五個參數 .end

假設程序進入f時，R0中的值為i ;

intf(inti){ returnfcn(i,2*i,3*i,4*i,5*i); }

五、內核實例

為了讓讀者有個更加深刻的理解，以內核中的例子為例：

arch/arm/kernel/setup.c

voidnotracecpu_init(void) { unsignedintcpu=smp_processor_id();－－－－獲取CPUID structstack*stk=&stacks[cpu];－－－－獲取該CPU對于的irqabt和und的stack指針 …… #ifdefCONFIG_THUMB2_KERNEL #definePLC"r"－－－－Thumb-2下，msr指令不允許使用立即數，只能使用寄存器。 #else #definePLC"I" #endif__asm__( "msrcpsr_c,%1 "－－－－讓CPU進入IRQmode "addr14,%0,%2 "－－－－r14寄存器保存stk->irq "movsp,r14 "－－－－設定IRQmode的stack為stk->irq "msrcpsr_c,%3 " "addr14,%0,%4 " "movsp,r14 "－－－－設定abtmode的stack為stk->abt "msrcpsr_c,%5 " "addr14,%0,%6 " "movsp,r14 "－－－－設定undmode的stack為stk->und "msrcpsr_c,%7"－－－回到SVCmode :－－－－上面是code，下面的output部分是空的 :"r"(stk),－－－－對應上面代碼中的%0 PLC(PSR_F_BIT|PSR_I_BIT|IRQ_MODE),－－－－對應上面代碼中的%1 "I"(offsetof(structstack,irq[0])),－－－－對應上面代碼中的%2 PLC(PSR_F_BIT|PSR_I_BIT|ABT_MODE),－－－－以此類推，下面不贅述 "I"(offsetof(structstack,abt[0])), PLC(PSR_F_BIT|PSR_I_BIT|UND_MODE), "I"(offsetof(structstack,und[0])), PLC(PSR_F_BIT|PSR_I_BIT|SVC_MODE) :"r14");－－－－上面是input操作數列表，r14是要clobberedregister列表 }

責任編輯：lq

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴