現今,完全用匯編書寫的程序是非常少的。編譯器能很好地將高級語言轉換成有效的機器代碼。因為用高級語言書寫代碼非常容易,所以高級語言變得很流行。此外,高級語言比匯編語言更容易移植!
當使用匯編語言時,我們經常將它使用在代碼中的一小部分上。有兩種使用匯編語言的方法:在C中調用匯編子程序或內嵌匯編。內嵌匯編允許程序員把匯編語句直接放入到C代碼中。這樣是非常方便的;但是,內嵌匯編同樣存在缺點。匯編語言的書寫格式必須是編譯器使用的格式。目前沒有一個編譯器支持NASM格式。不同的編譯器要求使用不同的格式。Borland和Microsoft要求使用MASM格式。DJGPP和Linux中gcc要求使用GAS格式。在PC機上,調用匯編子程序是更標準的技術。
在C中使用匯編程序通常是因為以下幾個原因:
1、需要直接訪問計算機的硬件特性,而用C語言很難或不可能做到。
2、程序執行必須盡可能地快,而且相比于編譯器,程序員手動優化的代碼更好。
最后一個原因不像它以前一樣有根據。因為這些年編譯器技術提高了,而且編譯器通常可以產生非常有效的代碼(特別是當開啟編譯器優化的時候)。調用匯編程序的缺點:可移植性和可讀性減弱了。
絕大部分的C調用約定已經確定了。但是,還需要描述一些額外的特征。
保存寄存器
首先, C假定子程序保存了下面這幾個寄存器的值:EBX,ESI,EDI, EBP,CS,DS,SS,ES。這并不意味著不能在子程序內部修改它們。相反,它表示如果子程序改變了它們的值,那么在子程序返回之前必須恢復它們的原始值。EBX,ESI和EDI的值不能被改變,因為C將這些寄存器用于寄存器變量。通常都是使用堆棧來保存這些寄存器的原始值。
函數名
大多數C編譯器都在函數名和全局或靜態變量前附加一個下劃線字符。例如,函數名f將指定為_f。因此,如果這是一個匯編程序,那么它必須標記為_f,而不是f。Linux gcc編譯器并不附加任何字符。在可執行的Linux ELF下,對于C函數f,你只需要簡單使用函數名f即可。但是,DJGPP的gcc卻附加了一個下劃線。注意,在匯編程序skeleton中(圖1.7),主程序函數名是_asm main。
傳遞參數
按照C調用約定,一個函數的參數將以一定順序壓入棧中,這個順序與它們出現在函數調用里的順序相反。考慮這條C語句:printf("x = %d\\n",x); 圖4.11展示了如何編譯這條語句(用等價的NASM格式)。圖4.12展示了執行完printf函數的開始部分后,堆棧的狀態。printf函數一個可以攜帶任意個參數的C語言庫函數。C調用約定的規則就是專門為允許這些類型的函數而規定的。因為format字符串的地址最后壓入堆棧,所以不管有多少參數傳遞到函數,
計算局部變量的地址
找到定義在data或bss段的變量的地址是非常容易的。基本上,連接程序做的就是這件事情。但是,要計算出在堆棧上的一個局部變量(或參數)的地址就不簡單了。可是,當調用子程序的時候,這種需求是非常普通的。考慮傳遞一個變量(讓我們稱它為x)的地址到一個函數(讓我們稱它為foo)的情況。如果x處在堆棧的EBP ? 8的位置,你不可以這樣使用:
mov eax, ebp - 8
為什么?因為指令MOV儲存到EAX里的值必須能由匯編器計算出來(也就是說,它最后必須是一個常量)。但是,有一條指令能做這種需求的計算。它就是LEA (即Load Effective Address,載入有效地址)。下面的代碼就能計算出x的地址并將它儲存到EAX中:
lea eax, [ebp - 8]
現在EAX中存有了x的地址,而且當調用函數foo的時候,就可以將其壓入到棧中。不要搞混了,這條指令看起來是從[EBP-8]中讀數據;然而,這并不正確。LEA指令永遠不會從內存中讀數據。它僅僅計算出一個將會被其它指令使用到的地址,然后將這個地址儲存到它的第一個操作數里。因為它并沒有實際讀內存,所以不指定內存大小(例如:dword)是必須的或說是允許的。
返回值
返回值不為空的C函數執行完后會返回一個值。C調用約定規定了這個要如何去做。返回值需通過寄存器傳遞。所有的整形類型(char,int,enum,等)通過EAX寄存器返回。如果它們小于32位,那么儲存到EAX的時候,它們將被擴展成32位。(它們如何擴展取決于是有符號類型還是無符號類型。) 64位的值通過EDX:EAX寄存器對返回。浮點數儲存在數學協處理器中的ST0寄存器中。(這個寄存器將在浮點數這一章來討論。)
其它調用約定
所有的80x86 C編譯器中都支持上面描述的標準C調用約定的規則。通常編譯器也支持其它調用約定。當與匯編語言進行接口時,知道編譯器調用你的函數時使用的是什么調用約定是非常重要的。通常,缺省時,使用的是標準的調用約定;但是,并不總是這一種情況4。使用多種約定的編譯器通常都擁有可以用來改變缺省約定的命令行開關。它們同樣提供擴展的C語法來為單個函數指定調用約定。但是,各個編譯器的這些擴展標準可以是不一樣的。
GCC編譯器允許不同的調用約定。一個函數的調用約定可以通過擴展語法attribute 明確指定。例如,要聲明一個返回值為空的函數f,它帶有一個int參數,使用標準調用約定,需使用下面的語法來聲明它的原型:
void f ( int ) _attribute_(( cdecl ));
GCC同樣支持標準call 調用約定。通過把cdecl替換成stdcall,上面的函數可以指定為使用這種約定。stdcall約定和cdecl約定的不同點是stdcall要求子程序將參數移除出棧(和Pascal調用約定一樣)。因此,stdcall調用約定只能使用在帶有固定參數的函數上(也就是說,不可以是函數printf和scanf)。
GCC同樣支持稱為regparm 的約定,這種約定告訴編譯器前3個整形參數通過寄存器傳遞給函數,而不是通過堆棧。這是許多編譯器支持的一個共同的優化模式。
Borland和Microsoft使用一樣語法來聲明調用約定。它們在C代碼中加上關鍵字_cdecl和_stdcall。這些關鍵字用來修飾函數。在原型聲明中,它們出現在函數名的前面例如,上面的函數f用Borland和Microsoft定義如下:
void _cdecl f ( int );
每種調用約定都有各自的優缺點。cdecl調用約定的主要優點是它非常簡單而且非常靈活。它可以用于任何類型的C函數和C編譯器。使用其它約定會限制子程序的可移植性。它的主要缺點是與其它約定相比它執行較慢而且使用更多的內存(因為函數的每次調用都需要用代碼將參數移除出
棧。)。
stdcall調用約定的主要優點是相比于cdecl它使用較少的內存。在CALL指令之后,不需要清理堆棧。它的主要缺點是它不能使用于可變參數的函數。
使用寄存器傳遞參數的調用約定的優點是速度非常快。主要缺點是這種約定太復雜。有些參數可能在寄存器中,而另一些可能在堆棧中。
在匯編程序中調用C函數
C與匯編接口的一個主要優點是允許匯編代碼訪問大型C庫和用戶寫的函數。例如,如果你想調用一下scanf函數來從鍵盤讀一個整形,該怎么辦?圖4.14展示了完成這件事的代碼。需要記住的非常重要的一點就是scanf函數遵循字面意義的C調用標準。這就意味著它保存了EBX,ESI和EDI寄存器的值;但是,EAX,ECX和EDX寄存器的值可能會被修改。事實上,EAX肯定會被修改,因為它將保存scanf調用的返回值。至于與C接口的其它例子,可以看用來產生asm io.obj的asm io.asm文件中的代碼。
-
PC機
+關注
關注
2文章
201瀏覽量
28573 -
匯編語言
+關注
關注
14文章
409瀏覽量
35793 -
編譯器
+關注
關注
1文章
1623瀏覽量
49108 -
nasm
+關注
關注
0文章
2瀏覽量
6867
發布評論請先 登錄
相關推薦
評論