二進制來寫程序這么反人類的事情,的確是很裝的事情,但是它不但是一件很裝的事情,也是掌握底層知識的基礎能力之一。聽我慢慢道來。
程序設計語言有高級語言和低級語言之分,尤其是現在各種編程語言的不斷發展,掌握高級程序設計語言的人越來越多。
但是是否可以使用二進制來寫程序呢?也許最初使用打孔帶來控制機器的人可以完成,那么現在是否仍然有人可以完成呢?答案是肯定的!
計算機可以直接運行的指令是二進制的機器碼,所有的代碼在運行之前都會變成 CPU 可以識別的二進制。對于編譯型的二進制語言,其實都是可以直接使用二進制來寫的。
比如,Windows 下使用 C 語言編寫的程序編譯連接后可以生成一個 .exe 的可執行程序,生成的這個可執行程序就是一個二進制程序。那么,這個程序如何用二進制編寫呢?
先來考慮幾個問題!
首先,可執行程序中并非只有代碼,而 CPU 要執行的只有代碼。
其次,CPU 執行的代碼是二進制,但是在內存中的數據也是二進制數據,那么如何知道哪部分是代碼,哪部分是數據呢?這是操作系統在加載程序文件進入內存時,操作系統按照一定規則把不同二進制按照不同的屬性裝入了不同的內存分頁當中,并對內存設置相應的屬性。
最后,操作系統如何知道程序文件中的二進制哪部分是數據,哪部分是代碼呢?這是在程序被編譯連接時不但把代碼和代碼所需的數據編譯到了程序中,還把管理代碼的數據也放入了程序中,而這部分管理數據決定了哪部分是數據哪部分是代碼。
因此,用二進制寫代碼就需要至少掌握兩方面,一方面是了解可執行程序的管理數據,另一方面就是了解 CPU 的機器碼。
在 Windows 下的可執行程序是 PE 格式的,那么就要了解 PE 格式的數據結構,和 CPU 的機器碼;在安卓下的可執行程序中,其格式是 DEX 格式,那么就要了解 DEX 格式的數據結構,以及安卓虛擬機的字節碼(這個字節碼不是 CPU 的機器碼,DEX 的字節碼最終被虛擬機解釋成機器碼,因此手寫 DEX 文件時了解 DEX 格式和其字節碼即可),同樣的,Java 編譯的 Class 文件也和安卓相同,因為它也是基于虛擬機執行的文件。其中 PE 格式和 DEX 格式就是程序的管理數據,用于告訴操作系統或虛擬機,整個文件中代碼、數據以及其他資源在文件中的結構。
因為二進制的閱讀性比較差,因此人們使用了八進制和十六進制。四位二進制可以表示為一位十六進制,由于系統是 32 位或 64 位,那么剛好使用 8 個十六進制位表示 32 個二進制位,或者 16 個十六進制位表示 64 個二進制位。因此,在內存中查看數據時,更多的是使用十六進制,其實從本質上十六進制和二進制是沒有區別的,只是表示的方式不同。因此,真正使用二進制來寫程序時,是使用十六進制來完成的。
那么,在使用十六進制來編寫 Windows 下的可執行程序時,首先需要使用十六進制編輯器構造 PE 文件結構,PE 文件結構主要告訴操作系統,程序加載入內存后,程序的映射起始地址是多少,程序的入口地址是多少,程序中的代碼和數據分別保存在哪里,以及它們的長度是多少,映射到內存中以后其地址是多少,該可執行文件調用了哪些系統函數,這些系統函數分別在哪些動態鏈接庫中等信息。構造完 PE 文件結構以后,就可以使用機器碼來寫程序了。只要把機器代碼寫到 PE 文件結構中標識程序入口的位置處就行了。當然了,機器碼寫程序是比較困難的,但是作為學習底層基礎知識來說,寫一個簡單的程序還是可以的,比如寫一個彈出對話框的“hello world”這樣的程序。用機器碼寫這樣的程序,也無需了解太多的知識,有一份 Opcode 的手冊就可以了。
這就是如何用十六進制編輯器來完成一個可執行程序的過程,關于 PE 文件格式,可以參考 MSDN 或網上的文章,對于學習機器碼相關的知識可以查看 Intel 的指令手冊。學習這些知識對于軟件破解、病毒分析、加密解密、內核驅動開發等是相應知識的基礎。
-
cpu
+關注
關注
68文章
10873瀏覽量
212106 -
二進制
+關注
關注
2文章
795瀏覽量
41680 -
WINDOWS
+關注
關注
4文章
3551瀏覽量
88841
發布評論請先 登錄
相關推薦
評論