1. 粉絲問題
自己編寫的一個協議相關代碼,位域的值解析和自己想象的有出入。
結構體的頭:
解析代碼和測試結果:
就是說通過函數hexdump()解析出的內存是十六進制是 81 83 20 3B ......
從數據幀解析出的
opcode=0x8
該粉絲不明白為什么解析出的值是0x8。
這個問題其實就是位域的問題和字節序的問題。
測試代碼
廢話不多說,直接寫個測試代碼
#include
//簡化的結構體
structiphdr{
unsignedcharfin:1;
unsignedcharrsv:3;
unsignedcharopcode:4;
unsignedcharmask:1;
unsignedcharpayload:7;
unsignedchara;
unsignedcharb;
};
main()
{
structiphdrt;
unsignedchar*s;
//清空內存,防止有亂碼
memset(&t,0,4);
//用指針指向結構體變量t
s=(unsignedchar*)&t;
//通過數組訪問的方式修改內存的值,因為hexdump解析的值是0x8183,
//所以0x81必為最低字節的內存的數據
s[0]=0x81;
s[1]=0x83;
//打印出位域成員的值
printf("fin:%d rsv:%d opcode:%d mask:%d paylod:%d
",
t.fin,t.rsv,t.opcode,t.mask,t.payload);
}
執行結果:
fin:1,rsv:0,opcode:8,mask:1paylod:65
分析:如下圖所示,紫色部分是位域成員對應的內存中的實際空間布局,地址從左到右增加第一個字節的0x81賦值后,各位域對應的二進制:
fin:1
rsv:0
opcode:1000
mask:1
paylod:1000001
如上圖多少,內存的第1個字節是0x81,第2個字節是0x83;
第一個字節0x81的最低的bit[0]對應fin,bit[3:1]對應rsv,bit[7:4]對應opcode;第二個字節0x83的最低bit[0]對應mask,bit[7:1]對應payload。
所以結果顯而易見。
2、什么是位域?
有些信息在存儲時,并不需要占用一個完整的字節, 而只需占幾個或一個二進制位。
例如在存放一個開關量時,只有0和1 兩種狀態, 用一位二進位即可。為了節省存儲空間,并使處理簡便,C語言又提供了一種數據結構,稱為“位域”或“位段”。
所謂“位域”是把一個字節中的二進位劃分為幾個不同的區域,并說明每個區域的位數。
每個域有一個域名,允許在程序中按域名進行操作。這樣就可以把幾個不同的對象用一個字節的二進制位域來表示。一、位域的定義和位域變量的說明位域定義與結構定義相仿,其形式為:
struct位域結構名
{
位域列表
};
其中位域列表的形式為:
類型說明符位域名:位域長度
如粉絲所舉的實例:
structiphdr{
unsignedcharfin:1;
unsignedcharrsv:3;
unsignedcharopcode:4;
unsignedcharmask:1;
unsignedcharpayload:7;
unsignedchara;
unsignedcharb;
};
位域變量的說明與結構變量說明的方式相同。可采用先定義后說明,同時定義說明或者直接說明這三種方式。例如:
structbs
{
inta:8;
intb:2;
intc:6;
}data;
說明data為bs變量,共占兩個字節。其中位域a占8位,位域b占2位,位域c占6位。對于位域的定義尚有以下幾點說明:
一個位域必須存儲在同一個字節中,不能跨兩個字節。
如一個字節所剩空間不夠存放另一位域時,應從下一單元起存放該位域。也可以有意使某位域從下一單元開始。例如:
structbs
{
unsigneda:4
unsigned:0/空域/
unsignedb:4/從下一單元開始存放/
unsignedc:4
};
在這個位域定義中,a占第一字節的4位,后4位填0表示不使用,b從第二字節開始,占用4位,c占用4位。
位域可以無位域名,這時它只用來作填充或調整位置。無名的位域是不能使用的。例如:
structk
{
inta:1
int:2/該2位不能使用/
intb:3
intc:2
};
從以上分析可以看出,位域在本質上就是一種結構類型, 不過其成員是按二進位分配的。
這是位域操作的表示方法,也就是說后面加上“:1”的意思是這個成員的大小占所定義類型的1 bit,“:2”占2 bit,依次類推。當然大小不能超過所定義類型包含的總bit數。
一個bytes(字節)是8個 bit(二進制位)。例如你的結構體中定義的類型是u_char,一個字節,共8個bit,最大就不能超過8。32位機下,short是2字節,共16bit,最大就不能超過16,int是4字節,共32bit,最大就不能超過32.依次類推。
位域定義比較省空間。
例如你上面的結構,定義的變量類型是u_char,是一字節類型,即8bit。
fc_subtype占了4bit,fc_type占2bit,fc_protocol_version占2bit,共8bit,正好是一個字節。
其他八個成員,各占1bit,共8bit,正好也是一個字節。
因此你的結構的大小如果用sizeof(struct frame_control)計算,就是2bytes。
3. 如何測試當前是大端還是小端?
計算機硬件有兩種儲存數據的方式:大端字節序(big endian)和小端字節序(little endian)。大端字節序:高位字節在前,低位字節在后,這是人類讀寫數值的方法。小端字節序:低位字節在前,高位字節在后。
0x1234567的大端字節序和小端字節序的寫法如下圖。
為什么會有小端字節序?
答案是,計算機電路先處理低位字節,效率比較高,因為計算都是從低位開始的。所以,計算機的內部處理都是小端字節序。
但是,人類還是習慣讀寫大端字節序。所以,除了計算機的內部處理,其他的場合幾乎都是大端字節序,比如網絡傳輸和文件儲存。
計算機處理字節序的時候,不知道什么是高位字節,什么是低位字節。它只知道按順序讀取字節,先讀第一個字節,再讀第二個字節。
如果是大端字節序,先讀到的就是高位字節,后讀到的就是低位字節。小端字節序正好相反。
理解這一點,才能理解計算機如何處理字節序。
處理器讀取外部數據的時候,必須知道數據的字節序,將其轉成正確的值。然后,就正常使用這個值,完全不用再考慮字節序。
即使是向外部設備寫入數據,也不用考慮字節序,正常寫入一個值即可。外部設備會自己處理字節序的問題。
實例
仍然用上面的例子,但是做如下修改
#include
structiphdr{
unsignedcharfin:1;
unsignedcharrsv:3;
unsignedcharopcode:4;
unsignedcharmask:1;
unsignedcharpayload:7;
};
main()
{
structiphdrt;
unsignedshort*s;
memset(&t,0,2);
s=(unsignedchar*)&t;
//注意,直接賦值0x8183,因為該常量必然和主機字節序一致,
//小端:83給低字節,
//大端:81給低字節
*s=0x8183;
printf("fin:%d rsv:%d opcode:%d mask:%d paylod:%d
",
t.fin,t.rsv,t.opcode,t.mask,t.payload);
}
執行結果:
fin:1rsv:1opcode:8mask:1paylod:64
由結果可知,收到的0x8183這個值與對應的的二進制關系:
fin:1
rsv:001
opcode:1000
mask:1
paylod:1000000
如上圖多少,內存的第1個字節是0x83,第2個字節是0x81【和前面的例子不一樣了,因為我們是直接賦值0x8183,而該常數是小字節序,所以低字節是0x83】;
可見:
低字節83給了 fin+rsv+opcode
所以,這說明了一口君的ubuntu是小端字節序。
4. 拓展例子
繼續將結構體做如下修改,當位域成員大小加一起不夠一個整字節的時候,驗證各成員在內存中的布局。
#include
structiphdr{
unsignedcharfin:1;
unsignedcharopcode:4;
unsignedchara;
unsignedcharb;
};
main()
{
structiphdrt;
unsignedchar*s;
memset(&t,0,2);
s=(unsignedshort*)&t;
t.fin=1;
t.opcode=0xf;
printf("%x
",s[0]);
}
fin:1
opcode:1111
內存中形式如下:
如果修改fin的值為0:
t.fin=0;
執行結果如下:
fin:0
opcode:1111
內存中形式如下:
5. 總結
大家遇到類似問題的時候,一定要寫一些實例去驗證,對于初學者來說,建議多參考上述實例。
審核編輯 :李倩-
二進制
+關注
關注
2文章
795瀏覽量
41718 -
代碼
+關注
關注
30文章
4816瀏覽量
68873 -
變量
+關注
關注
0文章
613瀏覽量
28439
原文標題:1. 粉絲問題
文章出處:【微信號:zhuyandz,微信公眾號:FPGA之家】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論