C語言位域和位段
有些資訊在儲存時,並不需要佔用一個完整的位元組, 而只需佔幾個或一個二進位制位。例如在存放一個開關量時,只有0和1 兩種狀態, 用一位二進位即可。為了節省儲存空間,並使處理簡便,C語言又提供了一種資料結構,稱為“位域”或“位段”。所謂“位域”是把一個位元組中的二進位劃分為幾個不同的區域, 並說明每個區域的位數。每個域有一個域名,允許在程式中按域名進行操作。 這樣就可以把幾個不同的物件用一個位元組的二進位制位域來表示。
一、位域的定義和位域變數的說明位域定義與結構定義相仿,其形式為:
struct 位域結構名 { 位域列表 };
其中位域列表的形式為:
型別說明符 位域名:位域長度
位域變數的說明與結構變數說明的方式相同。 可採用先定義後說明,同時定義說明或者直接說明這三種方式。例如:
struct bs { int a:8; int b:2; int c:6; }data;
說明data為bs變數,共佔兩個位元組。其中位域a佔8位,位域b佔2位,位域c佔6位。對於位域的定義尚有以下幾點說明:
1. 一個位域必須儲存在同一個位元組中,不能跨兩個位元組。如一個位元組所剩空間不夠存放另一位域時,應從下一單元起存放該位域。也可以有意使某位域從下一單元開始。例如:
struct bs { unsigned a:4 unsigned b:5 /*從下一單元開始存放*/ unsigned c:4 }
2. 由於位域不允許跨兩個位元組,因此位域的長度不能大於一個位元組的長度。
3. 位域可以無位域名,這時它只用來作填充或調整位置。無名的位域是不能使用的。例如:
struct k { int a:1 int :2 /*無位域名,該2位不能使用*/ int b:3 int c:2 };
二、位域的使用
下面例子是參加一個公司(白領科技-青島)的筆試遇到的,當時做錯了,為了怕忘了,趕緊寫下來。
1 #include <iostream> 2 #include <memory.h> 3using namespace std; 4 struct A 5 { 6 int a:5; 7 int b:3; 8 }; 9 int main(void) 10 { 11 char str[100] = "0134324324afsadfsdlfjlsdjfl"; 12 struct A d; 13 memcpy(&d, str, sizeof(A)); 14 cout << d.a << endl; 15 cout << d.b << endl; 16 return 0; 17 }
在32位x86機器上輸出:
?
$ ./langxun.exe
-16
1
|
解析:在預設情況下,為了方便對結構體內元素的訪問和管理,當結構體內的元素長度都小於處理器的位數的時候,便以結構體裡面最長的元素為對其單位,即結構體的長度一定是最長的資料元素的整數倍;如果有結構體記憶體長度大於處理器位數的元素,那麼就以處理器的位數為對齊單元。由於是32位處理器,而且結構體中a和b元素型別均為int(也是4個位元組),所以結構體的A佔用記憶體為4個位元組。
上例程式中定義了位域結構A,兩個個位域為a(佔用5位),b(佔用3位),所以a和b總共佔用了結構A一個位元組(低位的一個位元組)。
當程式執行到14行時,d記憶體分配情況:
高位 00110100 00110011 00110001 00110000 低位 '4' '3' '1' '0' 其中d.a和d.b佔用d低位一個位元組(00110000),d.a : 10000, d.b : 001
d.a記憶體中二進位制表示為10000,由於d.a為有符號的整型變數,輸出時要對符號位進行擴充套件,所以結果為-16(二進位制為11111111111111111111111111110000)
d.b記憶體中二進位制表示為001,由於d.b為有符號的整型變數,輸出時要對符號位進行擴充套件,所以結果為1(二進位制為00000000000000000000000000000001)
三、位域的對齊
如果結構體中含有位域(bit-field),那麼VC中準則是:
1) 如果相鄰位域欄位的型別相同,且其位寬之和小於型別的sizeof大小,則後面的欄位將緊鄰前一個欄位儲存,直到不能容納為止;
2) 如果相鄰位域欄位的型別相同,但其位寬之和大於型別的sizeof大小,則後面的欄位將從新的儲存單元開始,其偏移量為其型別大小的整數倍;
3) 如果相鄰的位域欄位的型別不同,則各編譯器的具體實現有差異,VC6採取不壓縮方式(不同位域欄位存放在不同的位域型別位元組中),Dev-C++和GCC都採取壓縮方式;
系統會先為結構體成員按照對齊方式分配空間和填塞(padding),然後對變數進行位域操作。