標籤:使用 ar 資料 sp 問題 c amp 工作 r
一、位域
有些資訊在儲存時,並不需要佔用一個完整的位元組, 而只需占幾個或一個二進位位。例如在存放一個開關量時,只有0和1 兩種狀態, 用一位二進位即可。為了節省儲存空間,並使處理簡便,C語言又提供了一種資料結構,稱為“位域”或“位段”。所謂“位域”是把一個位元組中的二進位劃分為幾個不同的地區,並說明每個地區的位元。每個域有一個網域名稱,允許在程式中按網域名稱進行操作。這樣就可以把幾個不同的對象用一個位元組的二進位位域來表示。一、位域的定義和位域變數的說明位域定義與結構定義相仿,其形式為:
struct 位域結構名
{ 位域列表 };
其中位域列表的形式為: 類型說明符 位網域名稱:位域長度
例如:
struct bs
{
int a:8;
int b:2;
int c:6;
};
位域變數的說明與結構變數說明的方式相同。 可採用先定義後說明,同時定義說明或者直接說明這三種方式。例如:
struct bs
{
int a:8;
int b:2;
int c:6;
}data;
說明data為bs變數,共佔兩個位元組。其中位域a佔8位,位域b佔2位,位域c佔6位。對於位域的定義尚有以下幾點說明:
1. 一個位域必須儲存在同一個位元組中,不能跨兩個位元組。如一個位元組所剩空間不夠存放另一位域時,應從下一單元起存放該位域。也可以有意使某位域從下一單元開始。例如:
struct bs
{
unsigned a:4
unsigned :0 /*空域*/
unsigned b:4 /*從下一單元開始存放*/
unsigned c:4
}
在這個位域定義中,a占第一位元組的4位,後4位填0表示不使用,b從第二位元組開始,佔用4位,c佔用4位。
2. 由於位域不允許跨兩個位元組,因此位域的長度不能大於一個位元組的長度,也就是說不能超過8位二進位。
3. 位域可以無位網域名稱,這時它只用來作填充或調整位置。無名的位域是不能使用的。例如:
struct k
{
int a:1
int :2 /*該2位不能使用*/
int b:3
int c:2
};
從以上分析可以看出,位域在本質上就是一種結構類型, 不過其成員是按二進位分配的。
二、位域的使用
位域的使用和結構成員的使用相同,其一般形式為: 位域變數名·位網域名稱 位域允許用各種格式輸出。
main(){
struct bs
{
unsigned a:1;
unsigned b:3;
unsigned c:4;
} bit,*pbit;
bit.a=1;
bit.b=7;
bit.c=15;
printf("%d,%d,%d\n",bit.a,bit.b,bit.c);
pbit=&bit;
pbit->a=0;
pbit->b&=3;
pbit->c|=1;
printf("%d,%d,%d\n",pbit->a,pbit->b,pbit->c);
}
上常式序中定義了位域結構bs,三個位域為a,b,c。說明了bs類型的變數bit和指向bs類型的指標變數pbit。這表示位域也是可以使用指標的。
程式的9、10、11三行分別給三個位域賦值。( 應注意賦值不能超過該位域的允許範圍)程式第12行以整型量格式輸出三個域的內容。第13行把位域變數bit的地址送給指標變數pbit。第14行用指標方式給位域a重新賦值,賦為0。第15行使用了複合的位元運算符"&=", 該行相當於: pbit->b=pbit->b&3位域b中原有值為7,與3作按位與運算的結果為3(111&011=011,十進位值為 3)。同樣,程式第16行中使用了複合位元運算"|=", 相當於: pbit->c=pbit->c|1其結果為15。程式第17行用指標方式輸出了這三個域的值。
------------------------------------------------------------------------------------------------------------------------------------------------------
這也是在ChinaUnix上看了幾篇關於C語言‘位域(Bit Fields)‘的文章之後,才想寫下這篇文章的。其實在平時的工作中很少使用到‘位域‘,我是搞伺服器端程式設計的,大容量的記憶體可以讓我毫不猶豫的任意‘揮霍‘^_^。想必搞嵌入式編程的朋友們對位域的使用應該不陌生吧。這裡我也僅僅是憑著對C語言鑽研的興趣來學習一下‘位域‘的相關知識的,可能有些說法沒有實踐,缺乏說服力。
具體也不是很清楚當年C語言的創造者為什麼要加入位域這一文法支援,那是太遙遠的事情了,我們不需要再回顧了,既然大師們為我們創造了它,我們使用便是了。
毋庸置疑,位域的引入給使用者的最大的好處莫過於可以有效利用‘昂貴‘的記憶體和操作bit的能力了。而且這種操作bit位的能力很是方便,利用結構體網域名稱即可對這些bit進行操作。例如:
struct foo {
int a : 1;
int b : 2;
short c : 1;
};
struct foo aFoo;
aFoo.a = 1;
aFoo.b = 3;
aFoo.c = 0;
通過結構體執行個體.網域名稱即可修改某些bit得值,這些都是編譯器的‘甜頭‘。當然我們也可以自己通過一些‘掩碼‘和移位操作來修改這些bit,當然如果不是十分需要,我們是不需要這麼做的。
位域還提供一種叫‘匿名‘位域的文法,它常用來‘填缺補漏‘,由於是‘匿名‘,所以你不能像上面那樣去訪問它。如:
struct foo1 {
int a : 1;
int : 2;
short c : 1;
};
在foo1的成員a和c之間有一個2 bits的匿名位域。
在foo結構體的定義中,成員a雖然類型為int,但是它僅僅佔據著4個位元組中的一個bit的空間;類似b佔據2個bit空間,但是b到底是佔據第一個int的2個bit空間呢還是第二個int的2個bit空間呢?這裡實際上也涉及到如何對齊帶有‘位域‘的結構體這樣一個問題。我們來分析一下。
我們再來看看下面兩個結構體定義:
struct foo2 {
char a : 2;
char b : 3;
char c : 1;
};
struct foo3 {
char a : 2;
char b : 3;
char c : 7;
};
我們來列印一下這兩個結構體的大小,我們得到的結果是:
sizeof(struct foo2) = 1
sizeof(struct foo3) = 2
顯然都不是我們期望的,如果按照正常的記憶體對齊規則,這兩個結構體大小均應該為3才對,那麼問題出在哪了呢?首先通過這種現象我們可以肯定的是:帶有‘位域‘的結構體並不是按照每個域對齊的,而是將一些位域成員‘捆綁‘在一起做對齊的。以foo2為例,這個結構體中所有的成員都是char型的,而且三個位域佔用的總空間為6 bit < 8 bit(1 byte),這時編譯器會將這三個成員‘捆綁‘在一起做對齊,並且以最小空間作代價,這就是為什麼我們得到sizeof(struct foo2) = 1這樣的結果的原因了。再看看foo3這個結構體,同foo2一樣,三個成員類型也都是char型,但是三個成員位域所佔空間之和為9 bit > 8 bit(1 byte),這裡位域是不能跨越兩個成員基本類型空間的,這時編譯器將a和b兩個成員‘捆綁‘按照char做對齊,而c單獨拿出來以char類型做對齊,這樣實際上在b和c之間出現了空隙,但這也是最節省空間的方法了。我們再看一種結構體定義:
struct foo4 {
char a : 2;
char b : 3;
int c : 1;
};
在foo4中雖然三個位域所佔用空間之和為6 bit < 8 bit(1 byte),但是由於char和int的對齊係數是不同的,是不能捆綁在一起,那是不是a、b捆綁在一起按照char對齊,c單獨按照int對齊呢?我們列印一下sizeof(struct foo4)發現結果為4,也就是說編譯器把a、b、c一起捆綁起來並以int做對齊了。
通過上面的例子我們發現很難總結出很規律性的東西,但是帶有‘位域‘的結構體的對齊有條原則可以遵循,那就是:"盡量減少結構體的佔用空間"。當然顯式的使用記憶體對齊的機會也並不多。
[轉] C中的位域