深入探索 C/C++ 數組與指標的奧秘之八:柔性數群組成員
在講述柔性數群組成員之前,首先要介紹一下不完整類型(incomplete type)。不完整類型是這樣一種類型,它缺乏足夠的資訊例如長度去描述一個完整的對象。
6.2.5 Types
incomplete types (types that describe objects but lack information needed to determine their sizes).
C 與 C++ 關於不完整類型的語義是一樣的。
基本上沒有什麼書介紹過不完整類型,很多人初次遇到這個概念時腦袋會一片空白。事實上我們在實際的工程設計中經常使用不完整類型,只不過不知道有這麼個概念而已。前向聲明就是一種常用的不完整類型:
class base;<br />struct test;
base 和 test 只給出了聲明,沒有給出定義。不完整類型必須通過某種方式補充完整,才能使用它們進行執行個體化,否則只能用於定義指標或引用,因為此時執行個體化的是指標或引用本身,不是 base 或 test 對象。
一個未知長度的數組也屬於不完整類型:
extern int a[];
extern 不能去掉,因為數組的長度未知,不能作為定義出現。不完整類型的數組可以通過幾種方式補充完整才能使用,大括弧形式的初始化就是其中一種方式:
int a[] = { 10, 20 };
柔性數群組成員(flexible array member)也叫伸縮性數群組成員,它的出現反映了 C 程式員對精鍊代碼的極致追求。這種代碼結構產生於對動態結構體的需求。在日常的編程中,有時候需要在結構體中存放一個長度動態字串,一般的做法,是在結構體中定義一個指標成員,這個指標成員指向該字串所在的動態記憶體空間,例如:
struct test</p><p>{</p><p> int a;</p><p> double b;</p><p> char *p;</p><p>};
p 指向字串。這種方法造成字串與結構體是分離的,不利於操作,如果把字串跟結構體直接連在一起,不是更好嗎?於是,可以把代碼修改為這樣:
char a[] = “hello world”;</p><p>struct test *PntTest = ( struct test* )malloc( sizeof( struct test ) + strlen( a ) + 1 );</p><p>strcpy( PntTest + 1, a );
這樣一來,( char* )( PntTest + 1 ) 就是字串 “hello world” 的地址了。這時候p成了多餘的東西,可以去掉。但是,又產生了另外一個問題:老是使用 ( char* )( PntTest + 1 ) 不方便。如果能夠找出一種方法,既能直接引用該字串,又不佔用結構體的空間,就完美了,符合這種條件的代碼結構應該是一個非對象的符號地址,在結構體的尾部放置一個 0 長度的數組是一個絕妙的解決方案。不過,C/C++ 標準規定不能定義長度為 0 的數組,因此,有些編譯器就把0長度的數群組成員作為自己的非標準擴充,例如:
struct test</p><p>{</p><p> int a;</p><p> double b;</p><p> char c[0];</p><p>};
c 就叫柔性數群組成員,如果把 PntTest 指向的動態分配記憶體看作一個整體,c 就是一個長度可以動態變化的結構體成員,柔性一詞來源於此。c 的長度為 0,因此它不佔用 test 的空間,同時 PntTest->c 就是 “hello world” 的首地址,不需要再使用 ( char* )( PntTest + 1 ) 這麼醜陋的文法了。
鑒於這種代碼結構所產生的重要作用,C99 甚至把它收入了標準中:
6.7.2.1 Structure and union specifiers
As a special case, the last element of a structure with more than one named member may have an incomplete array type; this is called a flexible array member.
C99 使用不完整類型實現柔性數群組成員,標準形式是這樣的:
struct test</p><p>{</p><p> int a;</p><p> double b;</p><p> char c[];</p><p>};
c 同樣不佔用 test 的空間,只作為一個符號地址存在,而且必須是結構體的最後一個成員。柔性數群組成員不僅可以用於字元數組,還可以是元素為其它類型的數組,例如:
struct test</p><p>{</p><p> int a;</p><p> double b;</p><p> float c[];</p><p>};
應當盡量使用標準形式,在非 C99 的場合,可以使用指標方法。有些人使用 char a[1],這是非常不可取的,把這樣的 a 用作柔性數群組成員會發生越界行為,雖然 C/C++ 標準並沒有規定編譯器應當檢查越界,但也沒有規定不能檢查越界,為了一個小小的指標空間而犧牲移植性,是不值得的。
原文連結:http://blog.csdn.net/supermegaboy/archive/2009/11/23/4854939.aspx。