C與C++關於不完整型別的說明
在講述柔性陣列成員之前,首先要介紹一下不完整型別(incomplete type)。不完整型別是這樣一種型別,它缺乏足夠的資訊例如長度去描述一個完整的物件。
6.2.5 Types
incomplete types (types that describe objects but lack information needed to determine their sizes).
C與C++關於不完整型別的語義是一樣的。
基本上沒有什麼書介紹過不完整型別,很多人初次遇到這個概念時腦袋會一片空白。事實上我們在實際的工程設計中經常使用不完整型別,只不過不知道有這麼個概念而已。前向宣告就是一種常用的不完整型別:
class base;
struct test;
base和test只給出了宣告,沒有給出定義。不完整型別必須通過某種方式補充完整,才能使用它們進行例項化,否則只能用於定義指標或引用,因為此時例項化的是指標或引用本身,不是base或test物件。
一個未知長度的陣列也屬於不完整型別:
extern int a[];
extern不能去掉,因為陣列的長度未知,不能作為定義出現。不完整型別的陣列可以通過幾種方式補充完整才能使用,大括號形式的初始化就是其中一種方式:
int a[] = { 10, 20 };
柔性陣列成員(flexible array member)也叫伸縮性陣列成員,它的出現反映了C程式設計師對精煉程式碼的極致追求。這種程式碼結構產生於對動態結構體的需求。在日常的程式設計中,有時候需要在結構體中存放一個長度動態的字串,一般的做法,是在結構體中定義一個指標成員,這個指標成員指向該字串所在的動態記憶體空間,例如:
struct test
{
int a;
double b;
char *p;
};
p指向字串。這種方法造成字串與結構體是分離的,不利於操作,如果把字串跟結構體直接連在一起,不是更好嗎?於是,可以把程式碼修改為這樣:
char a[] = “hello world”;
struct test *PntTest = ( struct test* )malloc( sizeof( struct test ) + strlen( a ) + 1 );
strcpy( PntTest + 1, a );
這樣一來,( char* )( PntTest + 1 )就是字串“hello world”的地址了。這時候p成了多餘的東西,可以去掉。但是,又產生了另外一個問題:老是使用( char* )( PntTest + 1 )不方便。如果能夠找出一種方法,既能直接引用該字串,又不佔用結構體的空間,就完美了,符合這種條件的程式碼結構應該是一個非物件的符號地址,在結構體的尾部放置一個0長度的陣列是一個絕妙的解決方案。不過,C/C++標準規定不能定義長度為0的陣列,因此,有些編譯器就把0長度的陣列成員作為自己的非標準擴充套件,例如:
struct test
{
int a;
double b;
char c[0];
};
c就叫柔性陣列成員,如果把PntTest指向的動態分配記憶體看作一個整體,c就是一個長度可以動態變化的結構體成員,柔性一詞來源於此。c的長度為0,因此它不佔用test的空間,同時PntTest->c就是“hello world”的首地址,不需要再使用( char* )( PntTest + 1 )這麼醜陋的語法了。
鑑於這種程式碼結構所產生的重要作用,C99甚至把它收入了標準中:
6.7.2.1 Structure and union specifiers
As a special case, the last element of a structure with more than one named member may have an incomplete array type; this is called a flexible array member.
C99使用不完整型別實現柔性陣列成員,標準形式是這樣的:
struct test
{
int a;
double b;
char c[];
};
c同樣不佔用test的空間,只作為一個符號地址存在,而且必須是結構體的最後一個成員。柔性陣列成員不僅可以用於字元陣列,還可以是元素為其它型別的陣列,例如:
struct test
{
int a;
double b;
float c[];
};
應當儘量使用標準形式,在非C99的場合,可以使用指標方法。有些人使用char a[1],這是非常不可取的,把這樣的a用作柔性陣列成員會發生越界行為,雖然C/C++標準並沒有規定編譯器應當檢查越界,但也沒有規定不能檢查越界,為了一個小小的指標空間而犧牲移植性,是不值得的。