C語言中結構體賦值的討論
今天幫師姐調一個程式的BUG,師姐的程式中有個結構體直接賦值的語句,在我印象中結構體好像是不能直接賦值的,正如陣列不能直接賦值那樣,我懷疑這個地方有問題,但最後證明並不是這個問題。那麼就總結一下C語言中結構體賦值的問題吧:
結構體直接賦值的實現
下面是一個例項:
#include <stdio.h> struct Foo { char a; int b; double c; }foo1, foo2; //define two structs with three different fields void struct_assign(void) { foo2 = foo1; //structure directly assignment } int main() { foo1.a = 'a'; foo1.b = 1; foo1.c = 3.14; struct_assign(); printf("%c %d %lf\n", foo2.a, foo2.b, foo2.c); return 0; }
我在Ubuntu 13.04下使用gcc 4.7.3 編譯執行得到的結果,如下所示:
[email protected]:~/Documents/c$gcc struct_test1.c -o struct_test1 [email protected]:~/Documents/c$ ./struct_test1 a 1 3.140000
可以從結果上看出,結構體直接賦值在C語言下是可行的,我們看看struct_assign()
函式的彙編實現,從而從底層看看C語言是如何實現兩個結構體之間的賦值操作的:
struct_assign: pushl %ebp movl %esp, %ebp movl foo1, %eax movl %eax, foo2 //copy the first4 bytes from foo1 to foo2 movl foo1+4, %eax movl %eax, foo2+4 //copy the second 4 bytes from foo1 to foo2 movl foo1+8, %eax movl %eax, foo2+8 //copy the third 4 bytes from foo1 to foo2 movl foo1+12, %eax movl %eax, foo2+12 //copy the forth 4 bytes from foo1 to foo2 popl %ebp ret
這段彙編比較簡單,由於結構體的對齊的特性,sizeof(srtruct Foo)=16
,通過四次movl
操作將foo1的結構體內容拷貝到結構體foo2中。從彙編上看出,結構體賦值,採用的類似於memcpy
這種形式,而不是逐個欄位的拷貝。
複雜結構體的賦值
如果結構體中含有其它複雜資料型別呢,例如陣列、指標、結構體等,從上面的彙編實現可以看出,只要兩個結構體型別相同,就可以實現賦值,如下例:
#include <stdio.h> struct Foo { int n; double d[2]; char *p_c; }foo1, foo2; int main() { char *c = (char *) malloc (4*sizeof(char)); c[0] = 'a'; c[1] = 'b'; c[2] = 'c'; c[3] = '\0'; foo1.n = 1; foo1.d[0] = 2; foo1.d[1] = 3; foo1.p_c = c; foo2 = foo1; //assign foo1 to foo2 printf("%d %lf %lf %s\n", foo2.n, foo2.d[0], foo2.d[1], foo2.p_c); return 0; }
執行結果如下:
[email protected]:~/Documents/c$ gcc struct_test2.c -o struct_test2 [email protected]:~/Documents/c$ ./struct_test2 1 2.000000 3.000000 abc
可以看出結果和我們想象的是一樣的。再次驗證結構體的賦值,是直接結構體的記憶體的拷貝!但正是這個問題,如上面的例項,foo1 和 foo2 中p_c 指標都是指向我們申請的一塊大小為4個位元組的記憶體區域,這裡注意的是,結構體的拷貝只是淺拷貝,即指標p_c的賦值並不會導致再申請一塊記憶體區域,讓foo2的p_c指向它。那麼,如果釋放掉foo1中的p_c指向的記憶體,此時foo2中p_c變成野指標,這是對foo2的p_c操作就會出現一些不可預見的問題!在C++中引入了一種可以允許使用者過載結構體賦值操作運算,那麼我們就可以根據語義過載賦值操作。
陣列是二等公民
二等公民在維基百科上的解釋是:
二等公民不是一個正式的術語,用來描述一個社會體系內對一部分人的歧視或對外來人口的政治限制,即使他們作為一個公民或合法居民的地位。 二等公民雖然不一定是奴隸或罪犯,但他們只享有有限的合法權利、公民權利和經濟機會,並經常受到虐待或忽視。法律無視二等公民,不向他們提供保護,甚至在制訂法律時可能會根本不考慮他們的利益。劃分出二等公民的行為,普遍被視為一種侵犯人權的行為。 典型的二等公民所面臨的障礙包括但不僅限於(缺乏或喪失表決權):權利被剝奪,限制民事或軍事服務(不包括任何情況下的徵兵),以及限制,語言,宗教,教育,行動和結社的自由,武器的所有權,婚姻,性別認同和表達,住房和財產所有權 。
從詞條上解釋可以看出二等公民與一等公民在權利上是有差別的,這個詞很有意思作為計算機專業術語,其含義也有異曲同工之妙!同樣我們看看維基百科對計算機的術語”first-class citizen"(一等公民)的定義,一般要滿足以下幾點,
- can be stored in variables and data structures
- can be passed as a parameter to a subroutine
- can be returned as the result of a subroutine
- can be constructed at run-time
- has intrinsic identity (independent of any given name)
對比著上面的定義來看C語言陣列,陣列作為一個函式的引數傳遞時,退化成一個指標; 同時,陣列無法作為函式的返回值; 也許讓陣列更不服氣的是,陣列之間不能直接賦值操作,如下面的操作就是非法的:
int a[10]; int b[10]; a = b;
但是如果陣列包裝在結構體中,那麼就能進行賦值了!相比之下,結構體可以作為函式引數和返回值,這就是一等公民的待遇!至於為什麼陣列必須是二等公民,這是有歷史原因的,大家可以參考C 語言的發展史來看,有時間這塊內容我再補上!
參考資料:
- 維基百科
- International Standard ISO/IEC 9899