1. 程式人生 > 實用技巧 >結構體直接賦值的實現

結構體直接賦值的實現

拷貝自:https://blog.csdn.net/hazir/article/details/9429017
下面是一個例項:
#include <stdio.h>struct Foo {
    char a;
    int b;
    double c;
}foo1, foo2;          //define two structs with three different fields
void struct\_assign(void)
{
    foo2 = foo1;       //structure directly assignment
}
​
int main()
{
    foo1.a 
= 'a'; foo1.b = 1; foo1.c = 3.14; struct\_assign(); printf("%c %d %lf\\n", foo2.a, foo2.b, foo2.c); ​ return 0; }

我在 Ubuntu 13.04 下使用 gcc 4.7.3 編譯執行得到的結果,如下所示:

guohl@guohailin:~/Documents/c$ gcc struct\_test1.c -o struct\_test1
guohl@guohailin:~/Documents/c$ ./struct\_test1 
a 1 3.140000

可以從結果上看出,結構體直接賦值在 C 語言下是可行的,我們看看struct_assign()函式的彙編實現,從而從底層看看 C 語言是如何實現兩個結構體之間的賦值操作的:

struct\_assign:
pushl %ebp
movl %esp, %ebp
movl foo1, %eax
movl %eax, foo2 //copy the first 4 bytes from foo1 to foo2
movl foo1+4, %eax
movl %eax, foo2+4 //copy the second 4 bytes from foo1 to foo2
movl foo1+8, %eax
movl %eax, foo2+8 //copy the third 4 bytes from foo1 to foo2
movl foo1+12, %eax
movl %eax, foo2+12 //copy the forth 4 bytes from foo1 to foo2
popl %ebp
ret

這段彙編比較簡單,由於結構體的對齊的特性,sizeof(srtruct Foo)=16, 通過四次movl操作將 foo1 的結構體內容拷貝到結構體 foo2 中。從彙編上看出,結構體賦值,採用的類似於memcpy這種形式,而不是逐個欄位的拷貝。

複雜結構體的賦值

如果結構體中含有其它複雜資料型別呢,例如陣列、指標、結構體等,從上面的彙編實現可以看出,只要兩個結構體型別相同,就可以實現賦值,如下例:

#include <stdio.h>struct Foo {
    int n;
    double d\[2\];
    char \*p\_c;
}foo1, foo2;
​
int main()
{
    char \*c = (char \*) malloc (4\*sizeof(char));
    c\[0\] = 'a'; c\[1\] = 'b'; c\[2\] = 'c'; c\[3\] = '\\0';
​
    foo1.n = 1;
    foo1.d\[0\] = 2; foo1.d\[1\] = 3;
    foo1.p\_c = c;
​
    foo2 = foo1;     //assign foo1 to foo2
​
    printf("%d %lf %lf %s\\n", foo2.n, foo2.d\[0\], foo2.d\[1\], foo2.p\_c);
​
    return 0;
}

執行結果如下:

guohl@guohailin:~/Documents/c$ gcc struct\_test2.c -o struct\_test2
guohl@guohailin:~/Documents/c$ ./struct\_test2
1 2.000000 3.000000 abc

可以看出結果和我們想象的是一樣的。再次驗證結構體的賦值,是直接結構體的記憶體的拷貝!但正是這個問題,如上面的例項,foo1 和 foo2 中 p_c 指標都是指向我們申請的一塊大小為 4 個位元組的記憶體區域,這裡注意的是,結構體的拷貝只是淺拷貝,即指標 p_c 的賦值並不會導致再申請一塊記憶體區域,讓 foo2 的 p_c 指向它。那麼,如果釋放掉 foo1 中的 p_c 指向的記憶體,此時 foo2 中 p_c 變成野指標,這是對 foo2 的 p_c 操作就會出現一些不可預見的問題!在 C++ 中引入了一種可以允許使用者過載結構體賦值操作運算,那麼我們就可以根據語義過載賦值操作。

陣列是二等公民

二等公民在維基百科上的解釋是:

二等公民不是一個正式的術語,用來描述一個社會體系內對一部分人的歧視或對外來人口的政治限制,即使他們作為一個公民或合法居民的地位。 二等公民雖然不一定是奴隸或罪犯,但他們只享有有限的合法權利、公民權利和經濟機會,並經常受到虐待或忽視。法律無視二等公民,不向他們提供保護,甚至在制訂法律時可能會根本不考慮他們的利益。劃分出二等公民的行為,普遍被視為一種侵犯人權的行為。 典型的二等公民所面臨的障礙包括但不僅限於(缺乏或喪失表決權):權利被剝奪,限制民事或軍事服務(不包括任何情況下的徵兵),以及限制,語言,宗教,教育,行動和結社的自由,武器的所有權,婚姻,性別認同和表達,住房和財產所有權 。

從詞條上解釋可以看出二等公民與一等公民在權利上是有差別的,這個詞很有意思作為計算機專業術語,其含義也有異曲同工之妙!同樣我們看看維基百科對計算機的術語”first-class citizen"(一等公民)的定義,一般要滿足以下幾點,

  • can be stored in variables and data structures

  • can be passed as a parameter to a subroutine

  • can be returned as the result of a subroutine

  • can be constructed at run-time

  • has intrinsic identity (independent of any given name)

對比著上面的定義來看 C 語言陣列,陣列作為一個函式的引數傳遞時,退化成一個指標; 同時,陣列無法作為函式的返回值; 也許讓陣列更不服氣的是,陣列之間不能直接賦值操作,如下面的操作就是非法的:

int a\[10\];
int b\[10\];
a = b;

但是如果陣列包裝在結構體中,那麼就能進行賦值了!相比之下,結構體可以作為函式引數和返回值,這就是一等公民的待遇!至於為什麼陣列必須是二等公民,這是有歷史原因的,大家可以參考 C 語言的發展史來看,有時間這塊內容我再補上!


參考資料: