1. 程式人生 > >c++多型規則

c++多型規則

虛擬函式與多型(C++)

虛擬函式是C++中用於實現多型(polymorphism)的機制。核心理念就是通過基類訪問派生類定義的函式。假設我們有下面的類層次:
class A
{
public:
    virtual void foo() { cout << "A::foo() is called" << endl;}
};
class B: public A
{
public:
    virtual void foo() { cout << "B::foo() is called" << endl;}
};

那麼,在使用的時候,我們可以:
A * a = new B();
a->foo(); // 在這裡,a雖然是指向A的指標,但是被呼叫的函式(foo)卻是B的!

這個例子是虛擬函式的一個典型應用,通過這個例子,也許你就對虛擬函式有了一些概念。它虛就虛在所謂“推遲聯編”或者“動態聯編”上,一個類函式的呼叫並不是在編譯時刻被確定的,而是在執行時刻被確定的。由於編寫程式碼的時候並不能確定被呼叫的是基類的函式還是哪個派生類的函式,所以被成為“虛”函式。

虛擬函式只能藉助於指標或者引用來達到多型的效果,如果是下面這樣的程式碼,則雖然是虛擬函式,但它不是多型的:
class A
{
public:
    virtual void foo();
};
class B: public A
{
    virtual void foo();
};
void bar()
{
    A a;
    a.foo(); // A::foo()被呼叫
}

 

1.1 多型

在瞭解了虛擬函式的意思之後,再考慮什麼是多型就很容易了。仍然針對上面的類層次,但是使用的方法變的複雜了一些:
void bar(A *a)
{
    a->foo(); // 被呼叫的是A::foo() 還是B::foo()?
}

因為foo()是個虛擬函式,所以在bar這個函式中,只根據這段程式碼,無從確定這裡被呼叫的是A::foo()還是B::foo(),但是可以肯定的說:如果a指向的是A類的例項,則A::foo()被呼叫,如果a指向的是B類的例項,則B::foo()被呼叫。

這種同一程式碼可以產生不同效果的特點,被稱為“多型”。

 

1.2 多型有什麼用?
  多型這麼神奇,但是能用來做什麼呢?這個命題我難以用一兩句話概括,一般的C++教程(或者其它面嚮物件語言的教程)都用一個畫圖的例子來展示多型的用途,我就不再重複這個例子了,如果你不知道這個例子,隨便找本書應該都有介紹。我試圖從一個抽象的角度描述一下,回頭再結合那個畫圖的例子,也許你就更容易理解。

在面向物件的程式設計中,首先會針對資料進行抽象(確定基類)和繼承(確定派生類),構成類層次。這個類層次的使用者在使用它們的時候,如果仍然在需要基類的時候寫針對基類的程式碼,在需要派生類的時候寫針對派生類的程式碼,就等於類層次完全暴露在使用者面前。如果這個類層次有任何的改變(增加了新類),都需要使用者“知道”(針對新類寫程式碼)。這樣就增加了類層次與其使用者之間的耦合,有人把這種情況列為程式中的“bad smell”之一。

多型可以使程式設計師脫離這種窘境。再回頭看看1.1中的例子,bar()作為A-B這個類層次的使用者,它並不知道這個類層次中有多少個類,每個類都叫什麼,但是一樣可以很好的工作,當有一個C類從A類派生出來後,bar()也不需要“知道”(修改)。這完全歸功於多型--編譯器針對虛擬函式產生了可以在執行時刻確定被呼叫函式的程式碼。

 

1.3 如何“動態聯編”
  編譯器是如何針對虛擬函式產生可以再執行時刻確定被呼叫函式的程式碼呢?也就是說,虛擬函式實際上是如何被編譯器處理的呢?Lippman在深度探索C++物件模型[1]中的不同章節講到了幾種方式,這裡把“標準的”方式簡單介紹一下。

我所說的“標準”方式,也就是所謂的“VTABLE”機制。編譯器發現一個類中有被宣告為virtual的函式,就會為其搞一個虛擬函式表,也就是 VTABLE。VTABLE實際上是一個函式指標的陣列,每個虛擬函式佔用這個陣列的一個slot。一個類只有一個VTABLE,不管它有多少個例項。派生類有自己的VTABLE,但是派生類的VTABLE與基類的VTABLE有相同的函式排列順序,同名的虛擬函式被放在兩個陣列的相同位置上。在建立類例項的時候,編譯器還會在每個例項的記憶體佈局中增加一個vptr欄位,該欄位指向本類的VTABLE。通過這些手段,編譯器在看到一個虛擬函式呼叫的時候,就會將這個呼叫改寫,針對1.1中的例子:
void bar(A * a)
{
    a->foo();
}
會被改寫為:
void bar(A * a)
{
    (a->vptr[1])();
}

因為派生類和基類的foo()函式具有相同的VTABLE索引,而他們的vptr又指向不同的VTABLE,因此通過這樣的方法可以在執行時刻決定呼叫哪個foo()函式。

雖然實際情況遠非這麼簡單,但是基本原理大致如此。

 

1.4 overload和override

虛擬函式總是在派生類中被改寫,這種改寫被稱為“override”。我經常混淆“overload”和“override”這兩個單詞。但是隨著各類C++的書越來越多,後來的程式設計師也許不會再犯我犯過的錯誤了。但是我打算澄清一下:

override是指派生類重寫基類的虛擬函式,就象我們前面B類中重寫了A類中的foo()函式。重寫的函式必須有一致的引數表和返回值(C++標準允許返回值不同的情況,這個我會在“語法”部分簡單介紹,但是很少編譯器支援這個feature)。這個單詞好象一直沒有什麼合適的中文詞彙來對應,有人譯為“覆蓋”,還貼切一些。
overload約定成俗的被翻譯為“過載”。是指編寫一個與已有函式同名但是引數表不同的函式。例如一個函式即可以接受整型數作為引數,也可以接受浮點數作為引數。

 

二. 虛擬函式的語法
  虛擬函式的標誌是“virtual”關鍵字。

 

2.1 使用virtual關鍵字

考慮下面的類層次:
class A
{
public:
    virtual void foo();
};

class B: public A
{
public:
    void foo(); // 沒有virtual關鍵字!
};

class C: public B // 從B繼承,不是從A繼承!
{
public:
    void foo(); // 也沒有virtual關鍵字!
};

這種情況下,B::foo()是虛擬函式,C::foo()也同樣是虛擬函式。因此,可以說,基類宣告的虛擬函式,在派生類中也是虛擬函式,即使不再使用virtual關鍵字。

 

2.2 純虛擬函式
  如下宣告表示一個函式為純虛擬函式:
class A
{
public:
    virtual void foo()=0; // =0標誌一個虛擬函式為純虛擬函式
};

一個函式宣告為純虛後,純虛擬函式的意思是:我是一個抽象類!不要把我例項化!純虛擬函式用來規範派生類的行為,實際上就是所謂的“介面”。它告訴使用者,我的派生類都會有這個函式。

 

2.3 虛解構函式
  解構函式也可以是虛的,甚至是純虛的。例如:
class A
{
public:
virtual ~A()=0; // 純虛解構函式
};

當一個類打算被用作其它類的基類時,它的解構函式必須是虛的。考慮下面的例子:
class A
{
public:
    A() { ptra_ = new char[10];}
    ~A() { delete[] ptra_;} // 非虛解構函式
private:
    char * ptra_;
};
class B: public A
{
public:
    B() { ptrb_ = new char[20];}
    ~B() { delete[] ptrb_;}
private:
    char * ptrb_;
};
void foo()
{
    A * a = new B;
    delete a;
}

在這個例子中,程式也許不會象你想象的那樣執行,在執行delete a的時候,實際上只有A::~A()被呼叫了,而B類的解構函式並沒有被呼叫!這是否有點兒可怕?

如果將上面A::~A()改為virtual,就可以保證B::~B()也在delete a的時候被呼叫了。因此基類的解構函式都必須是virtual的。

純虛的解構函式並沒有什麼作用,是虛的就夠了。通常只有在希望將一個類變成抽象類(不能例項化的類),而這個類又沒有合適的函式可以被純虛化的時候,可以使用純虛的解構函式來達到目的。

 

2.4 虛建構函式?
  建構函式不能是虛的。

 

三. 虛擬函式使用技巧

3.1 private的虛擬函式

考慮下面的例子:
class A
{
public:
    void foo() { bar();}
private:
    virtual void bar() { ...}
};
class B: public A
{
private:
    virtual void bar() { ...}
};

在這個例子中,雖然bar()在A類中是private的,但是仍然可以出現在派生類中,並仍然可以與public或者protected的虛擬函式一樣產生多型的效果。並不會因為它是private的,就發生A::foo()不能訪問B::bar()的情況,也不會發生B::bar()對A::bar ()的override不起作用的情況。

這種寫法的語意是:A告訴B,你最好override我的bar()函式,但是你不要管它如何使用,也不要自己呼叫這個函式。

 

3.2 建構函式和解構函式中的虛擬函式呼叫

一個類的虛擬函式在它自己的建構函式和解構函式中被呼叫的時候,它們就變成普通函數了,不“虛”了。也就是說不能在建構函式和解構函式中讓自己“多型”。例如:
class A
{
public:
    A() { foo();} // 在這裡,無論如何都是A::foo()被呼叫!
    ~A() { foo();} // 同上
    virtual void foo();
};
class B: public A
{
public:
    virtual void foo();
};
void bar()
{
    A * a = new B;
    delete a;
}

如果你希望delete a的時候,會導致B::foo()被呼叫,那麼你就錯了。同樣,在new B的時候,A的建構函式被呼叫,但是在A的建構函式中,被呼叫的是A::foo()而不是B::foo()。

 

3.4 什麼時候使用虛擬函式

在你設計一個基類的時候,如果發現一個函式需要在派生類裡有不同的表現,那麼它就應該是虛的。從設計的角度講,出現在基類中的虛擬函式是介面,出現在派生類中的虛擬函式是介面的具體實現。通過這樣的方法,就可以將物件的行為抽象化。

以設計模式[2]中Factory Method模式為例,Creator的factoryMethod()就是虛擬函式,派生類override這個函式後,產生不同的Product類,產生的Product類被基類的AnOperation()函式使用。基類的AnOperation()函式針對Product類進行操作,當然 Product類一定也有多型(虛擬函式)。

另外一個例子就是集合操作,假設你有一個以A類為基類的類層次,又用了一個std:: vector來儲存這個類層次中不同類的例項指標,那麼你一定希望在對這個集合中的類進行操作的時候,不要把每個指標再cast回到它原來的型別(派生類),而是希望對他們進行同樣的操作。那麼就應該將這個“一樣的操作”宣告為virtual。

現實中,遠不只我舉的這兩個例子,但是大的原則都是我前面說到的“如果發現一個函式需要在派生類裡有不同的表現,那麼它就應該是虛的”。這句話也可以反過來說:“如果你發現基類提供了虛擬函式,那麼你最好override它”。

 

附:C++中的虛擬函式和純虛擬函式用法

1.虛擬函式和純虛擬函式可以定義在同一個類(class)中,含有純虛擬函式的類被稱為抽象類(abstract class),而只含有虛擬函式的類(class)不能被稱為抽象類(abstract class)。

2.虛擬函式可以被直接使用,也可以被子類(sub class)過載以後以多型的形式呼叫,而純虛擬函式必須在子類(sub class)中實現該函式才可以使用,因為純虛擬函式在基類(base class)
只有宣告而沒有定義。

3.虛擬函式和純虛擬函式都可以在子類(sub class)中被過載,以多型的形式被呼叫。

4.虛擬函式和純虛擬函式通常存在於抽象基類(abstract base class -ABC)之中,被繼承的子類過載,目的是提供一個統一的介面。

5.虛擬函式的定義形式:virtual {method body} ;純虛擬函式的定義形式:virtual { } = 0; 在虛擬函式和純虛擬函式的定義中不能有static識別符號,原因很簡單,被static修飾的函式在編譯時候要求前期bind,然而虛擬函式卻是動態繫結(run-time bind),而且被兩者修飾的函式生命週期(life recycle)也不一樣。

6.如果一個類中含有純虛擬函式,那麼任何試圖對該類進行例項化的語句都將導致錯誤的產生,因為抽象基類(ABC)是不能被直接呼叫的。必須被子類繼承過載以後,根據要求呼叫其子類的方法。

以下為一個簡單的虛擬函式和純虛寒數的使用演示,目的是拋磚引玉!
//father class
class Virtualbase
{
public:
    virtual void Demon()= 0; //prue virtual function
    virtual void Base() {cout<<"this is farther class"<};
};
//sub class
class SubVirtual :public Virtualbase
{
public:
    void Demon() { cout<<" this is SubVirtual!"<<endl;}

void Base() {cout<<"this is subclass Base"<<endl;}
};

void main()
{
    Virtualbase* inst = new SubVirtual(); //multstate pointer
    inst->Demon();
    inst->Base();
    // inst = new Virtualbase();
    // inst->Base()
    return ;
}

----------------------------------------------------------------------------------------------

 

    虛擬函式是在類中被宣告為virtual的成員函式,當編譯器看到通過指標或引用呼叫此類函式時,對其執行晚繫結,即通過指標(或引用)指向的類的型別資訊來決定該函式是哪個類的。通常此類指標或引用都宣告為基類的,它可以指向基類或派生類的物件。多型指同一個方法根據其所屬的不同物件可以有不同的行為。

早繫結指編譯器在編譯期間即知道物件的具體型別並確定此物件呼叫成員函式的確切地址;而晚繫結是根據指標所指物件的型別資訊得到類的虛擬函式表指標進而確定呼叫成員函式的確切地址。

編譯器對每個包含虛擬函式的類建立一個表(稱為vtable)。在vtable中,編譯器放置特定類的虛擬函式地址。在每個帶有虛擬函式的類中,編譯器祕密地置一指標,稱為vpointer(縮寫為vptr),指向這個物件的vtable。通過基類指標做虛擬函式呼叫時(也就是做多型呼叫時),編譯器靜態地插入取得這個vptr,並vtable表中查詢函式地址的程式碼,這樣就能呼叫正確的函式使晚捆綁發生。為每個類設定vtable、初始化vptr、為虛擬函式呼叫插入程式碼,所有這些都是自動發生的,所以我們不必擔心這些。利用虛擬函式,這個物件的合適的函式就能被呼叫,哪怕在編譯器還不知道這個物件的特定型別的情況下。

在任何類中不存在顯示的型別資訊,可物件中必須存放類資訊,否則型別不可能在執行時建立。那這個類資訊是什麼呢?我們來看下面幾個類:

class no_virtual
{
public:
    void fun1() const{}
    int  fun2() const { return a; }
private:
    int a;
}

class one_virtual
{
public:
    virtual void fun1() const{}
    int  fun2() const { return a; }
private:
    int a;
}

class two_virtual
{
public:
    virtual void fun1() const{}
    virtual int  fun2() const { return a; }
private:
    int a;
}

以上三個類中:
no_virtual沒有虛擬函式,sizeof(no_virtual)=4,類no_virtual的長度就是其成員變數整型a的長度;
one_virtual有一個虛擬函式,sizeof(one_virtual)=8;
two_virtual有兩個虛擬函式,sizeof(two_virtual)=8; 有一個虛擬函式和兩個虛擬函式的類的長度沒有區別,其實它們的長度就是no_virtual的長度加一個void指標的長度,它反映出,如果有一個或多個虛擬函式,編譯器在這個結構中插入一個指標( vptr)。在one_virtual 和two_virtual之間沒有區別。這是因為vptr指向一個存放地址的表,只需要一個指標,因為所有虛擬函式地址都包含在這個表中。這個VPTR就可以看作類的型別資訊。

那我們來看看編譯器是怎麼建立VPTR指向的這個虛擬函式表的。先看下面兩個類:
class base
{
public:
    void bfun(){}
    virtual void vfun1(){}
    virtual int vfun2(){}
private:
    int a;
}
class derived : public base
{
public:
    void dfun(){}
    virtual void vfun1(){}
    virtual int vfun3(){}
private:
    int b;
}
兩個類VPTR指向的虛擬函式表(VTABLE)分別如下:
base類
          ——————
VPTR——> |&base::vfun1 |
           ——————
          |&base::vfun2 |
           ——————

derived類
           ———————
VPTR——> |&derived::vfun1 |
           ———————
          |&base::vfun2    |
           ———————
          |&derived::vfun3 |
            ———————

每當建立一個包含有虛擬函式的類或從包含有虛擬函式的類派生一個類時,編譯器就為這個類建立一個VTABLE,如上圖所示。在這個表中,編譯器放置了在這個類中或在它的基類中所有已宣告為virtual的函式的地址。如果在這個派生類中沒有對在基類中宣告為virtual的函式進行重新定義,編譯器就使用基類的這個虛擬函式地址。(在derived的VTABLE中,vfun2的入口就是這種情況。)然後編譯器在這個類中放置VPTR。當使用簡單繼承時,對於每個物件只有一個VPTR。VPTR必須被初始化為指向相應的VTABLE,這在建構函式中發生。

一旦VPTR被初始化為指向相應的VTABLE,物件就"知道"它自己是什麼型別。但只有當虛擬函式被呼叫時這種自我認知才有用。

VPTR常常位於物件的開頭,編譯器能很容易地取到VPTR的值,從而確定VTABLE的位置。VPTR總指向VTABLE的開始地址,所有基類和它的子類的虛擬函式地址(子類自己定義的虛擬函式除外)在VTABLE中儲存的位置總是相同的,如上面base類和derived類的VTABLE中vfun1和vfun2的地址總是按相同的順序儲存。編譯器知道vfun1位於VPTR處,vfun2位於VPTR+1處,因此在用基類指標呼叫虛擬函式時,編譯器首先獲取指標指向物件的型別資訊(VPTR),然後就去呼叫虛擬函式。如一個base類指標pBase指向了一個derived物件,那pBase->vfun2()被編譯器翻譯為 VPTR+1 的呼叫,因為虛擬函式vfun2的地址在VTABLE中位於索引為1的位置上。同理,pBase->vfun3()被編譯器翻譯為 VPTR+2的呼叫。這就是所謂的晚繫結。