C++ 虛擬函式表解析
1 前言
C++中的虛擬函式的作用主要是實現了多型的機制。關於多型,簡而言之就是用父型別的指標指向其子類的例項,然後通過父類的指標呼叫實際子類的成員函式。這種技術可以讓父類的指標有“多種形態”,這是一種泛型技術。所謂泛型技術,說白了就是試圖使用不變的程式碼來實現可變的演算法。比如:模板技術,RTTI技術(Run-Time Type Identification),虛擬函式技術,要麼是試圖做到在編譯時決議,要麼試圖做到執行時決議。
關於虛擬函式的使用方法,我在這裡不做過多的闡述。大家可以看看相關的C++的書籍。在這篇文章中,我只想從虛擬函式的實現機制上面為大家 一個清晰的剖析。
當然,相同的文章在網上也出現過一些了,但我總感覺這些文章不是很容易閱讀,大段大段的程式碼,沒有圖片,沒有詳細的說明,沒有比較,沒有舉一反三。不利於學習和閱讀,所以這是我想寫下這篇文章的原因。也希望大家多給我提意見。
言歸正傳,讓我們一起進入虛擬函式的世界。
2 虛擬函式表
對C++ 瞭解的人都應該知道虛擬函式(Virtual Function)是通過一張虛擬函式表(Virtual Table)來實現的。簡稱為V-Table。在這個表中,主要是一個類的虛擬函式的地址表,這張表解決了繼承、覆蓋的問題,保證其內容真實反應實際的函式。這樣,在有虛擬函式的類的例項中這個表被分配在了這個例項的記憶體中,所以,當我們用父類的指標來操作一個子類的時候,這張虛擬函式表就顯得尤為重要了,它就像一個地圖一樣,指明瞭實際所應該呼叫的函式。
這裡我們著重看一下這張虛擬函式表。C++的編譯器應該是保證虛擬函式表的指標存在於物件例項中最前面的位置
聽我扯了那麼多,我可以感覺出來你現在可能比以前更加暈頭轉向了。 沒關係,下面就是實際的例子,相信聰明的你一看就明白了。
假設我們有這樣的一個類:
class Base { public: virtual void f() { cout << "Base::f" << endl; } virtual void g() { cout << "Base::g" << endl; } virtual void h() { cout << "Base::h" << endl; } };
按照上面的說法,我們可以通過Base的例項來得到虛擬函式表。 下面是實際例程:
typedef void(*Fun)(void);
Base b;
Fun pFun = NULL;
cout << "虛擬函式表地址:" << (int*)*(int*)(&b) << endl;
cout << "虛擬函式表 — 第一個函式地址:" << (int*)*(int*)*(int*)(&b) << endl;
// Invoke(呼叫) the first virtual function
pFun = (Fun)*((int*)*(int*)(&b));
pFun();
實際執行經果如下:(Windows XP+VS2003, Linux 2.6.22 + GCC 4.1.3)
虛擬函式表地址:0012FED4
虛擬函式表 — 第一個函式地址:0044F148
Base::f
通過這個示例,我們可以看到,我們可以通過強行把&b轉成int *
,取得虛擬函式表地址的地址,然後,取址就可以得到虛擬函式表的地址了,再次取址就可以得到第一個虛擬函式也就是Base::f()的地址了,這在上面的程式中得到了驗證(把int*
強制轉成了函式指標)。通過這個示例,我們就可以知道如果要呼叫Base::g()和Base::h(),其程式碼如下:
(Fun)*((int*)*(int*)(&b)+0); // Base::f()
(Fun)*((int*)*(int*)(&b)+1); // Base::g()
(Fun)*((int*)*(int*)(&b)+2); // Base::h()
這個時候你應該懂了吧。什麼?還是有點暈。也是,這樣的程式碼看著太亂了。沒問題,讓我畫個圖解釋一下。如下所示:
注意:在上面這個圖中,我在虛擬函式表的最後多加了一個結點,這是虛擬函式表的結束結點,就像字串的結束符’\0’一樣,其標誌了虛擬函式表的結束。這個結束標誌的值在不同的編譯器下是不同的。在WinXP+VS2003下,這個值是NULL。而在Ubuntu 7.10 + Linux 2.6.22 + GCC 4.1.3下,這個值如果是1,表示還有下一個虛擬函式表,如果值是0,表示是最後一個虛擬函式表。
下面,我將分別說明“無覆蓋”和“有覆蓋”時的虛擬函式表的樣子。沒有覆蓋父類的虛擬函式是毫無意義的。我之所以要講述沒有覆蓋的情況,主要目的是為了給一個對比。在比較之下,我們可以更加清楚地知道其內部的具體實現。
3 一般繼承(無虛擬函式覆蓋)
下面,再讓我們來看看繼承時的虛擬函式表是什麼樣的。假設有如下所示的一個繼承關係:
請注意,在這個繼承關係中,子類沒有過載任何父類的函式。那麼,在派生類的例項中,其虛擬函式表如下所示:
對於例項:Derive d; 的虛擬函式表如下:
我們可以看到下面幾點:
1)虛擬函式按照其宣告順序放於表中。
2)父類的虛擬函式在子類的虛擬函式前面。
我相信聰明的你一定可以參考前面的那個程式,來編寫一段程式來驗證。
4 一般繼承(有虛擬函式覆蓋)
覆蓋父類的虛擬函式是很顯然的事情,不然,虛擬函式就變得毫無意義。下面,我們來看一下,如果子類中有虛擬函式過載了父類的虛擬函式,會是一個什麼樣子?假設,我們有下面這樣的一個繼承關係。
為了讓大家看到被繼承過後的效果,在這個類的設計中,我只覆蓋了父類的一個函式:f()。那麼,對於派生類的例項,其虛擬函式表會是下面的一個樣子:
我們從表中可以看到下面幾點,
1)覆蓋的f()函式被放到了虛表中原來父類虛擬函式的位置。
2)沒有被覆蓋的函式依舊。
這樣,我們就可以看到對於下面這樣的程式,
Base *b = new Derive();
b->f();
由b所指的記憶體中的虛擬函式表的f()的位置已經被Derive::f()函式地址所取代,於是在實際呼叫發生時,是Derive::f()被呼叫了。這就實現了多型。
5 多繼承(無虛擬函式覆蓋)
下面,再讓我們來看看多繼承中的情況,假設有下面這樣一個類的繼承關係。注意:子類並沒有覆蓋父類的函式。
對於子類例項中的虛擬函式表,是下面這個樣子:
我們可以看到:
1) 每個父類都有自己的虛表。
2) 子類的成員函式被放到了第一個父類的表中。(所謂的第一個父類是按照宣告順序來判斷的)
這樣做就是為了解決不同的父類型別的指標指向同一個子類例項,而能夠呼叫到實際的函式。
6 多繼承(有虛擬函式覆蓋)
下面我們再來看看,如果發生虛擬函式覆蓋的情況。
下圖中,我們在子類中覆蓋了父類的f()函式。
下面是對於子類例項中的虛擬函式表的圖:
我們可以看見,**三個父類虛擬函式表中的f()的位置被替換成了子類的函式指標。**這樣,我們就可以任一靜態型別的父類來指向子類,並呼叫子類的f()了。如:
Derive d;
Base1 *b1 = &d;
Base2 *b2 = &d;
Base3 *b3 = &d;
b1->f(); //Derive::f()
b2->f(); //Derive::f()
b3->f(); //Derive::f()
b1->g(); //Base1::g()
b2->g(); //Base2::g()
b3->g(); //Base3::g()
7 安全性
每次寫C++的文章,總免不了要批判一下C++。這篇文章也不例外。通過上面的講述,相信我們對虛擬函式表有一個比較細緻的瞭解了。水可載舟,亦可覆舟。下面,讓我們來看看我們可以用虛擬函式表來乾點什麼壞事吧。
一、通過父型別的指標訪問子類自己的虛擬函式
我們知道,子類沒有過載父類的虛擬函式是一件毫無意義的事情。因為多型也是要基於函式過載的。雖然在上面的圖中我們可以看到Base1的虛表中有Derive的虛擬函式,但我們根本不可能使用下面的語句來呼叫子類的自有虛擬函式:
Base1 *b1 = new Derive();
b1->f1(); //編譯出錯
任何妄圖使用父類指標想呼叫子類中的未覆蓋父類的成員函式的行為都會被編譯器視為非法,所以,這樣的程式根本無法編譯通過。但在執行時,我們可以通過指標的方式訪問虛擬函式表來達到違反C++語義的行為。(關於這方面的嘗試,通過閱讀後面附錄的程式碼,相信你可以做到這一點)
二、訪問non-public的虛擬函式
另外,如果父類的虛擬函式是private或是protected的,但這些非public的虛擬函式同樣會存在於虛擬函式表中,所以,我們同樣可以使用訪問虛擬函式表的方式來訪問這些non-public的虛擬函式,這是很容易做到的。
如:
class Base
{
private:
virtual void f() { cout << "Base::f" << endl; }
};
class Derive : public Base{
};
typedef void(*Fun)(void);
void main()
{
Derive d;
Fun pFun = (Fun)*((int*)*(int*)(&d)+0);
pFun();
}
附錄一:VC中檢視虛擬函式表
我們可以在VC的IDE環境中的Debug狀態下展開類的例項就可以看到虛擬函式表了(並不是很完整)
程式碼:
#include <iostream>
using namespace std;
class Base1
{
private:
virtual void f() { cout << "Base1::f" << endl; }
virtual void g() { cout << "Base1::g" << endl; }
virtual void h() { cout << "Base1::h" << endl; }
};
class Base2
{
private:
virtual void f() { cout << "Base2::f" << endl; }
virtual void g() { cout << "Base2::g" << endl; }
virtual void h() { cout << "Base2::h" << endl; }
};
class Base3
{
private:
virtual void f() { cout << "Base3::f" << endl; }
virtual void g() { cout << "Base3::g" << endl; }
virtual void h() { cout << "Base3::h" << endl; }
};
class Derive: public Base1, public Base2, public Base3
{
public:
void f() { cout << "Base::f" << endl; } // 基類f為虛擬函式,則子類f也為虛擬函式,可省略virtual
virtual void g1() { cout << "Base::f" << endl; }
};
int main()
{
Derive d;
cout << sizeof(Derive) << endl;
return 0;
}
附錄 二:例程
下面是一個關於多繼承的虛擬函式表訪問的例程:
#include <iostream>
using namespace std;
class Base1 {
public:
virtual void f() { cout << "Base1::f" << endl; }
virtual void g() { cout << "Base1::g" << endl; }
virtual void h() { cout << "Base1::h" << endl; }
};
class Base2 {
public:
virtual void f() { cout << "Base2::f" << endl; }
virtual void g() { cout << "Base2::g" << endl; }
virtual void h() { cout << "Base2::h" << endl; }
};
class Base3 {
public:
virtual void f() { cout << "Base3::f" << endl; }
virtual void g() { cout << "Base3::g" << endl; }
virtual void h() { cout << "Base3::h" << endl; }
};
class Derive : public Base1, public Base2, public Base3 {
public:
virtual void f() { cout << "Derive::f" << endl; }
virtual void g1() { cout << "Derive::g1" << endl; }
};
typedef void(*Fun)(void);
int main()
{
Fun pFun = NULL;
Derive d;
int** pVtab = (int**)&d;
//Base1's vtable
//pFun = (Fun)*((int*)*(int*)((int*)&d+0)+0);
pFun = (Fun)pVtab[0][0];
pFun();
//pFun = (Fun)*((int*)*(int*)((int*)&d+0)+1);
pFun = (Fun)pVtab[0][1];
pFun();
//pFun = (Fun)*((int*)*(int*)((int*)&d+0)+2);
pFun = (Fun)pVtab[0][2];
pFun();
//Derive's vtable
//pFun = (Fun)*((int*)*(int*)((int*)&d+0)+3);
pFun = (Fun)pVtab[0][3];
pFun();
//The tail of the vtable
pFun = (Fun)pVtab[0][4];
cout << pFun << endl;
//Base2's vtable
//pFun = (Fun)*((int*)*(int*)((int*)&d+1)+0);
pFun = (Fun)pVtab[1][0];
pFun();
//pFun = (Fun)*((int*)*(int*)((int*)&d+1)+1);
pFun = (Fun)pVtab[1][1];
pFun();
pFun = (Fun)pVtab[1][2];
pFun();
//The tail of the vtable
pFun = (Fun)pVtab[1][3];
cout << pFun << endl;
//Base3's vtable
//pFun = (Fun)*((int*)*(int*)((int*)&d+1)+0);
pFun = (Fun)pVtab[2][0];
pFun();
//pFun = (Fun)*((int*)*(int*)((int*)&d+1)+1);
pFun = (Fun)pVtab[2][1];
pFun();
pFun = (Fun)pVtab[2][2];
pFun();
//The tail of the vtable
pFun = (Fun)pVtab[2][3];
cout << pFun << endl;
return 0;
}
VS2015輸出:
g++輸出:
C++ 子類覆蓋了父類的虛擬函式後,為什麼還可以引用父類的函式?
class A
{
public:
virtual void func(){ cout<<"A"<<endl; }
}
class B : public A
{
public:
virtual void func(){ cout<<"B"<<endl; }
}
B b;
b.A::func();
輸出為:A
問:B繼承了A之後並且重寫了 A 的方法 ,A 的func函式被覆蓋了 ,那編譯器是怎麼找到A 的func函式並輸出"A" 的?B的虛擬函式表中,func()不是被替換了嗎?
答:虛擬函式是指這個函式的簽名。 而 這個虛擬函式在類中的實現不是,它是一個實實在在的成員函式。 和普通的函式一樣的。 如果這個函式是虛擬函式,此時編譯器會把其地址放在虛擬函式表中。不是虛擬函式不會放入虛擬函式表中。 所以這個函式有兩個入口。 第一個就是你這樣呼叫,和普通的成員函式一致。 第二個是通過引用呼叫,此時編譯器會通過虛表來呼叫。 此時需要新增一個修正 this 指標的轉換函式。
轉載自: