1. 程式人生 > 程式設計 >詳解C++虛擬函式的工作原理

詳解C++虛擬函式的工作原理

靜態繫結與動態繫結

討論靜態繫結與動態繫結,首先需要理解的是繫結,何為繫結?函式呼叫與函式本身的關聯,以及成員訪問與變數記憶體地址間的關係,稱為繫結。 理解了繫結後再理解靜態與動態。

  • 靜態繫結:指在程式編譯過程中,把函式呼叫與響應呼叫所需的程式碼結合的過程,稱為靜態繫結。發生在編譯期。
  • 動態繫結:指在執行期間判斷所引用物件的實際型別,根據實際的型別呼叫其相應的方法。程式執行過程中,把函式呼叫與響應呼叫所需的程式碼相結合的過程稱為動態繫結。發生於執行期。

C++中動態繫結

在C++中動態繫結是通過虛擬函式實現的,是多型實現的具體形式。而虛擬函式是通過虛擬函式表實現的。這個表中記錄了虛擬函式的地址,解決繼承、覆蓋的問題,保證動態繫結時能夠根據物件的實際型別呼叫正確的函式。這個虛擬函式表在什麼地方呢?C++標準規格說明書中說到,編譯器必須要保證虛擬函式表的指標存在於物件例項中最前面的位置(這是為了保證正確取到虛擬函式的偏移量)。也就是說,我們可以通過物件例項的地址得到這張虛擬函式表,然後可以遍歷其中的函式指標,並呼叫相應的函式。

虛擬函式的工作原理

要想弄明白動態繫結,就必須弄懂虛擬函式的工作原理。C++中虛擬函式的實現一般是通過虛擬函式表實現的(C++規範中沒有規定具體用哪種方法,但大部分的編譯器廠商都選擇此方法)。類的虛擬函式表是一塊連續的記憶體,每個記憶體單元中記錄一個JMP指令的地址。編譯器會為每個有虛擬函式的類建立一個虛擬函式表,該虛擬函式表將被該類的所有物件共享。 類的每個虛成員佔據虛擬函式表中的一行。如果類中有N個虛擬函式,那麼其虛擬函式表將有N*4位元組的大小。

虛擬函式(virtual)是通過虛擬函式表來實現的,在這個表中,主要是一個類的虛擬函式的地址表,這張表解決了繼承、覆蓋的問題,保證其真實反映實際的函式。這樣,在有虛擬函式的類的例項中分配了指向這個表的指標的記憶體(位於物件例項的最前面),所以,當用父類的指標來操作一個子類的時候,這張虛擬函式表就顯得尤為重要,指明瞭實際所應呼叫的函式。它是如何指明的呢?後面會講到。

JMP指令是組合語言中的無條件跳轉指令,無條件跳轉指令可轉到記憶體中任何程式段。轉移地址可在指令中給出,也可以在暫存器中給出,或在儲存器中指出。

首先我們定義一個帶有虛擬函式的基類

class Base
{
public:
	virtual void fun1(){
		cout<<"base fun1!\n";
	}
	virtual void fun2(){
		cout<<"base fun2!\n";
	}
	virtual void fun3(){
		cout<<"base fun3!\n";
	}

	int a;
};

詳解C++虛擬函式的工作原理

我們可以看到在Base類的記憶體佈局上,第一個位置上存放虛擬函式表指標,接下來才是Base的成員變數。另外,存在著虛擬函式表,該表裡存放著Base類的所有virtual函式。

既然虛擬函式表指標通常放在物件例項的最前面的位置,那麼我們應該可以通過程式碼來訪問虛擬函式表,通過下面這段程式碼加深對虛擬函式表的理解:

#include "stdafx.h"
#include<iostream>
using namespace std;

class Base
{
public:
	virtual void fun1(){
		cout<<"base fun1!\n";
	}
	virtual void fun2(){
		cout<<"base fun2!\n";
	}
	virtual void fun3(){
		cout<<"base fun3!\n";
	}

	int a;
};

int _tmain(int argc,_TCHAR* argv[])
{
	typedef void(*pFunc)(void);
	Base b;
	cout<<"虛擬函式表指標地址:"<<(int*)(&b)<<endl;

	//物件最前面是指向虛擬函式表的指標,虛擬函式表中存放的是虛擬函式的地址
	pFunc pfun;
	pfun=(pFunc)*((int*)(*(int*)(&b))); //這裡存放的都是地址,所以才一層又一層的指標
	pfun();
	pfun=(pFunc)*((int*)(*(int*)(&b))+1);
	pfun();
	pfun=(pFunc)*((int*)(*(int*)(&b))+2);
	pfun();

	system("pause");
	return 0;
}

執行結果:

詳解C++虛擬函式的工作原理

通過這個例子,對虛擬函式表指標,虛擬函式表這些有了足夠的理解。下面再深入一些。C++又是如何利用基類指標和虛擬函式來實現多型的呢?這裡,我們就需要弄明白在繼承環境下虛擬函式表是如何工作的。目前只理解單繼承,至於虛繼承,多重繼承待以後再理解。

單繼承程式碼如下:

class Base
{
public:
	virtual void fun1(){
		cout<<"base fun1!\n";
	}
	virtual void fun2(){
		cout<<"base fun2!\n";
	}
	virtual void fun3(){
		cout<<"base fun3!\n";
	}

	int a;
};

class Child:public Base
{
public:
	void fun1(){
		cout<<"Child fun1\n";
	}
	void fun2(){
		cout<<"Child fun2\n";
	}
	virtual void fun4(){
		cout<<"Child fun4\n";
	}
};

記憶體佈局對比:

詳解C++虛擬函式的工作原理

詳解C++虛擬函式的工作原理

通過對比,我們可以看到:

  • 在單繼承中,Child類覆蓋了Base類中的同名虛擬函式,在虛擬函式表中體現為對應位置被Child類中的新函式替換,而沒有被覆蓋的函式則沒有發生變化。
  • 對於子類自己的虛擬函式,直接新增到虛擬函式表後面。

另外,我們注意到,類Child和類Base中都只有一個vfptr指標,前面我們說過,該指標指向虛擬函式表,我們分別輸出類Child和類Base的vfptr:

int _tmain(int argc,_TCHAR* argv[])
{
	typedef void(*pFunc)(void);
	Base b;
	Child c;
	cout<<"Base類的虛擬函式表指標地址:"<<(int*)(&b)<<endl;
	cout<<"Child類的虛擬函式表指標地址:"<<(int*)(&c)<<endl;

	system("pause");
	return 0;
}

執行結果:

詳解C++虛擬函式的工作原理

可以看到,類Child和類Base分別擁有自己的虛擬函式表指標vfptr和虛擬函式表vftable。

下面這段程式碼,說明了父類和基類擁有不同的虛擬函式表,同一個類擁有相同的虛擬函式表,同一個類的不同物件的地址(存放虛擬函式表指標的地址)不同。

int _tmain(int argc,_TCHAR* argv[])
{
	Base b;
	Child c1,c2;
	cout<<"Base類的虛擬函式表的地址:"<<(int*)(*(int*)(&b))<<endl;
	cout<<"Child類c1的虛擬函式表的地址:"<<(int*)(*(int*)(&c1))<<endl;	//虛擬函式表指標指向的地址值
	cout<<"Child類c2的虛擬函式表的地址:"<<(int*)(*(int*)(&c2))<<endl;

	system("pause");
	return 0;
}

詳解C++虛擬函式的工作原理

在定義該派生類物件時,先呼叫其基類的建構函式,然後再初始化vfptr,最後再呼叫派生類的建構函式( 從二進位制的視野來看,所謂基類子類是一個大結構體,其中this指標開頭的四個位元組存放虛擬函式表頭指標。執行子類的建構函式的時候,首先呼叫基類建構函式,this指標作為引數,在基類建構函式中填入基類的vfptr,然後回到子類的建構函式,填入子類的vfptr,覆蓋基類填入的vfptr。如此以來完成vfptr的初始化)。也就是說,vfptr指向vftable發生在建構函式期間完成的。

動態繫結例子:

#include "stdafx.h"
#include<iostream>
using namespace std;

class Base
{
public:
	virtual void fun1(){
		cout<<"base fun1!\n";
	}
	virtual void fun2(){
		cout<<"base fun2!\n";
	}
	virtual void fun3(){
		cout<<"base fun3!\n";
	}

	int a;
};

class Child:public Base
{
public:
	void fun1(){
		cout<<"Child fun1\n";
	}
	void fun2(){
		cout<<"Child fun2\n";
	}
	virtual void fun4(){
		cout<<"Child fun4\n";
	}
};


int _tmain(int argc,_TCHAR* argv[])
{
	Base* p=new Child;
	p->fun1();
	p->fun2();
	p->fun3();

	system("pause");
	return 0;
}

執行結果:

詳解C++虛擬函式的工作原理

結合上面的記憶體佈局:

詳解C++虛擬函式的工作原理

其實,在new Child時構造了一個子類的物件,子類物件按上面所講,在建構函式期間完成虛擬函式表指標vfptr指向Child類的虛擬函式表,將這個物件的地址賦值給了Base型別的指標p,當呼叫p->fun1()時,發現是虛擬函式,呼叫虛擬函式指標查詢虛擬函式表中對應虛擬函式的地址,這裡就是&Child::fun1。呼叫p->fun2()情況相同。呼叫p->fun3()時,子類並沒有重寫父類虛擬函式,但依舊通過呼叫虛擬函式指標查詢虛擬函式表,發現對應函式地址是&Base::fun3。所以上面的執行結果如上圖所示。

到這裡,你是否已經明白為什麼指向子類例項的基類指標可以呼叫子類(虛)函式?每一個例項物件中都存在一個vfptr指標,編譯器會先取出vfptr的值,這個值就是虛擬函式表vftable的地址,再根據這個值來到vftable中呼叫目標函式。所以,只要vfptr不同,指向的虛擬函式表vftable就不同,而不同的虛擬函式表中存放著對應類的虛擬函式地址,這樣就實現了多型的”效果“。

以上就是詳解C++虛擬函式的工作原理的詳細內容,更多關於C++虛擬函式的資料請關注我們其它相關文章!