託管C++中函式呼叫的雙重轉換(Double Thunking)
阿新 • • 發佈:2018-12-31
在VC.Net中使用預設設定/clr編譯時,一個託管函式會產生兩個入口點,一個是託管的,供託管程式碼呼叫,另外一個是非託管的,供非託管程式碼呼叫。但是函式地址,特別是虛擬函式指標只能有一個值,所以需要有一個預設的入口。
非託管入口點可能是所有呼叫的預設入口(在 Visual Studio .NET2003 中,編譯器總是會選擇非託管入口,但是在Visual Studio 2005中,如果引數或者返回值中包含託管型別,那麼編譯器會選擇託管入口),而另外一個只是使用託管C++中的互操作功能對預設入口的呼叫。在一個託管函式被另一個託管函式呼叫的時候,這可能會造成不必要的託管/非託管上下文切換和引數/返回值的複製。如果函式不會被非託管程式碼使用指標呼叫,那麼可以在宣告函式時用VC2005新增的__clrcall修飾符阻止編譯器生成兩個入口。
現在用簡單的氣泡排序演算法來比較一下使用__clrcall之後的效能改善程度。
非託管入口點可能是所有呼叫的預設入口(在 Visual Studio .NET2003 中,編譯器總是會選擇非託管入口,但是在Visual Studio 2005中,如果引數或者返回值中包含託管型別,那麼編譯器會選擇託管入口),而另外一個只是使用託管C++中的互操作功能對預設入口的呼叫。在一個託管函式被另一個託管函式呼叫的時候,這可能會造成不必要的託管/非託管上下文切換和引數/返回值的複製。如果函式不會被非託管程式碼使用指標呼叫,那麼可以在宣告函式時用VC2005新增的__clrcall修飾符阻止編譯器生成兩個入口。
現在用簡單的氣泡排序演算法來比較一下使用__clrcall之後的效能改善程度。
using namespace System; #define ARRAY_SIZE 1000 struct bubbleBase { int value; }; class bubble1:public bubbleBase { public: virtual int getvalue(){return value;} virtual void setvalue(int newvalue){value=newvalue;} }; class bubble2:public bubbleBase { public: virtual int __clrcall getvalue(){return value;} virtual void __clrcall setvalue(int newvalue){value=newvalue;} }; template<class T> void bubbleSort(int length) { TimeSpan ts; T* array1=new T[ARRAY_SIZE]; for (int i=0;i<ARRAY_SIZE ;i++) { array1[i].setvalue(ARRAY_SIZE-i-1); } Int64 ticks=DateTime::Now.Ticks; int i, j,temp, test; for(i = length - 1; i > 0; i--) { test=0; for(j = 0; j < i; j++) { if(array1[j].getvalue() > array1[j+1].getvalue()) { temp = array1[j].getvalue(); array1[j].setvalue(array1[j+1].getvalue()); array1[j+1] .setvalue(temp); test=1; } } if(test==0) break; } ts=TimeSpan::FromTicks(DateTime::Now.Ticks-ticks); Console::WriteLine("BubbleSort {0} Items: {1} Ticks", ARRAY_SIZE, ts.Ticks ); delete array1; } int main(array<System::String ^> ^args) { bubbleSort<bubble1>(ARRAY_SIZE); bubbleSort<bubble2>(ARRAY_SIZE); return 0; }
執行結果是
BubbleSort 1000 Items: 3281250 Ticks
BubbleSort 1000 Items: 312500 Ticks
可以看到,__clrcall會大大加快在託管程式碼中呼叫託管函式的速度。
順便說一下,在隨VC8.0釋出的STL中增加了很多安全特性,但是這也會造成程式的執行速度減慢。如果你確認程式不會有緩衝區溢位或者記憶體越界訪問的問題,那麼可以把_SECURE_SCL定義成0來關掉這個特性。參考