定位new表示式與顯式呼叫解構函式
C++的核心理念之一是RAII,Resource Acquisition Is Initialization,資源獲取即初始化。資源有很多種,記憶體、互斥鎖、檔案、套接字等;RAII可以用來實現一種與作用域繫結的資源管理方法(如std::lock_guard
);這些都不在本文的討論範圍之內。
記憶體是一種資源。從字面上來看,“資源獲取”是指在棧或堆上開闢空間,“初始化”是指呼叫建構函式,“即”的意思是兩者是繫結起來的。對應地,資源銷燬即釋放。這種機制保證了任何函式訪問引數物件時不會訪問到非法地址,除了構造和解構函式以外的任何函式的引數都不會是未初始化的。
然而,C++作為能夠面向底層的語言,允許我們把記憶體獲取與初始化分開來:std::malloc
std::free
用於分配和釋放記憶體,定位new
表示式和解構函式的顯式呼叫用於初始化和銷燬物件。
malloc與free
std::malloc
用於分配記憶體,std::free
用於釋放記憶體,兩者都定義在<cstdlib>
中:
void* malloc(std::size_t size);
void free(void* ptr);
比如,我想要分配一個int
的動態記憶體,就應該給size
填上sizeof(int)
,返回值就是指向那個int
的指標。如果是陣列,就給size
乘上元素個數。注意在C++中,從void*
到T*
的轉換不能是隱式的。
要回收它,把指標傳給free
,不需要size
#include <iostream>
#include <cstdlib>
int main()
{
auto p = static_cast<int*>(std::malloc(sizeof(int) * 10));
p[0] = 1;
p[1] = 2;
std::cout << p[0] << ' ' << p[1] << std::endl;
std::free(p);
}
如果std::malloc
過程中發生了錯誤,比如記憶體不足,std::malloc
會返回NULL
nullptr
的前身。實際使用時都應該考慮這種情況。
std::malloc
得到的記憶體必須用free
釋放。std::malloc
/std::free
的記憶體分配與new
/delete
不互通。
定位new表示式
std::malloc
分配的記憶體是未經初始化的,對於int
等內建型別可以直接使用,而類型別則未必,需要先初始化才能使用。
我們知道,類的非靜態成員函式都有一個隱式的this
指標作為引數,建構函式也不例外,在未初始化的記憶體上構造物件,就是把這塊記憶體的指標作為this
傳入建構函式。不幸的是,沒有顯式呼叫建構函式這種語法:
auto ptr = static_cast<A*>(std::malloc(sizeof(A)));
ptr->A("hello"); // error
(在MSVC中,ptr->A::A("hello");
是合法的,但這是非標準的。)
我們需要定位new
,它定義在<new>
中,需要#include
以後才能使用:
void* operator new(std::size_t, void*);
new
運算子是可以過載的,new
運算子的功能是為new
表示式中的建構函式提供this
指標。但是定位new
不行,它總是忠實地返回它的第二個引數。
定位new
表示式有以下形式:
new (ptr) Type;
new (ptr) Type(args);
new (ptr) Type[size];
new (ptr) Type[size]{list};
ptr
為要當作this
的指標,Type
為要構造的型別,args
為可能為空的引數列表,size
為陣列大小(可以動態),list
為陣列元素列表。
利用定位new
,把ptr
作為this
的建構函式可以這樣呼叫:
#include <iostream>
#include <cstdlib>
#include <string>
#include <utility>
class A
{
public:
A(std::string s) : string(std::move(s))
{
std::cout << "A::A(std::string)" << std::endl;
}
std::string& get()
{
return string;
}
private:
std::string string;
};
int main()
{
auto ptr = static_cast<A*>(std::malloc(sizeof(A)));
// std::cout << ptr->get() << std::endl; // disaster
// ptr->A("hello"); // error
new (ptr) A("hello");
std::cout << ptr->get() << std::endl;
// delete ptr; // disaster
// what's next?
}
不要因為ptr
簡單就不加括號,括號不是為了什麼運算子優先順序,而是定位new
表示式的一部分。
剛才不是說std::malloc
與new
不互通嗎?怎麼在std::malloc
來的ptr
上用定位new
了呢?因為定位new
根本不插手記憶體分配,和std::malloc
是兩回事。
定位new
不止可以用於std::malloc
來的動態記憶體,甚至可以是區域性變數:
char buffer[sizeof(A)];
auto ptr = new (buffer) A("hello");
std::cout << ptr->get() << std::endl;
與常規的new
一樣,定位new
表示式也返回一個指標,就是Type*
型別的ptr
。
顯式呼叫解構函式
上面通過std::malloc
得到的ptr
,為什麼不能直接std::free
呢?因為std::string
裡面的資源還沒釋放,正確的做法是呼叫A
的解構函式。
不能對一個物件呼叫建構函式,那麼解構函式呢?答案是肯定的。只是~
在形式上有點怪,尤其是當你把模板引數T
換成int
後得到ptr->~int()
時,後者直接寫是不合法的。
所以對於上面的ptr
,要這樣才能釋放所有資源:
ptr->~A();
std::free(ptr);
顯式呼叫解構函式,就像在幫編譯器做事情一樣。編譯器會不會領情呢?寫個程式碼測試一下吧:
#include <iostream>
#include <string>
#include <utility>
class A
{
public:
A(std::string s) : string(std::move(s))
{
std::cout << "A::A(std::string)" << std::endl;
}
std::string& get()
{
std::cout << "A::get()" << std::endl;
return string;
}
~A()
{
std::cout << "A::~A()" << std::endl;
}
private:
std::string string;
};
int main()
{
{
A a("");
a.~A();
}
std::cout << "I'm OK" << std::endl;
}
程式輸出:
A::A(std::string)
A::~A()
A::~A()
I'm OK
看來編譯器並不領情,即使我們呼叫了解構函式,變數離開作用域時還會再呼叫一次。儘管在MSVC和GCC中,I'm OK
都成功輸出了,std::string
都挺住了錯誤的析構,但是這個程式的行為仍然是未定義的。
因此,定位new
語句與解構函式的顯式呼叫必須配對