1. 程式人生 > >定位new表示式與顯式呼叫解構函式

定位new表示式與顯式呼叫解構函式

C++的核心理念之一是RAII,Resource Acquisition Is Initialization,資源獲取即初始化。資源有很多種,記憶體、互斥鎖、檔案、套接字等;RAII可以用來實現一種與作用域繫結的資源管理方法(如std::lock_guard);這些都不在本文的討論範圍之內。

記憶體是一種資源。從字面上來看,“資源獲取”是指在棧或堆上開闢空間,“初始化”是指呼叫建構函式,“即”的意思是兩者是繫結起來的。對應地,資源銷燬即釋放。這種機制保證了任何函式訪問引數物件時不會訪問到非法地址,除了構造和解構函式以外的任何函式的引數都不會是未初始化的。

然而,C++作為能夠面向底層的語言,允許我們把記憶體獲取與初始化分開來:std::malloc

std::free用於分配和釋放記憶體,定位new表示式和解構函式的顯式呼叫用於初始化和銷燬物件。

malloc與free

std::malloc用於分配記憶體,std::free用於釋放記憶體,兩者都定義在<cstdlib>中:

void* malloc(std::size_t size);
void free(void* ptr);

比如,我想要分配一個int的動態記憶體,就應該給size填上sizeof(int),返回值就是指向那個int的指標。如果是陣列,就給size乘上元素個數。注意在C++中,從void*T*的轉換不能是隱式的。

要回收它,把指標傳給free,不需要size

#include <iostream>
#include <cstdlib>

int main()
{
    auto p = static_cast<int*>(std::malloc(sizeof(int) * 10));
    p[0] = 1;
    p[1] = 2;
    std::cout << p[0] << ' ' << p[1] << std::endl;
    std::free(p);
}

如果std::malloc過程中發生了錯誤,比如記憶體不足,std::malloc會返回NULL

nullptr的前身。實際使用時都應該考慮這種情況。

std::malloc得到的記憶體必須用free釋放。std::malloc/std::free的記憶體分配與new/delete不互通。

定位new表示式

std::malloc分配的記憶體是未經初始化的,對於int等內建型別可以直接使用,而類型別則未必,需要先初始化才能使用。

我們知道,類的非靜態成員函式都有一個隱式的this指標作為引數,建構函式也不例外,在未初始化的記憶體上構造物件,就是把這塊記憶體的指標作為this傳入建構函式。不幸的是,沒有顯式呼叫建構函式這種語法:

auto ptr = static_cast<A*>(std::malloc(sizeof(A)));
ptr->A("hello"); // error

(在MSVC中,ptr->A::A("hello");是合法的,但這是非標準的。)

我們需要定位new,它定義在<new>中,需要#include以後才能使用:

void* operator new(std::size_t, void*);

new運算子是可以過載的,new運算子的功能是為new表示式中的建構函式提供this指標。但是定位new不行,它總是忠實地返回它的第二個引數。

定位new表示式有以下形式:

new (ptr) Type;
new (ptr) Type(args);
new (ptr) Type[size];
new (ptr) Type[size]{list};

ptr為要當作this的指標,Type為要構造的型別,args為可能為空的引數列表,size為陣列大小(可以動態),list為陣列元素列表。

利用定位new,把ptr作為this的建構函式可以這樣呼叫:

#include <iostream>
#include <cstdlib>
#include <string>
#include <utility>

class A
{
public:
    A(std::string s) : string(std::move(s))
    {
        std::cout << "A::A(std::string)" << std::endl;
    }
    std::string& get()
    {
        return string;
    }
private:
    std::string string;
};

int main()
{
    auto ptr = static_cast<A*>(std::malloc(sizeof(A)));
//  std::cout << ptr->get() << std::endl; // disaster
//  ptr->A("hello");                      // error
    new (ptr) A("hello");
    std::cout << ptr->get() << std::endl;
//  delete ptr;                           // disaster
    // what's next?
}

不要因為ptr簡單就不加括號,括號不是為了什麼運算子優先順序,而是定位new表示式的一部分。

剛才不是說std::mallocnew不互通嗎?怎麼在std::malloc來的ptr上用定位new了呢?因為定位new根本不插手記憶體分配,和std::malloc是兩回事。

定位new不止可以用於std::malloc來的動態記憶體,甚至可以是區域性變數:

char buffer[sizeof(A)];
auto ptr = new (buffer) A("hello");
std::cout << ptr->get() << std::endl;

與常規的new一樣,定位new表示式也返回一個指標,就是Type*型別的ptr

顯式呼叫解構函式

上面通過std::malloc得到的ptr,為什麼不能直接std::free呢?因為std::string裡面的資源還沒釋放,正確的做法是呼叫A的解構函式。

不能對一個物件呼叫建構函式,那麼解構函式呢?答案是肯定的。只是~在形式上有點怪,尤其是當你把模板引數T換成int後得到ptr->~int()時,後者直接寫是不合法的。

所以對於上面的ptr,要這樣才能釋放所有資源:

ptr->~A();
std::free(ptr);

顯式呼叫解構函式,就像在幫編譯器做事情一樣。編譯器會不會領情呢?寫個程式碼測試一下吧:

#include <iostream>
#include <string>
#include <utility>

class A
{
public:
    A(std::string s) : string(std::move(s))
    {
        std::cout << "A::A(std::string)" << std::endl;
    }
    std::string& get()
    {
        std::cout << "A::get()" << std::endl;
        return string;
    }
    ~A()
    {
        std::cout << "A::~A()" << std::endl;
    }
private:
    std::string string;
};

int main()
{
    {
        A a("");
        a.~A();
    }
    std::cout << "I'm OK" << std::endl;
}

程式輸出:

A::A(std::string)
A::~A()
A::~A()
I'm OK

看來編譯器並不領情,即使我們呼叫了解構函式,變數離開作用域時還會再呼叫一次。儘管在MSVC和GCC中,I'm OK都成功輸出了,std::string都挺住了錯誤的析構,但是這個程式的行為仍然是未定義的。

因此,定位new語句與解構函式的顯式呼叫必須配對