C++中指標與引用詳解
在計算機儲存資料時必須要知道三個基本要素:資訊儲存在何處?儲存的值為多少?儲存的值是什麼型別?因此指標是表示資訊在記憶體中儲存地址的一類特殊變數,指標和其所指向的變數就像是一個硬幣的兩面。指標一直都是學習C語言的難點,在C++中又多了一個引用的概念。初學時很容易把這兩個概念弄混,下面就來通過一些例子來說明二者之間的差別。
1、指標的宣告
上文中提到,指標和其所指向的變數就像硬幣的兩面,因此通過取址符號"&"
我們可以找到變數的地址,通過解引用符號"*"
可以找到地址記憶體放的變數值。
int data = 10; //聲明瞭一個變數data,並賦初始值10,儲存的值是int型別 int* p_data = &data; //找到 data 在記憶體中存放的位置,即p_data cout << "地址為:" << int(p_data) << "\t 存放的值為:" << data << endl;
輸出結果為:
地址為:8191436 存放的值為:10
地址預設是16進位制,我們在輸出時將其轉換成了int
型別,因此以十進位制輸出。輸出結果翻譯過來就是:在地址編碼為8191436的位置存放了值為10的變數data,再進一步地說,data
與*p_data
表示同一個東西。為了更有助於理解,我們繪製了下圖:
因此從本質上看,指標與普通的變數並沒有什麼太大的區別,只是指標變數可以通過解引用的方式找到指標所對應的地址中存放的數值。假如定義如下:
int data = 10; int* p_data = &data; //定義指向 int 型別的指標 p_data, 儲存的是 int 型別的變數 data的地址,其 int** p_p_data = &p_data; //定義指向 int* 型別的指標 p_p_data, 儲存的是 int* 型別的變數 p_data的地址 cout << "p_data:" << p_data << "\t 存放的值為:" << *p_data << endl; cout << "p_p_data:" << p_p_data << "\t 存放的值為:" << *p_p_data << endl;
輸出結果為:
p_data:00EFF96C 存放的值為:10
p_p_data:00EFF960 存放的值為:00EFF96C
從輸出結果可以看出,p_p_data
中儲存的值就是p_data
,而p_data
中儲存的值就是data
,很像”我愛她,她愛他“的這種橋段。下面我們就重點分析一下變數與指標之間的關係:我們在上述例子中把指標初始化為變數的地址,而變數是在編譯時分配的有名稱的記憶體,指標只是為可以通過名稱直接訪問的記憶體提供了一個別名。還拿上面這個例子:對程式設計師來說,變數10的名字就是data;而對於計算機來說,變數10就是存在 8191436 地址的資料;實現程式設計師與計算機溝通的方式就是指標,通過對data取址讓程式設計師能夠明白計算機的儲存結構,同樣,通過對地址解引用,也能輕鬆地找到該地址中儲存的資料。在上述情況下,指標的出現顯得有些多餘,然而指標的真正用武之地在於,在執行階段分配未命名的記憶體以儲存值,在這種情況下,只能通過指標來訪問記憶體。
最後關於指標宣告的一點建議:在宣告一個指標變數時,必須要指定一個確定的地址,否則宣告的指標變數不知道指向哪裡,因此容易造成系統崩潰。
2、使用new
來分配記憶體
記憶體四區之程式碼區,全域性區,棧區和堆區 - ZhiboZhao - 部落格園 (cnblogs.com) 中提到過,new
會在堆區建立一個記憶體空間,其返回值就是該記憶體空間的地址,因此程式設計師的責任就是將該地址賦給一個指標。下面是一個示例:
int* p_data = new int; //在堆區開闢一個空間,並返回該記憶體空間的地址
*p_data = 10; //將向該記憶體中儲存數值10
cout << "p_data:\t" << p_data << "\t *p_data: " << *p_data << endl;
通過比較會發現,new
後面指定了資料型別 int
,同樣地,p_data
也被宣告為指向 int
的指標。這是因為,計算機的記憶體是以位元組為儲存單位,不同型別的變數會佔用不同的位元組,因此使用 new
時必須要告訴編譯器分配多少位元組的儲存空間,並且接收的指標也必須與宣告的型別一致。輸出結果為:
p_data: 00D0D9A0 *p_data: 10
當處理大型資料,比如陣列時,通常會使用的一種方法是定義一個數組型別的資料,在定義的時候分配足夠大的空間。但是這種做法太過於死板,但是當使用 new
時,如果在執行階段需要陣列,那麼則建立它,如果不需要則不建立,最重要的是可以在程式執行時選擇陣列的長度。 下面就看一下如何使用 new
來建立動態陣列。在C++中,陣列名被解釋為陣列地址,即陣列第一個元素的地址。下面是一個例項:
int Arr[10]; // 定義一個包含10個int型別元素的陣列
cout << "Arr:" << Arr << "\t&Arr[0]:" << &Arr[0] <<endl;
輸出結果為:
Arr:008FFAB4 &Arr[0]:008FFAB4
這種宣告方式只能在剛開始就宣告固定的陣列長度,在C++中建立動態陣列時,只需要將陣列的元素型別和元素數目告訴給 new
即可,new
的返回值同樣是陣列的首地址。
int ele_num = 10; //臨時指定陣列內元素的個數
int* p_arr = new int [ele_num]; //根據臨時指定的元素個數建立陣列
通過 new
在堆區開闢空間,由程式設計師管理釋放,因此當 new
的記憶體不用後,需要通過 delete
進行變數,使用 delete []
來釋放開闢的陣列空間。程式碼如下:
int* p_data = new int;
*p_data = 10;
cout << "p_data: " << p_data << "\t*p_data:" << *p_data << endl;
int ele_num = 10;
int* p_arr = new int [ele_num];
for(int i = 0; i<9; i++)
*(p_arr+i) = i+2;
cout << "p_arr:" << p_arr << "\t\t*(p_array):";
for(int i = 0; i<9; i++)
cout << *(p_arr + i) << " ";
cout << endl;
delete p_data;
delete [] p_arr;
cout << "\n******使用delete釋放記憶體後......*******" << endl;
cout << "p_data: " << p_data << "\t*p_data:" << *p_data << endl;
cout << "p_arr:" << p_arr << "\t\t*(p_array):";
for(int i = 0; i<9; i++)
cout << *(p_arr + i) << " ";
cout << endl;
輸出結果如下:
p_data: 0082B1C8 *p_data:10
p_arr:0082BB58 *(p_array):2 3 4 5 6 7 8 9 10
******使用delete釋放記憶體後......*******
p_data: 0082B1C8 *p_data:-572662307
p_arr:0082BB58 *(p_array):-572662307 -572662307 -572662307 -572662307 -572662307 -572662307 -572662307 -572662307 -572662307
3、malloc 與 new 的區別
學過C語言的朋友都知道,在C語言中通過malloc
函式開闢一塊記憶體空間,malloc
的函式原型如下:
void* malloc(unsigned int numbytes);
從函式原型的引數可以看出,malloc
函式以位元組數為引數,開闢固定位元組的記憶體空間。這與 new
就有了第一點不同:new
不需要自己計算位元組數,只需要給定記憶體中儲存的資料型別與元數個數即可。
從函式原型的返回型別可以看出,malloc
函式返回 void*
型別,需要我們在使用時自己指定指標型別。比如:
int* p_malloc = nullptr; // 建立一個指向int的指標
p_malloc = (int*) malloc(10); //將 malloc 的返回值強制轉換為 int* 型別
而 new
在使用時則不需要。總結看來,malloc
在使用時需要自己根據記憶體中的資料型別以及記憶體長度計算處所需要的位元組數,然後返回 void*
型別,需要使用對應型別的指標進行接收。而 new
在使用時只需要給定記憶體的長度與記憶體中資料的型別,編譯器會自動計算所需要的位元組數。
4、引用的宣告與本質
C++中新增了引用作為已定義的變數的別名。引用的最主要用途是作為函式形參,這樣函式就可以使用原始資料而不是資料副本,這樣聽起來似乎與指標沒什麼區別,我們還是從引用的宣告說起。
int data = 10;
int& p_data = data; //建立一個引用變數 p_data
cout << "data:" << data << "\tp_data:" << p_data << endl; //p_data 與 data 相當於一個變數的兩個名字
輸出結果為:
data:10 p_data:10
從輸出結果來看,p_data
與 data
就是一個變數的兩個不同叫法而已。引用必須在宣告時就為其指定初始值,而不能像指標一樣可以先宣告,再賦值。下面將引用作為函式的引數來進一步說明引用與指標的區別:
template <typename T> //定義一個模板函式
void swap(T a, T b){
int temp;
temp = a;
a = b;
b = temp;
}
int main(void){
int a = 10, b = 20;
swap_value<int>(a,b); //首先進行值傳遞
cout << "a:" << a << "\t\tb:" << b << endl;
swap_value<int&>(a,b); //然後進行引用傳遞
cout << "\na:" << a << "\t\tb:" << b << endl;
}
從上述程式碼中可以看到,值傳遞和引用傳遞的形參都是一樣的,不同的是引用傳遞時,實參被宣告為引用,引用的用法與使用值一模一樣,輸出結果如下:
a:10 b:20
a:20 b:10
驚奇的發現,引用傳遞改變了原始資料的值,這點與指標的用法一致,但是指標在書寫 swap
函式時應該這樣寫:
void swap(int* a, int* b){
int temp;
temp = *a;
*a = *b;
*b = temp;
}
swap(&a, &b); //呼叫格式
綜上發現,引用其實就是變數的另一個名稱,它的用法與變數一模一樣,但是能在作為形參傳遞時,改變原始資料的值。除了這些用法上的區別,引用的本質其實就是一個指標常量,意味著指標指向的位置不可變,但是指標指向位置的值可變。即:
// 這兩者的語句是等效的,因此引用被當作指標常量來處理
int& p_a = a;
int* const p_a=&a;
再補充一點小知識,關於 const
修飾符的問題,有些新手朋友來說很容易弄不清楚 const
修飾下什麼是可變的,什麼是不可變的。具體例項如下:
int data = 10, data2 = 20;
const int* p_data = &data; //修飾的是int,即 p_data 所指向的值不可變,而p_data可變
p_data = &data2;
int* const p_data2 = &data; //修飾的是int*,即 p_data 所指向的值可變,而p_data不可變
*p_data2 = data2;
引用即是第二種用法。