C++中指標和引用的區別
下面用通俗易懂的話來概述一下:
-
指標-對於一個型別T,T*就是指向T的指標型別,也即一個T*型別的變數能夠儲存一個T物件的地址,而型別T是可以加一些限定詞的,如const、volatile等等。見下圖,所示指標的含義:
-
引用-引用是一個物件的別名,主要用於函式引數和返回值型別,符號X&表示X型別的引用。見下圖,所示引用的含義:
2、指標和引用的區別
-
首先,引用不可以為空,但指標可以為空。前面也說過了引用是物件的別名,引用為空——物件都不存在,怎麼可能有別名!故定義一個引用的時候,必須初始化。因此如果你有一個變數是用於指向另一個物件,但是它可能為空,這時你應該使用指標;如果變數總是指向一個物件,i.e.,你的設計不允許變數為空,這時你應該使用引用。如下圖中,如果定義一個引用變數,不初始化的話連編譯都通不過(編譯時錯誤):
而宣告指標是可以不指向任何物件,也正是因為這個原因,使用指標之前必須做判空操作,而引用就不必。
-
其次,引用不可以改變指向,對一個物件"至死不渝";但是指標可以改變指向,而指向其它物件。說明:雖然引用不可以改變指向,但是可以改變初始化物件的內容。例如就++操作而言,對引用的操作直接反應到所指向的物件,而不是改變指向;而對指標的操作,會使指標指向下一個物件,而不是改變所指物件的內容。見下面的程式碼:
#include<iostream>
using namespace std;
int main(int argc,char** argv)
{
int i=10;
int& ref=i;
ref++;
cout<<"i="<<i<<endl;
cout<<"ref="<<ref<<endl;
int j=20;
ref=j;
ref++;
cout<<"i="<<i<<endl;
cout<<"ref="<<ref<<endl;
cout<<"j="<<j<<endl;
return
}
對ref的++操作是直接反應到所指變數之上,對引用變數ref重新賦值"ref=j",並不會改變ref的指向,它仍然指向的是i,而不是j。理所當然,這時對ref進行++操作不會影響到j。而這些換做是指標的話,情況大不相同,請自行實驗。輸出結果如下:
-
再次,引用的大小是所指向的變數的大小,因為引用只是一個別名而已;指標是指標本身的大小,4個位元組。見下圖所示:
從上面也可以看出:引用比指標使用起來形式上更漂亮,使用引用指向的內容時可以之間用引用變數名,而不像指標一樣要使用*;定義引用的時候也不用像指標一樣使用&取址。
- 最後,引用比指標更安全。由於不存在空引用,並且引用一旦被初始化為指向一個物件,它就不能被改變為另一個物件的引用,因此引用很安全。對於指標來說,它可以隨時指向別的物件,並且可以不被初始化,或為NULL,所以不安全。const 指標雖然不能改變指向,但仍然存在空指標,並且有可能產生野指標(即多個指標指向一塊記憶體,free掉一個指標之後,別的指標就成了野指標)。
總而言之,言而總之——它們的這些差別都可以歸結為"指標指向一塊記憶體,它的內容是所指記憶體的地址;而引用則是某塊記憶體的別名,引用不改變指向。"
3、特別之處const
在這裡我為什麼要提到const關鍵字呢?因為const對指標和引用的限定是有差別的,下面聽我一一到來。
- 常量指標VS常量引用
常量指標:指向常量的指標,在指標定義語句的型別前加const,表示指向的物件是常量。
定義指向常量的指標只限制指標的間接訪問操作,而不能規定指標指向的值本身的操作規定性。
常量指標定義"const int* pointer=&a"告訴編譯器,*pointer是常量,不能將*pointer作為左值進行操作。
常量引用:指向常量的引用,在引用定義語句的型別前加const,表示指向的物件是常量。也跟指標一樣不能利用引用對指向的變數進行重新賦值操作。
- 指標常量VS引用常量
在指標定義語句的指標名前加const,表示指標本身是常量。在定義指標常量時必須初始化!而這是引用天生具來的屬性,不用再引用指標定義語句的引用名前加const。
指標常量定義"int* const pointer=&b"告訴編譯器,pointer是常量,不能作為左值進行操作,但是允許修改間接訪問值,即*pointer可以修改。
- 常量指標常量VS常量引用常量
常量指標常量:指向常量的指標常量,可以定義一個指向常量的指標常量,它必須在定義時初始化。常量指標常量定義"const int* const pointer=&c"告訴編譯器,pointer和*pointer都是常量,他們都不能作為左值進行操作。
而就不存在所謂的"常量引用常量",因為跟上面講的一樣引用變數就是引用常量。C++不區分變數的const引用和const變數的引用。程式決不能給引用本身重新賦值,使他指向另一個變數,因此引用總是const的。如果對引用應用關鍵字const,起作用就是使其目標稱為const變數。即沒有:Const double const& a=1;只有const double& a=1;
總結:有一個規則可以很好的區分const是修飾指標,還是修飾指標指向的資料——畫一條垂直穿過指標宣告的星號(*),如果const出現線上的左邊,指標指向的資料為常量;如果const出現在右邊,指標本身為常量。而引用本身與天俱來就是常量,即不可以改變指向。
4、指標和引用的實現
我們利用下面一段簡單的程式碼來深入分析指標和引用:
#include<iostream>
using namespace std;
int main(int argc, char** argv)
{
int i=1;
int& ref=i;
int x=ref;
cout<<"x is "<<x<<endl;
ref=2;
int* p=&i;
cout<<"ref = "<<ref<<", i = "<<i<<endl;
}
上面的程式碼用g++ test.c編譯之後,然後反彙編objdump -d a.out,得到main函式的一段彙編程式碼如下:
08048714 <main>: 8048714: 55 push %ebp 8048715: 89 e5 mov %esp,%ebp 8048717: 83 e4 f0 and $0xfffffff0,%esp//為main函式的引數argc、argv保留位置 804871a: 56 push %esi 804871b: 53 push %ebx 804871c: 83 ec 28 sub $0x28,%esp 804871f: c7 44 24 1c 01 00 00 movl $0x1,0x1c(%esp) //將0x1存到esp暫存器中,即int i=1 8048726: 00
804872b: 89 44 24 18 mov %eax,0x18(%esp)//將暫存器eax中的內容(i的地址)傳給暫存器中的變數ref,即int& ref=i 804872f: 8b 44 24 18 mov 0x18(%esp),%eax//將暫存器esp中的ref傳給eax,即i的地址 8048733: 8b 00 mov (%eax),%eax//以暫存器eax中的值作為地址,取出值給eax 8048735: 89 44 24 14 mov %eax,0x14(%esp) //將暫存器eax中的值傳給暫存器esp中的x,即x=ref 8048739: c7 44 24 04 00 89 04 movl $0x8048900,0x4(%esp) 8048740: 08 8048741: c7 04 24 40 a0 04 08 movl $0x804a040,(%esp) 8048748: e8 cb fe ff ff call 8048618 <[email protected]> 804874d: 8b 54 24 14 mov 0x14(%esp),%edx 8048751: 89 54 24 04 mov %edx,0x4(%esp) 8048755: 89 04 24 mov %eax,(%esp) 8048758: e8 5b fe ff ff call 80485b8 <[email protected]> 804875d: c7 44 24 04 38 86 04 movl $0x8048638,0x4(%esp) 8048764: 08 8048765: 89 04 24 mov %eax,(%esp) 8048768: e8 bb fe ff ff call 8048628 <[email protected]>//從8048739~8048768這些行就是執行"cout<<"x is "<<x<<endl;" 804876d: 8b 44 24 18 mov 0x18(%esp),%eax//將暫存器esp中的ref傳到eax中 8048771: c7 00 02 00 00 00 movl $0x2,(%eax) //將0x2存到eax暫存器中 8048777: 8d 44 24 1c lea 0x1c(%esp),%eax// esp暫存器裡的變數i的地址傳給eax 804877b: 89 44 24 10 mov %eax,0x10(%esp) //將暫存器eax中的內容(即i的地址)傳到暫存器esp中的p 804877f: 8b 5c 24 1c mov 0x1c(%esp),%ebx 8048783: 8b 44 24 18 mov 0x18(%esp),%eax 8048787: 8b 30 mov (%eax),%esi 8048789: c7 44 24 04 06 89 04 movl $0x8048906,0x4(%esp) 8048790: 08 8048791: c7 04 24 40 a0 04 08 movl $0x804a040,(%esp) 8048798: e8 7b fe ff ff call 8048618 <[email protected]> 804879d: 89 74 24 04 mov %esi,0x4(%esp) 80487a1: 89 04 24 mov %eax,(%esp) 80487a4: e8 0f fe ff ff call 80485b8 <[email protected]> 80487a9: c7 44 24 04 0d 89 04 movl $0x804890d,0x4(%esp) 80487b0: 08 80487b1: 89 04 24 mov %eax,(%esp) 80487b4: e8 5f fe ff ff call 8048618 <[email protected]> 80487b9: 89 5c 24 04 mov %ebx,0x4(%esp) 80487bd: 89 04 24 mov %eax,(%esp) 80487c0: e8 f3 fd ff ff call 80485b8 <[email protected]> 80487c5: c7 44 24 04 38 86 04 movl $0x8048638,0x4(%esp) 80487cc: 08 80487cd: 89 04 24 mov %eax,(%esp) 80487d0: e8 53 fe ff ff call 8048628 <[email protected]>//這些行就是執行"cout<<"ref = "<<ref<<", i = "<<i<<endl;" 80487d5: b8 00 00 00 00 mov $0x0,%eax 80487da: 83 c4 28 add $0x28,%esp 80487dd: 5b pop %ebx 80487de: 5e pop %esi 80487df: 89 ec mov %ebp,%esp 80487e1: 5d pop %ebp 80487e2: c3 ret |
從彙編程式碼可以看出實際上指標和引用在編譯器中的實現是一樣的:
- 引用int& ref=i;
8048727: 8d 44 24 1c lea 0x1c(%esp),%eax// esp暫存器裡的變數i的地址傳給eax
804872b: 89 44 24 18 mov %eax,0x18(%esp)//將暫存器eax中的內容(i的地址)傳給暫存器中的變數ref,即int& ref=i
- 指標int* p=&i;
8048777: 8d 44 24 1c lea 0x1c(%esp),%eax// esp暫存器裡的變數i的地址傳給eax
804877b: 89 44 24 10 mov %eax,0x10(%esp) //將暫存器eax中的內容(即i的地址)傳到暫存器esp中的p
雖然指標和引用最終在編譯中的實現是一樣的,但是引用的形式大大方便了使用也更安全。有人說:"引用只是一個別名,不會佔記憶體空間?"通過這個事實我們可以揭穿這個謊言!實際上引用也是佔記憶體空間的。
5、指標傳遞和引用傳遞
為了更好的理解指標和引用,我們下面來介紹一下指標傳遞和引用傳遞。當指標和引用作為函式的函式是如何傳值的呢?(下面這一段引用了C++中引用傳遞與指標傳遞區別(進一步整理))
- 指標傳遞引數本質上是值傳遞的方式,它所傳遞的是一個地址值。值傳遞過程中,被調函式的形式引數作為被調函式的區域性變數處理,即在棧中開闢了記憶體空間以存放由主調函式放進來的實參的值,從而成為了實參的一個副本。值傳遞的特點是被調函式對形式引數的任何操作都是作為區域性變數進行,不會影響主調函式的實參變數的值。
- 引用傳遞過程中,被調函式的形式引數也作為區域性變數在棧中開闢了記憶體空間,但是這時存放的是由主調函式放進來的實參變數的地址。被調函式對形參的任何操作都被處理成間接定址,即通過棧中存放的地址訪問主調函式中的實參變數。正因為如此,被調函式對形參做的任何操作都影響了主調函式中的實參變數。
引用傳遞和指標傳遞是不同的,雖然它們都是在被調函式棧空間上的一個區域性變數,但是任何對於引用引數的處理都會通過一個間接定址的方式操作到主調函式中的相關變數。而對於指標傳遞的引數,如果改變被調函式中的指標地址,它將影響不到主調函式的相關變數。如果想通過指標引數傳遞來改變主調函式中的相關變數,那就得使用指向指標的指標,或者指標引用。
從概念上講。指標從本質上講就是存放變數地址的一個變數,在邏輯上是獨立的,它可以被改變,包括其所指向的地址的改變和其指向的地址中所存放的資料的改變。
而引用是一個別名,它在邏輯上不是獨立的,它的存在具有依附性,所以引用必須在一開始就被初始化,而且其引用的物件在其整個生命週期中是不能被改變的(自始至終只能依附於同一個變數)。
在C++中,指標和引用經常用於函式的引數傳遞,然而,指標傳遞引數和引用傳遞引數是有本質上的不同的:
指標傳遞引數本質上是值傳遞的方式,它所傳遞的是一個地址值。值傳遞過程中,被調函式的形式引數作為被調函式的區域性變數處理,即在棧中開闢了記憶體空間以存放由主調函式放進來的實參的值,從而成為了實參的一個副本。值傳遞的特點是被調函式對形式引數的任何操作都是作為區域性變數進行,不會影響主調函式的實參變數的值。(這裡是在說實參指標本身的地址值不會變)
而在引用傳遞過程中,被調函式的形式引數雖然也作為區域性變數在棧中開闢了記憶體空間,但是這時存放的是由主調函式放進來的實參變數的地址。被調函式對形參的任何操作都被處理成間接定址,即通過棧中存放的地址訪問主調函式中的實參變數。正因為如此,被調函式對形參做的任何操作都影響了主調函式中的實參變數。
引用傳遞和指標傳遞是不同的,雖然它們都是在被調函式棧空間上的一個區域性變數,但是任何對於引用引數的處理都會通過一個間接定址的方式操作到主調函式中的相關變數。而對於指標傳遞的引數,如果改變被調函式中的指標地址,它將影響不到主調函式的相關變數。如果想通過指標引數傳遞來改變主調函式中的相關變數,那就得使用指向指標的指標,或者指標引用。
為了進一步加深大家對指標和引用的區別,下面我從編譯的角度來闡述它們之間的區別:
程式在編譯時分別將指標和引用新增到符號表上,符號表上記錄的是變數名及變數所對應地址。指標變數在符號表上對應的地址值為指標變數的地址值,而引用在符號表上對應的地址值為引用物件的地址值。符號表生成後就不會再改,因此指標可以改變其指向的物件(指標變數中的值可以改),而引用物件則不能修改。
最後,總結一下指標和引用的相同點和不同點:
★相同點:
●都是地址的概念;
指標指向一塊記憶體,它的內容是所指記憶體的地址;而引用則是某塊記憶體的別名。
★不同點:
●指標是一個實體,而引用僅是個別名;
●引用只能在定義時被初始化一次,之後不可變;指標可變;引用“從一而終”,指標可以“見異思遷”;
●引用沒有const,指標有const,const的指標不可變;(具體指沒有int& const a這種形式,而const int& a是有 的, 前者指引用本身即別名不可以改變,這是當然的,所以不需要這種形式,後者指引用所指的值不可以改變)
●引用不能為空,指標可以為空;
●“sizeof 引用”得到的是所指向的變數(物件)的大小,而“sizeof 指標”得到的是指標本身的大小;
●指標和引用的自增(++)運算意義不一樣;
●引用是型別安全的,而指標不是 (引用比指標多了型別檢查
一、引用的概念 引用引入了物件的一個同義詞。定義引用的表示方法與定義指標相似,只是用&代替了*。 例如: Point pt1(10,10); Point &pt2=pt1; 定義了pt2為pt1的引用。通過這樣的定義,pt1和pt2表示同一物件。 需要特別強調的是引用並不產生物件的副本,僅僅是物件的同義詞。因此,當下面的語句執行後: pt1.offset(2,2); pt1和pt2都具有(12,12)的值。 引用必須在定義時馬上被初始化,因為它必須是某個東西的同義詞。你不能先定義一個引用後才 初始化它。例如下面語句是非法的: Point &pt3; pt3=pt1; 那麼既然引用只是某個東西的同義詞,它有什麼用途呢? 下面討論引用的兩個主要用途:作為函式引數以及從函式中返回左值。 二、引用引數 1、傳遞可變引數 傳統的c中,函式在呼叫時引數是通過值來傳遞的,這就是說函式的引數不具備返回值的能力。 所以在傳統的c中,如果需要函式的引數具有返回值的能力,往往是通過指標來實現的。比如,實現 兩整數變數值交換的c程式如下: void swapint(int *a,int *b) { int temp; temp=*a; a=*b; *b=temp; } 使用引用機制後,以上程式的c++版本為: void swapint(int &a,int &b) { int temp; temp=a; a=b; b=temp; } 呼叫該函式的c++方法為:swapint(x,y); c++自動把x,y的地址作為引數傳遞給swapint函式。 2、給函式傳遞大型物件 當大型物件被傳遞給函式時,使用引用引數可使引數傳遞效率得到提高,因為引用並不產生物件的 副本,也就是引數傳遞時,物件無須複製。下面的例子定義了一個有限整數集合的類: const maxCard=100; Class Set { int elems[maxCard]; // 集和中的元素,maxCard 表示集合中元素個數的最大值。 int card; // 集合中元素的個數。 public: Set () {card=0;} //建構函式 friend Set operator * (Set ,Set ) ; //過載運算子號*,用於計算集合的交集 用物件作為傳值引數 // friend Set operator * (Set & ,Set & ) 過載運算子號*,用於計算集合的交集 用物件的引用作為傳值引數 ... } 先考慮集合交集的實現 Set operator *( Set Set1,Set Set2) { Set res; for(int i=0;i<Set1.card;++i) for(int j=0;j>Set2.card;++j) if(Set1.elems[i]==Set2.elems[j]) { res.elems[res.card++]=Set1.elems[i]; break; } return res; } 由於過載運算子不能對指標單獨操作,我們必須把運算數宣告為 Set 型別而不是 Set * 。 每次使用*做交集運算時,整個集合都被複制,這樣效率很低。我們可以用引用來避免這種情況。 Set operator *( Set &Set1,Set &Set2) { Set res; for(int i=0;i<Set1.card;++i) for(int j=0;j>Set2.card;++j) if(Set1.elems[i]==Set2.elems[j]) { res.elems[res.card++]=Set1.elems[i]; break; } return res; } 三、引用返回值 如果一個函式返回了引用,那麼該函式的呼叫也可以被賦值。這裡有一函式,它擁有兩個引用引數並返回一個雙精度數的引用: double &max(double &d1,double &d2) { return d1>d2?d1:d2; } 由於max()函式返回一個對雙精度數的引用,那麼我們就可以用max() 來對其中較大的雙精度數加1: max(x,y)+=1.0; |