典型C語言指標詳解
一、細說指標
指標是一個特殊的變數,它裡面儲存的數值被解釋成為記憶體裡的一個地址。要搞清一個指標需要搞清指標的四方面的內容:指標的型別、指標所指向的型別、指標的值或者叫指標所指向的記憶體區、指標本身所佔據的記憶體區。讓我們分別說明。
先宣告幾個指標放著做例子:
例一:
(1)int*ptr;
(2)char*ptr;
(3)int**ptr;
(4)int(*ptr)[3];
(5)int*(*ptr)[4];
1.指標的型別
從語法的角度看,你只要把指標宣告語句裡的指標名字去掉,剩下的部分就是這個指標的型別。這是指標本身所具有的型別。讓我們看看例一中各個指標的型別:
(1)int*ptr;//指標的型別是int*
(2)char*ptr;//指標的型別是char*
(3)int**ptr;//指標的型別是int**
(4)int(*ptr)[3];//指標的型別是int(*)[3]
(5)int*(*ptr)[4];//指標的型別是int*(*)[4]
怎麼樣?找出指標的型別的方法是不是很簡單?
2.指標所指向的型別
當你通過指標來訪問指標所指向的記憶體區時,指標所指向的型別決定了編譯器將把那片記憶體區裡的內容當做什麼來看待。
從語法上看,你只須把指標宣告語句中的指標名字和名字左邊的指標宣告符*去掉,剩下的就是指標所指向的型別。例如:
(1)int*ptr; //指標所指向的型別是int
(2)char*ptr; //指標所指向的的型別是char
(3)int**ptr; //指標所指向的的型別是int*
(4)int(*ptr)[3]; //指標所指向的的型別是int()[3]
(5)int*(*ptr)[4]; //指標所指向的的型別是int*()[4]
在指標的算術運算中,指標所指向的型別有很大的作用。
指標的型別(即指標本身的型別)和指標所指向的型別是兩個概念。當你對C 越來越熟悉時,你會發現,把與指標攪和在一起的"型別"這個概念分成"指標的型別"和"指標所指向的型別"兩個概念,是精通指標的關鍵點之一。我看了不少書,發現有些寫得差的書中,就把指標的這兩個概念攪在一起了,所以看起書來前後矛盾,越看越糊塗。
3.指標的值----或者叫指標所指向的記憶體區或地址
指標的值是指標本身儲存的數值,這個值將被編譯器當作一個地址,而不是一個一般的數值。在32 位程式裡,所有型別的指標的值都是一個32 位整數,因為32 位程式裡記憶體地址全都是32 位長。指標所指向的記憶體區就是從指標的值所代表的那個記憶體地址開始,長度為si zeof(指標所指向的型別)的一片記憶體區。以後,我們說一個指標的值是XX,就相當於說該指標指向了以XX 為首地址的一片記憶體區域;我們說一個指標指向了某塊記憶體區域,就相當於說該指標的值是這塊記憶體區域的首地址。指標所指向的記憶體區和指標所指向的型別是兩個完全不同的概念。在例一中,指標所指向的型別已經有了,但由於指標還未初始化,所以它所指向的記憶體區是不存在的,或者說是無意義的。
以後,每遇到一個指標,都應該問問:這個指標的型別是什麼?指標指的型別是什麼?該指標指向了哪裡?(重點注意)
4 指標本身所佔據的記憶體區
指標本身佔了多大的記憶體?你只要用函式sizeof(指標的型別)測一下就知道了。在32 位平臺裡,指標本身佔據了4 個位元組的長度。指標本身佔據的記憶體這個概念在判斷一個指標表示式(後面會解釋)是否是左值時很有用。
二、指標的算術運算
指標可以加上或減去一個整數。指標的這種運算的意義和通常的數值的加減運算的意義是不一樣的,以單元為單位。例如:
例二:
char a[20];
int *ptr=(int *)a; //強制型別轉換並不會改變a 的型別
ptr++;
在上例中,指標ptr 的型別是int*,它指向的型別是int,它被初始化為指向整型變數a。接下來的第3句中,指標ptr被加了1,編譯器是這樣處理的:它把指標ptr 的值加上了sizeof(int),在32 位程式中,是被加上了4,因為在32 位程式中,int 佔4 個位元組。由於地址是用位元組做單位的,故ptr 所指向的地址由原來的變數a 的地址向高地址方向增加了4 個位元組。由於char 型別的長度是一個位元組,所以,原來ptr 是指向陣列a 的第0 號單元開始的四個位元組,此時指向了陣列a 中從第4 號單元開始的四個位元組。我們可以用一個指標和一個迴圈來遍歷一個數組,看例子:
例三:
int array[20]={0};
int *ptr=array;
for(i=0;i<20;i++)
{
(*ptr)++;
ptr++;
}
這個例子將整型陣列中各個單元的值加1。由於每次迴圈都將指標ptr加1 個單元,所以每次迴圈都能訪問陣列的下一個單元。
再看例子:
例四:
char a[20]="You_are_a_girl";
int *ptr=(int *)a;
ptr+=5;
在這個例子中,ptr 被加上了5,編譯器是這樣處理的:將指標ptr 的值加上5 乘sizeof(int),在32 位程式中就是加上了5 乘4=20。由於地址的單位是位元組,故現在的ptr 所指向的地址比起加5 後的ptr 所指向的地址來說,向高地址方向移動了20 個位元組。
在這個例子中,沒加5 前的ptr 指向陣列a 的第0 號單元開始的四個位元組,加5 後,ptr 已經指向了陣列a 的合法範圍之外了。雖然這種情況在應用上會出問題,但在語法上卻是可以的。這也體現出了指標的靈活性。如果上例中,ptr 是被減去5,那麼處理過程大同小異,只不過ptr 的值是被減去5 乘sizeof(int),新的ptr 指向的地址將比原來的ptr 所指向的地址向低地址方向移動了20 個位元組。
下面請允許我再舉一個例子:(一個誤區)
例五:
#include<stdio.h>
int main()
{
char a[20]=" You_are_a_girl";
char *p=a;
char **ptr=&p;
//printf("p=%d\n",p);
//printf("ptr=%d\n",ptr);
//printf("*ptr=%d\n",*ptr);
printf("**ptr=%c\n",**ptr);
ptr++;
//printf("ptr=%d\n",ptr);
//printf("*ptr=%d\n",*ptr);
printf("**ptr=%c\n",**ptr);
}
誤區一、輸出答案為Y 和o
誤解:ptr 是一個char 的二級指標,當執行ptr++;時,會使指標加一個sizeof(char),所以輸出如上結果,這個可能只是少部分人的結果.
誤區二、輸出答案為Y 和a誤解:ptr 指向的是一個char *型別,當執行ptr++;時,會使指標加一個sizeof(char *)(有可能會有人認為這個值為1,那就會得到誤區一的答案,這個值應該是4,參考前面內容), 即&p+4; 那進行一次取值運算不就指向陣列中的第五個元素了嗎?那輸出的結果不就是陣列中第五個元素了嗎?答案是否定的.
正解: ptr 的型別是char **,指向的型別是一個char *型別,該指向的地址就是p的地址(&p),當執行ptr++;時,會使指標加一個sizeof(char*),即&p+4;那*(&p+4)指向哪呢,這個你去問上帝吧,或者他會告訴你在哪?所以最後的輸出會是一個隨機的值,或許是一個非法操作.
總結一下:
一個指標ptrold 加(減)一個整數n 後,結果是一個新的指標ptrnew,ptrnew 的型別和ptrold 的型別相同,ptrnew 所指向的型別和ptrold所指向的型別也相同。ptrnew 的值將比ptrold 的值增加(減少)了n 乘sizeof(ptrold 所指向的型別)個位元組。就是說,ptrnew 所指向的記憶體區將比ptrold 所指向的記憶體區向高(低)地址方向移動了n 乘sizeof(ptrold 所指向的型別)個位元組。指標和指標進行加減:兩個指標不能進行加法運算,這是非法操作,因為進行加法後,得到的結果指向一個不知所向的地方,而且毫無意義。兩個指標可以進行減法操作,但必須型別相同,一般用在陣列方面,不多說了。
三、運算子&和*
這裡&是取地址運算子,*是間接運算子。
&a 的運算結果是一個指標,指標的型別是a 的型別加個*,指標所指向的型別是a 的型別,指標所指向的地址嘛,那就是a 的地址。
*p 的運算結果就五花八門了。總之*p 的結果是p 所指向的東西,這個東西有這些特點:它的型別是p 指向的型別,它所佔用的地址是p所指向的地址。
例六:
int a=12; int b; int *p; int **ptr;
p=&a; //&a 的結果是一個指標,型別是int*,指向的型別是
//int,指向的地址是a 的地址。
*p=24; //*p 的結果,在這裡它的型別是int,它所佔用的地址是
//p 所指向的地址,顯然,*p 就是變數a。
ptr=&p; //&p 的結果是個指標,該指標的型別是p 的型別加個*,
//在這裡是int **。該指標所指向的型別是p 的型別,這
//裡是int*。該指標所指向的地址就是指標p 自己的地址。
*ptr=&b; //*ptr 是個指標,&b 的結果也是個指標,且這兩個指標
//的型別和所指向的型別是一樣的,所以用&b 來給*ptr 賦
//值就是毫無問題的了。
**ptr=34; //*ptr 的結果是ptr 所指向的東西,在這裡是一個指標,
//對這個指標再做一次*運算,結果是一個int 型別的變數。
四、指標表示式
一個表示式的結果如果是一個指標,那麼這個表示式就叫指標表式。
下面是一些指標表示式的例子:
例七:
int a,b;
int array[10];
int *pa;
pa=&a; //&a 是一個指標表示式。
Int **ptr=&pa; //&pa 也是一個指標表示式。
*ptr=&b; //*ptr 和&b 都是指標表示式。
pa=array;
pa++; //這也是指標表示式。
例八:
char *arr[20];
char **parr=arr; //如果把arr 看作指標的話,arr 也是指標表示式
char *str;
str=*parr; //*parr 是指標表示式
str=*(parr+1); //*(parr+1)是指標表示式
str=*(parr+2); //*(parr+2)是指標表示式
由於指標表示式的結果是一個指標,所以指標表示式也具有指標所具有的四個要素:指標的型別,指標所指向的型別,指標指向的記憶體區,指標自身佔據的記憶體。
好了,當一個指標表示式的結果指標已經明確地具有了指標自身佔據的記憶體的話,這個指標表示式就是一個左值,否則就不是一個左值。在例七中,&a 不是一個左值,因為它還沒有佔據明確的記憶體。*ptr 是一個左值,因為*ptr 這個指標已經佔據了記憶體,其實*ptr 就是指標pa,既然pa 已經在記憶體中有了自己的位置,那麼*ptr 當然也有了自己的位置。
五、陣列和指標的關係
陣列的陣列名其實可以看作一個指標。看下例:
例九:
int array[10]={0,1,2,3,4,5,6,7,8,9},value;
value=array[0]; //也可寫成:value=*array;
value=array[3]; //也可寫成:value=*(array+3);
value=array[4]; //也可寫成:value=*(array+4);
上例中,一般而言陣列名array 代表陣列本身,型別是int[10],但如果把array 看做指標的話,它指向陣列的第0 個單元,型別是int* 所指向的型別是陣列單元的型別即int。因此*array 等於0 就一點也不奇怪了。同理,array+3 是一個指向陣列第3 個單元的指標,所以*(array+3)等於3。其它依此類推。
例十:
char *str[3]={
"Hello,thisisasample!",
"Hi,goodmorning.",
"Helloworld"
};
char s[80];
strcpy(s,str[0]); //也可寫成strcpy(s,*str);
strcpy(s,str[1]); //也可寫成strcpy(s,*(str+1));
strcpy(s,str[2]); //也可寫成strcpy(s,*(str+2));
上例中,str 是一個三單元的陣列,該陣列的每個單元都是一個指標,這些指標各指向一個字串。把指標陣列名str 當作一個指標的話,它指向陣列的第0 號單元,它的型別是char **,它指向的型別是char *。
*str 也是一個指標,它的型別是char *,它所指向的型別是char,它指向的地址是字串"Hello,thisisasample!"的第一個字元的地址,即'H'的地址。注意:字串相當於是一個數組,在記憶體中以陣列的形式儲存,只不過字串是一個數組常量,內容不可改變,且只能是右值.如果看成指標的話,他即是常量指標,也是指標常量.
str+1 也是一個指標,它指向陣列的第1 號單元,它的型別是char**,它指向的型別是char*。
*(str+1)也是一個指標,它的型別是char*,它所指向的型別是char,它指向"Hi,goodmorning."的第一個字元'H'
下面總結一下陣列的陣列名(陣列中儲存的也是陣列)的問題:
聲明瞭一個數組TYPE array[n],則陣列名稱array 就有了兩重含義:
第一,它代表整個陣列,它的型別是TYPE[n];
第二,它是一個常量指標,該指標的型別是TYPE*,該指標指向的型別是TYPE,也就是陣列單元的型別,該指標指向的記憶體區就是陣列第0 號單元,該指標自己佔有單獨的記憶體區,注意它和陣列第0 號單元佔據的記憶體區是不同的。該指標的值是不能修改的,即類似array++的表示式是錯誤的。在不同的表示式中陣列名array 可以扮演不同的角色。在表示式sizeof(array)中,陣列名array 代表陣列本身,故這時sizeof 函式測出的是整個陣列的大小。
在表示式*array 中,array 扮演的是指標,因此這個表示式的結果就是陣列第0 號單元的值。sizeof(*array)測出的是陣列單元的大小。
表示式array+n(其中n=0,1,2,.....)中,array 扮演的是指標,故array+n 的結果是一個指標,它的型別是TYPE *,它指向的型別是TYPE,它指向陣列第n號單元。故sizeof(array+n)測出的是指標型別的大小。在32 位程式中結果是4
例十一:
int array[10];
int (*ptr)[10];
ptr=&array;
上例中ptr 是一個指標,它的型別是int(*)[10],他指向的型別是int[10] ,我們用整個陣列的首地址來初始化它。在語句ptr=&array中,array 代表陣列本身。
本節中提到了函式sizeof(),那麼我來問一問,sizeof(指標名稱)測出的究竟是指標自身型別的大小呢還是指標所指向的型別的大小?
答案是前者。例如:
int(*ptr)[10];
則在32 位程式中,有:
sizeof(int(*)[10])==4
sizeof(int[10])==40
sizeof(ptr)==4
實際上,sizeof(物件)測出的都是物件自身的型別的大小,而不是別的什麼型別的大小。
六、指標和結構型別的關係
可以宣告一個指向結構型別物件的指標。
例十二:
struct MyStruct
{
int a;
int b;
int c;
};
struct MyStruct ss={20,30,40};
//聲明瞭結構物件ss,並把ss 的成員初始化為20,30 和40。
struct MyStruct *ptr=&ss;
//聲明瞭一個指向結構物件ss 的指標。它的型別是
//MyStruct *,它指向的型別是MyStruct。
int *pstr=(int*)&ss;
//聲明瞭一個指向結構物件ss 的指標。但是pstr 和
//它被指向的型別ptr 是不同的。
請問怎樣通過指標ptr 來訪問ss 的三個成員變數?
答案:
ptr->a; //指向運算子,或者可以這們(*ptr).a,建議使用前者
ptr->b;
ptr->c;
又請問怎樣通過指標pstr 來訪問ss 的三個成員變數?
答案:
*pstr; //訪問了ss 的成員a。
*(pstr+1); //訪問了ss 的成員b。
*(pstr+2) //訪問了ss 的成員c。
雖然我在我的MSVC++6.0 上調式過上述程式碼,但是要知道,這樣使用pstr 來訪問結構成員是不正規的,為了說明為什麼不正規,讓我們看看怎樣通過指標來訪問陣列的各個單元: (將結構體換成陣列)
例十三:
int array[3]={35,56,37};
int *pa=array;
//通過指標pa 訪問陣列array 的三個單元的方法是:
*pa; //訪問了第0 號單元
*(pa+1); //訪問了第1 號單元
*(pa+2); //訪問了第2 號單元
從格式上看倒是與通過指標訪問結構成員的不正規方法的格式一樣。
所有的C/C++編譯器在排列陣列的單元時,總是把各個陣列單元存放在連續的儲存區裡,單元和單元之間沒有空隙。但在存放結構物件的各個成員時,在某種編譯環境下,可能會需要字對齊或雙字對齊或者是別的什麼對齊,需要在相鄰兩個成員之間加若干個"填充位元組",這就導致各個成員之間可能會有若干個位元組的空隙。
所以,在例十二中,即使*pstr 訪問到了結構物件ss 的第一個成員變數a,也不能保證*(pstr+1)就一定能訪問到結構成員b。因為成員a 和成員b 之間可能會有若干填充位元組,說不定*(pstr+1)就正好訪問到了這些填充位元組呢。這也證明了指標的靈活性。要是你的目的就是想看看各個結構成員之間到底有沒有填充位元組,嘿,這倒是個不錯的方法。
不過指標訪問結構成員的正確方法應該是象例十二中使用指標ptr 的方法。
七、指標和函式的關係
可以把一個指標宣告成為一個指向函式的指標。
int fun1(char *,int);
int (*pfun1)(char *,int);
pfun1=fun1;
int a=(*pfun1)("abcdefg",7); //通過函式指標呼叫函式。
可以把指標作為函式的形參。在函式呼叫語句中,可以用指標表示式來作為實參。
例十四:
int fun(char *);
inta;
char str[]="abcdefghijklmn";
a=fun(str);
int fun(char *s)
{
int num=0;
for(int i=0;;)
{
num+=*s;s++;
}
return num;
}
這個例子中的函式fun 統計一個字串中各個字元的ASCII 碼值之和。前面說了,陣列的名字也是一個指標。在函式呼叫中,當把str作為實參傳遞給形參s 後,實際是把str 的值傳遞給了s,s 所指向的地址就和str 所指向的地址一致,但是str 和s 各自佔用各自的儲存空間。在函式體內對s 進行自加1 運算,並不意味著同時對str 進行了自加1 運算。
八、指標型別轉換
當我們初始化一個指標或給一個指標賦值時,賦值號的左邊是一個指標,賦值號的右邊是一個指標表示式。在我們前面所舉的例子中,絕大多數情況下,指標的型別和指標表示式的型別是一樣的,指標所指向的型別和指標表示式所指向的型別是一樣的。
例十五:
float f=12.3;
float *fptr=&f;
int *p;
在上面的例子中,假如我們想讓指標p 指向實數f,應該怎麼辦?
是用下面的語句嗎?
p=&f;
不對。因為指標p 的型別是int *,它指向的型別是int。表示式&f 的結果是一個指標,指標的型別是float *,它指向的型別是float。
兩者不一致,直接賦值的方法是不行的。至少在我的MSVC++6.0 上,對指標的賦值語句要求賦值號兩邊的型別一致,所指向的型別也一致,其它的編譯器上我沒試過,大家可以試試。為了實現我們的目的,需要進行"強制型別轉換":
p=(int*)&f;
如果有一個指標p,我們需要把它的型別和所指向的型別改為TYEP *TYPE, 那麼語法格式是: (TYPE *)p;
這樣強制型別轉換的結果是一個新指標,該新指標的型別是TYPE *,它指向的型別是TYPE,它指向的地址就是原指標指向的地址。
而原來的指標p 的一切屬性都沒有被修改。(切記)
一個函式如果使用了指標作為形參,那麼在函式呼叫語句的實參和形參的結合過程中,必須保證型別一致,否則需要強制轉換
例十六:
void fun(char*);
int a=125,b;
fun((char*)&a);
void fun(char*s)
{
charc;
c=*(s+3);*(s+3)=*(s+0);*(s+0)=c;
c=*(s+2);*(s+2)=*(s+1);*(s+1)=c;
}
注意這是一個32 位程式,故int 型別佔了四個位元組,char 型別佔一個位元組。函式fun 的作用是把一個整數的四個位元組的順序來個顛倒。注意到了嗎?在函式呼叫語句中,實參&a 的結果是一個指標,它的型別是int *,它指向的型別是int。形參這個指標的型別是char *,它指向的型別是char。這樣,在實參和形參的結合過程中,我們必須進行一次從int *型別到char *型別的轉換。
結合這個例子,我們可以這樣來
想象編譯器進行轉換的過程:編譯器先構造一個臨時指標char *temp,然後執行temp=(char *)&a,最後再把temp 的值傳遞給s。所以最後的結果是:s 的型別是char *,它指向的型別是char,它指向的地址就是a 的首地址。
我們已經知道,指標的值就是指標指向的地址,在32 位程式中,指標的值其實是一個32 位整數。
那可不可以把一個整數當作指標的值直接賦給指標呢?就象下面的語句:
unsigned int a;
TYPE *ptr; //TYPE 是int,char 或結構型別等等型別。
a=20345686;
ptr=20345686; //我們的目的是要使指標ptr 指向地址20345686
ptr=a; //我們的目的是要使指標ptr 指向地址20345686
//編譯一下吧。結果發現後面兩條語句全是錯的。那麼我們的目的就不能達到了嗎?不,還有辦法:
unsigned int a;
TYPE *ptr; //TYPE 是int,char 或結構型別等等型別。
a=N //N 必須代表一個合法的地址;
ptr=(TYPE*)a; //呵呵,這就可以了。
嚴格說來這裡的(TYPE *)和指標型別轉換中的(TYPE *)還不一樣。這裡的(TYPE*)的意思是把無符號整數a 的值當作一個地址來看待。上面強調了a 的值必須代表一個合法的地址,否則的話,在你使用ptr 的時候,就會出現非法操作錯誤。想想能不能反過來,把指標指向的地址即指標的值當作一個整數取出來。完全可以。下面的例子演示了把一個指標的值當作一個整數取出來,然後再把這個整數當作一個地址賦給一個指標:
例十七:
int a=123,b;
int *ptr=&a;
char *str;
b=(int)ptr; //把指標ptr 的值當作一個整數取出來。
str=(char*)b; //把這個整數的值當作一個地址賦給指標str
現在我們已經知道了,可以把指標的值當作一個整數取出來,也可以把一個整數值當作地址賦給一個指標。
九、指標的安全問題
看下面的例子:
例十八:
char s='a';
int *ptr;
ptr=(int *)&s;
*ptr=1298;
指標ptr 是一個int *型別的指標,它指向的型別是int。它指向的地址就是s 的首地址。在32 位程式中,s 佔一個位元組,int 型別佔四個位元組。最後一條語句不但改變了s 所佔的一個位元組,還把和s 相臨的高地址方向的三個位元組也改變了。這三個位元組是幹什麼的?只有編譯程式知道,而寫程式的人是不太可能知道的。也許這三個位元組裡儲存了非常重要的資料,也許這三個位元組里正好是程式的一條程式碼,而由於你對指標的馬虎應用,這三個位元組的值被改變了!這會造成崩潰性的錯誤。
讓我們再來看一例:
例十九:
char a;
int *ptr=&a;
ptr++;
*ptr=115;
該例子完全可以通過編譯,並能執行。但是看到沒有?第3 句對指標ptr 進行自加1 運算後,ptr 指向了和整形變數a 相鄰的高地址方向的一塊儲存區。這塊儲存區裡是什麼?我們不知道。有可能它是一個非常重要的資料,甚至可能是一條程式碼。
而第4 句竟然往這片儲存區裡寫入一個數據!這是嚴重的錯誤。所以在使用指標時,程式設計師心裡必須非常清楚:我的指標究竟指向了哪裡。在用指標訪問陣列的時候,也要注意不要超出陣列的低端和高階界限,否則也會造成類似的錯誤。
在指標的強制型別轉換:ptr1=(TYPE *)ptr2 中,如果sizeof(ptr2的型別)大於sizeof(ptr1 的型別),那麼在使用指標ptr1 來訪問ptr2所指向的儲存區時是安全的。如果sizeof(ptr2 的型別) 小於sizeof(ptr1 的型別),那麼在使用指標ptr1 來訪問ptr2 所指向的儲存區時是不安全的。至於為什麼,讀者結合例十八來想一想,應該會明白的。
微信公眾號:程式設計小兔崽;微信搜尋:hjie2279914007