1. 程式人生 > >C語言的字元陣列(字串)的定義與初始化

C語言的字元陣列(字串)的定義與初始化

1、字元陣列的定義與初始化

字元陣列的初始化,最容易理解的方式就是逐個字元賦給陣列中各元素。

char str[10]={ 'I',' ','a','m',' ',‘h’,'a','p','p','y'};

即把10個字元分別賦給str[0]到str[9]10個元素
如果花括號中提供的字元個數大於陣列長度,則按語法錯誤處理;若小於陣列長度,則只將這些字元陣列中前面那些元素,其餘的元素自動定為空字元(即'\0' )。
2、字元陣列與字串
        在c 語言中,將字串作為字元陣列來處理。(c++中不是)在實際應用中人們關心的是有效字串的長度而不是字元陣列的長度,例如,定義一個字元陣列長度為100,而實際有效字元只有40個,為了測定字串的實際長度,C 語言規定了一個“字串結束標誌

”,以字元'\0’代表。如果有一個字串,其中第10個字元為'\0',則此字串的有效字元為9個。也就是說,在遇到第一個字元'\0'時,表示字串結束,由它前面的字元組成字串。

        系統對字串常量也自動加一個'\0'作為結束符。例如"C Program”共有9個字元,但在記憶體中佔10個位元組,最後一個位元組'\0'是系統自動加上的。(通過sizeof()函式可驗證)
       有了結束標誌'\0'後,字元陣列的長度就顯得不那麼重要了,在程式中往往依靠檢測'\0'的位置來判定字串是否結束,而不是根據陣列的長度來決定字串長度。當然,在定義字元陣列時應估計實際字串長度,保證陣列長度始終大於字串實際長度。(在實際字串定義中,常常並不指定陣列長度,如char str[ ])說明:'\0代表ASCII 碼為0的字元,從ASCII 碼錶中可以查到ASCII 碼為0的字元不是一個可以顯示的字元,而是一個“空操作符”,即它什麼也不幹。用它來作為字串結束標誌不會產生附加的操作或增加有效字元,只起一個供辨別的標誌。
        對C 語言處理字串的方法由以上的瞭解後,再對字元陣列初始化的方法補充一種方法——即可以用字串常量來初始化字元陣列:

char str[ ]={"I am happy"}; 

可以省略花括號,如下所示
char str[ ]="I am happy";  

注意:上述這種字元陣列的整體賦值只能在字元陣列初始化時使用,不能用於字元陣列的賦值字元陣列的賦值只能對其元素一一賦值,下面的賦值方法是錯誤的
char str[ ];  
str="I am happy";//錯誤,字元陣列的賦值只能按元素一一賦值

 

不是用單個字元作為初值,而是用一個字串(注意:字串的兩端是用雙引號“”而不是單引號‘’括起來的)作為初值。顯然,這種方法更直觀方便。(注意:陣列str 的長度不是10,而是11,這點請務必記住,因為字串常量"I am happy"的最後由系統自動加上一個'\0')
        因此,上面的初始化與下面的初始化等價

char str[ ]={'I',' ','a','m',' ','h','a','p','p','y','\0'};  

而不與下面的等價

char str[ ]={'I',' ','a','m',' ','h','a','p','p','y'}; 

前者的長度是11,後者的長度是10.

說明:字元陣列並不要求它的最後一個字元為'\0',甚至可以不包含'\0',向下面這樣寫是完全合法的。

char str[5]={'C','h','i','n','a'};  

可見,用兩種不同方法初始化字元陣列後得到的陣列長度是不同的。
#include <stdio.h>  
void main(void)  
{  
char c1[]={'I',' ','a','m',' ','h','a','p','p','y'};  
char c2[]="I am happy";  
int i1=sizeof(c1);  
int i2=sizeof(c2);  
printf("%d\n",i1);  
printf("%d\n",i2);  
}  

結果: 10  11

3、字串的表示形式
在C 語言中,可以用兩種方法表示和存放字串:
(1)用字元陣列存放一個字串

char str[ ]="I love China";

(2)用字元指標指向一個字串

char* str="I love China";

       對於第二種表示方法,有人認為str 是一個字串變數,以為定義時把字串常量"I love China"直接賦給該字串變數,這是不對的。C 語言對字串常量是按字元陣列處理的,在記憶體中開闢了一個字元陣列用來存放字串常量,程式在定義字串指標變數str 時只是把字串首地址(即存放字串的字元陣列的首地址)賦給str

       兩種表示方式的字串輸出都用

printf("%s\n",str); 


%s 表示輸出一個字串,給出字元指標變數名str(對於第一種表示方法,字元陣列名即是字元陣列的首地址,與第二種中的指標意義是一致的),則系統先輸出它所指向的一個字元資料,然後自動使str 自動加1,使之指向下一個字元,如此,直到遇到字串結束識別符號" \0 "。
4、對使用字元指標變數和字元陣列兩種方法表示字串的討論
雖然用字元陣列和字元指標變數都能實現字串的儲存和運算,但它們二者之間是有區別的,不應混為一談。

4.1、字元陣列由若干個元素組成,每個元素放一個字元;而字元指標變數中存放的是地址(字串/字元陣列的首地址),絕不是將字串放到字元指標變數中(是字串首地址)

4.2、賦值方式:
對字元陣列只能對各個元素賦值,不能用以下方法對字元陣列賦值

char str[14];  
str="I love China"; //錯誤,不是初始化,這是賦值,只能一一進行。 

(但在字元陣列初始化時可以,即char str[14]="I love China";)

而對字元指標變數,採用下面方法賦值:

char* a;  
a="I love China";//指標賦值,可以  

或者是char* a="I love China"; 都可以

4.3、對字元指標變數賦初值(初始化):
char* a="I love China";
等價於:
char* a;
a="I love China";
而對於字元陣列的初始化
char str[14]="I love China";
不能等價於:
char str[14];
str="I love China"; (這種不是初始化,而是賦值,而對陣列這樣賦值是不對的)
4.4、如果定義了一個字元陣列,那麼它有確定的記憶體地址,不能進行多次賦值;而定義一個字元指標變數時,它並未指向某個確定的字元資料,並且可以多次賦值。
5、字串處理函式

5.1 字串連線

char *strcat(char *str1,const char *2 );  
char *strcat(char *strDestination,const char *strSource );  
功能:函式將字串str2 連線到str1的末端,並返回指標str1

注:連線前兩個字串的後面都有一個' \0 ',連線時將字串1後面的' \0 ‘去掉,只在新串最後保留一個' \0 ‘

5.2 字串複製

char *strcpy(char *str1,const char *2 );  
char *strcpy(char *strDestination,const char *strSource );  


功能:複製字串strSource 中的字元到字串strDestination,包括空值結束符。返回值為指標strDestination。

注:

     1、“字元陣列1”必須寫成陣列名形式,“字串2"可以是字元陣列名,也可以是一個字串常量
     2、複製時連同字串後面的' \0 ' 一起復制到陣列1中
     3、不能用賦值語句直接將一個字串常量或者字元陣列直接賦給一個字元陣列(同普通變數陣列是一樣的),而只能用strcpy 函式處理。
     4、可以用strcpy 函式將字串2中的前若干個字元複製到字元陣列1中去。