1. 程式人生 > >C/C++字串、字元陣列的總結

C/C++字串、字元陣列的總結

一、定義

字元陣列:儲存字元的陣列

字串 :是使用最頻繁的字元陣列,是一個特殊的字元陣列

C++中並沒有專門的字串的型別,一個字串實際上就是一個字元陣列,與普通字元陣列不同的是,字串的結尾有一個字元\0,表示字串的結束。

char 可以定義字元陣列,也可以定義字串

char 定義的字元陣列

char b[]={'h','e','l','l','o'};//宣告字元陣列,長度為51

char定義字串

字串的優勢在於輸入、輸出和賦初值,輸入輸出不需要使用循壞。字元陣列需要用迴圈依次輸出每個字元。

 char b[]="hello";//定義字串
 char *p = b;
 cout << b;//輸出的是hello
 cout<<  *p;//指標指向首地址,所以輸出為 h

字元陣列和字串的區別

C++中,字元陣列和字串都是通過char關鍵字來定義的,但二者不同,顯著的區別就是字串的長度是字元數目加1,因為包含了\0結束符,而字元陣列的長度就是字元的數目。對於字元陣列可以通過sizeof求出其長度,但是對於字串是其長度加上1。因此這個長度沒有意義,為此C++可以用strlen求出字串的有效內容的長度(不含字串結束標識\0)。

指標與字串、指標與字元陣列

指標指向字元陣列

    char b[] = { 'h','e','l','l','o' };
    char *pchar = b;
    cout << *pchar;//該語句輸出 h
    //cout << b; //不要用這個方式輸出,輸出的是 hello加一些亂碼字
    cout << b[0]; //該語句輸出 h12345
//以下語句實現用指標輸出hello。
for (size_t i = 0; i < 5; i++)
    {
        cout << *pchar;
        pchar++;
    }
1234567

指標指向字串

char定義的字串

用char定義一個指標,並指向了char定義的字串,那麼用指標變數p 和*p輸出的結果不一樣,請看一下兩種情況。 具體原因我也不知道。

方式1

  char str[] = "we are poor students";//這是一個字串
  cout<<str<<endl;//輸出的是:we are poor students。這也是字串的優點,可以整個輸出。
​
  //指標訪問每個字元並輸出。
  char *p = str;
  while (*p != '\0')
  {
    cout << *p;
    p++;
  } 12345678910

方式二

    //
    char *p = str;
    while (*p != '\0')
    {
        cout << p<<endl;
        p++;
    }
以上語句輸出的結果是:
    we are poor students
    we are poor students
    e are poor students
     are poor students
    are poor students
    re poor students
    e poor students
     poor students
    poor students
    oor students
    or students
    r students
     students
    students
    tudents
    udents
    dents
    ents
    nts
    ts
    s1234567891011121314151617181920212223242526272829

string定義的字串

這裡需要特別注意的是string並不是一個關鍵字,而是一個類。 下面程式碼的指標指向的是物件,而不是string中的第一個字元。

    string str="hello world";
    string *p1 = &str; //注意必須加取地址運算子 &
    cout << str << "," << *p1; //輸出的是  hello world,hello world123
  1. 如果想訪問string定義字串中的每個字元,可以使用 str[i]

  2. cout<<p1[0];//輸出的是 hello world

  3. 不可像char定義的字串那樣使用p1[i],在string中,i>0並未分配指標,這種理解方式本來就錯誤。

用指標遍歷 每個字元

  1. 用C++的迭代器

  string str1 = "we are poor students"; 
  for (string::iterator p1 = str1.begin(); p1 !=str1.end(); p1++)
  {
    cout << *p1 ;
  }12345
  1. c_str() (Get C string equivalent)函式轉化為c型別的string,如下程式碼所示:

string str1 = "we are poor students";
const char *p = str1.c_str();//這句是關鍵。
for (size_t i = 0; i < str1.size(); i++)
{
  cout << *(p + i);
}

二、區別

我們先來直觀地感受下字串陣列與字串指標變數:

    char s1[] = "helloworld";
    char *s2 = "helloworld";

(第一行是字串陣列,第二行是字串指標變數)

字元陣列和字元指標變數都可實現字串的儲存和運算。但是兩者是有區別的。在使用時應注意以下幾個問題:

1.字串指標變數本身是一個變數,用於存放字串的首地址。而字串本身是存放在以該首地址為首的一塊連續的記憶體空間中並以‘\0’作為串的結束。字元陣列是由於若干個陣列元素組成的,它可用來存放整個字串。
2.對字串指標方式 char *ps="C Language"; 定義時可以寫為:
char *ps;
ps="C Language";
而對陣列方式: static char st[]={"C Language"}; 只能對字元陣列的各元素逐個賦值,不能寫為:
char st[20];
st={"C Language"};
這是因為,字串指標變數只是一個指向字串首地址的指標變數,我們可以對指標變數進行賦值,確定其指向的地址空間;而字串陣列在定義時便在記憶體中為其分配了空間,也就是說,我們不能隨意的改變這個陣列的地址。
3.我們通過一個小程式來認識這個區別。
​
#include <stdio.h>
#include <string.h>
 
int main()
{
    char c1[] ="helloworld";
    char *c2 = "helloworld";
 
    printf("sizeof(s1) :  %d %d\n", sizeof(c1), sizeof(c2));
    printf("strlen(s2) :  %d %d\n", strlen(c1), strlen(c2));
 
    return 0;
}
這段程式執行的結果是:
"helloword"一共10個字元,所以strlen的值都為10;
​
差別體現在sizeof的值。用字串陣列定義的"helloword"佔11個位元組,是因為"helloword"加上結尾的"\0"一共十一個char型字元,每個char型字元佔1個位元組;
而用字串指標變數定義時,sizeof的值僅為4個位元組,這是因為s2是一個指標,在32位系統中,地址佔4個位元組。

三、求字串長度

在C/C++中常用的獲取字串長度或者字串陣列長度的函式有:

size()

length()

strlen()

sizeof()

其中strlen(str)和str.length()和str.size()都可以用來求字串的長度 str.length()和str.size()是用於求string類物件的成員函式,求得的是實際的字串長度;strlen(str) 是用於求實際字串陣列的長度,其引數是char*,標頭檔案為string.h。sizeof用於求得的為字串長度+1.對於字元陣列,strlen()和sizeof()求得的結果相同.

接下來辨析strlen() 與 sizeof() 的區別

strlen(char*)

函式求是字串的實際長度,它可以用來獲取動態實際字元陣列的長度,是從開始到遇到第一個“\0”,如果只是定義沒有賦予初始值,這個結果是不確定的,它會從陣列的首地址開始一直找下去,直到遇到“\0”停止查詢。標頭檔案為string.h

sizeof()

求所佔總空間的位元組數,靜態的,跟初始狀態字元陣列的大小有關係,如果給定字元陣列的大小,如a[10],則大小等於初始時字元陣列的大小,如果沒有給定字元陣列大小,如a[],則大小等於初始時字元陣列的大小+1,即把\0計入字串長度的; 在C++中,如果定義的是字串陣列的話,那麼如果想獲取陣列的長度,可以用sizeof(陣列名),如果用strlen(str),則需再+1,即包含\0。

strlen不區分是陣列還是指標,就讀到\0為止返回長度。而且strlen是不把\0計入字串的長度的

Example

char str[20]="0123456789"; 
int   a=strlen(str); /*a=10;strlen 計算字串的長度,以\0'為字串結束標記。 
int   b=sizeof(str); /*b=20;sizeof 計算的則是分配的陣列str[20] 所佔的記憶體空間的大小,不受裡面儲存的內容影響
char *str1="absde";
char str2[]="absde";
char str3[8]={'a',};
char ss[] = "0123456789";
​
輸出:
​
sizeof(str1)=4;
sizeof(str2)=6;
sizeof(str3)=8;
sizeof(ss)=11

首先說明一點,char型別佔一個位元組,所以sizeof(char)是1,這點要理解.

str1是一個指標,只是指向了字串”absde”而已。所以sizeof(str1)不是字串佔的空間也不是字元陣列佔的空間,而是一個字元型指標佔的空間。所以sizeof(str1)=sizeof(char*)=4,在C/C++中一個指標佔4個位元組

str2是一個字元型陣列。C/C++規定,對於一個數組,返回這個陣列佔的總空間,所以sizeof(str2)取得的是字串”absde”佔的總空間。”absde”中,共有a b s d e \0六個字元,所以str2陣列的長度是6,所以sizeof(str2)=6*sizeof(char)=6

str3已經定義成了長度是8的陣列,所以sizeof(str3)為8

str4和str2類似,’0’ ‘1’ … ‘9’加上’\0’共11個字元,所以ss佔的空間是8

總之,對於指標,sizeof操作符返回這個指標佔的空間,一般是4個位元組;而對於一個數組,sizeof返回這個陣列所有元素佔的總空間。char與char[]容易混淆,一定要分清,而且char=”aaa”的寫法現在不被提倡,應予以避免.

1、sizeof

sizeof(...)是運算子,在標頭檔案中typedef為unsigned int,其值在編譯時即計算好了,引數可以是陣列、指標、型別、物件、函式等。
它的功能是:獲得保證能容納實現所建立的最大物件的位元組大小。
由於在編譯時計算,因此sizeof不能用來返回動態分配的記憶體空間的大小。實際上,用sizeof來返回型別以及靜態分配的物件、結構或陣列所佔的空間,返回值跟物件、結構、陣列所儲存的內容沒有關係。
具體而言,當引數分別如下時,sizeof返回的值表示的含義如下:
陣列——編譯時分配的陣列空間大小;
指標——儲存該指標所用的空間大小(儲存該指標的地址的長度,是長整型,應該為4);
型別——該型別所佔的空間大小;
物件——物件的實際佔用空間大小;
函式——函式的返回型別所佔的空間大小。函式的返回型別不能是void。

2、strlen

strlen(...)是函式,要在執行時才能計算。引數必須是字元型指標(char*)。當陣列名作為引數傳入時,實際上陣列就退化成指標了。
它的功能是:返回字串的長度。該字串可能是自己定義的,也可能是記憶體中隨機的,該函式實際完成的功能是從代表該字串的第一個地址開始遍歷,直到遇到結束符NULL。返回的長度大小不包括NULL。

3、舉例:

eg1、char arr[10] = "What?";
          int len_one = strlen(arr);
          int len_two = sizeof(arr); 
          cout << len_one << " and " << len_two << endl; 
輸出結果為:5 and 10
點評:sizeof返回定義arr陣列時,編譯器為其分配的陣列空間大小,不關心裡面存了多少資料。strlen只關心儲存的資料內容,不關心空間的大小和型別。
​
eg2、char * parr = new char[10];
          int len_one = strlen(parr);
          int len_two = sizeof(parr);
          int len_three = sizeof(*parr);
          cout << len_one << " and " << len_two << " and " << len_three << endl;
輸出結果:23 and 4 and 1
點評:第一個輸出結果23實際上每次執行可能不一樣,這取決於parr裡面存了什麼(從parr[0]開始知道遇到第一個NULL結束);第二個結果實際上本意是想計算parr所指向的動態記憶體空間的大小,但是事與願違,sizeof認為parr是個字元指標,因此返回的是該指標所佔的空間(指標的儲存用的是長整型,所以為4);第三個結果,由於*parr所代表的是parr所指的地址空間存放的字元,所以長度為1。

string 類的常見應用

C++使用內建的資料型別string來處理字串會很方便,可以完全代替C語言中的char陣列和char指標。 使用string類需要包含標頭檔案string,同時string 型別的變數結尾沒有“\0”,其本質是一個string類,因此可以通過呼叫string類中成員函式length()函式,如:

string s = "hello world";
int len = s.lenght();
cout<<len<<endl;

執行結果為:11 由於string變數的末尾沒有“\0”字元,所以length()返回的是字串的真實長度,而不是長度+1.

在C++中可以用string類來代替C中的char陣列形式的字串,但是有些情況下是需要轉換成C語言風格的,如以下程式碼:

#include <stdio.h>
#include <math.h>
#define MAX 51
int main(){
    char s1 [MAX];
    char s2 [MAX];
​
    scanf("%s%s",s1,s2);
    int len = strlen(s1);
​
    for (int i=0;i<len;i++){
        if(s1[i]==s2[i])
            printf("1");
        else
            printf("0");
    }
    printf("\n");
    return 0;
}

這裡需要一個個的訪問實際陣列中的元素,當時如果利用C++中的sizeof函式時,獲取的是陣列的固定空間,而不是實際的動態空間。所以這裡只能用strlen(str)來獲取char陣列的實際長度(也即是使用者輸入的字串的長度),如果用sizeof(str)所得到的長度大小為51。

string型別的字串轉換成char陣列字串

string filename = "test.txt";
ifstream in ;
in.open(filename.c_str());

為了使用檔案開啟函式,必須將string型別的變數轉換為字串陣列

#ifndef _ITERATOR_DEBUG_LEVEL
#define _ITERATOR_DEBUG_LEVEL 0
#else
#undef _ITERATOR_DEBUG_LEVEL
#define _ITERATOR_DEBUG_LEVEL 0
#endif
​
#include <iostream>
#include <string>
​
//string字串->c字串轉換
void main()
{
    //string -> char*
    string s1 = "far away";
    const char* c = s1.c_str();
    printf("%s\n",c);
​
    //
    string s2 = c;
​
    //string->char[]
    //從string中賦值字元到char[]
    char arr[50] = {0};
    s1.copy(arr,4,0);
​
    cout << arr << endl;
​
    system("pause");
}

輸出結果: far away far 請按任意鍵繼續…

string字串的輸入輸出

string類過載了輸入輸出的運算子,用”>>”進行輸入,用”<<”進行輸出

#include <iostream>
#include <string>
using namespace std;
int main(){
    string s;
    cin >> s;  //輸入字串
    cout << s << endl;  //輸出字串
​
    system("pause");
    return 0;
}

執行結果:

c plus

c

請按任意鍵繼續… 雖然我們輸入了兩個由空格隔開的”c plus’,但是隻輸出了一個,這是因為輸入的運算子“>>”預設會忽略空格,遇到空格就認為輸入結束,所以最後輸入的plus沒有被儲存到變數裡面。

訪問字串中得字元

string 字串也可以像字串陣列一樣按照下標來訪問其中的每一個字元。string 字串的起始下標仍是從 0 開始。請看下面的程式碼:

#include <string>
using namespace std;
​
//string遍歷
void main(){
    string s1 = "abcdefg";
​
    //1、陣列方式
​
    cout << "陣列方式:" << endl;
    for (int i = 0; i < s1.length(); i++){
        cout <<s1[i] << endl;
​
    }
​
    //2、迭代方式
    cout << "迭代方式:" << endl;
    for (string::iterator it = s1.begin(); it != s1.end(); it++){
​
        cout<<*it<< endl;
​
    }
​
    system("pause");
}

輸出結果:

陣列方式:

a

b

c

d

e

f

g

迭代方式:

a

b

c

d

e

f

g

請按任意鍵繼續…

字串的拼接

有了string 類,我們可以使用”+“ 或者”+=“運算子來直接拼接字串,非常方便,再也不需要使用C語言中的strcat(),strcopy(),malloc()等函式來拼接字串了,再也不用擔心空間不夠溢位了。 下面來看列子:

//字串拼接
void main()
{
    string s1 = "alan";
    string s2 = "xiho";
​
    //1.
    string s3 = s1 + s2;
​
    string s4 = " wahaha";
​
    //2.
    s3.append(s4);
​
    cout << s3 << endl;
​
    system("pause");
}

輸出結果為: alanxiho wahaha 請按任意鍵繼續…

四、參考資料:

Sizeof與Strlen的區別與聯絡(轉)

1.sizeof操作符的結果型別是size_t,它在標頭檔案中typedef為unsigned int型別。 該型別保證能容納實現所建立的最大物件的位元組大小。

2.sizeof是算符,strlen是函式。

3.sizeof可以用型別做引數,strlen只能用char*做引數,且必須是以”\0”結尾的。 sizeof還可以用函式做引數,比如: short f(); printf(“%d\n”, sizeof(f())); 輸出的結果是sizeof(short),即2。

4.陣列做sizeof的引數不退化,傳遞給strlen就退化為指標了。

5.大部分編譯程式 在編譯的時候就把sizeof計算過了 是型別或是變數的長度這就是sizeof(x)可以用來定義陣列維數的原因 char str[20]=”0123456789”; int a=strlen(str); //a=10; int b=sizeof(str); //而b=20;

6.strlen的結果要在執行的時候才能計算出來,時用來計算字串的長度,不是型別佔記憶體的大小。

7.sizeof後如果是型別必須加括弧,如果是變數名可以不加括弧。這是因為sizeof是個操作符不是個函式。

8.當適用了於一個結構型別時或變數, sizeof 返回實際的大小, 當適用一靜態地空間陣列, sizeof 歸還全部陣列的尺寸。 sizeof 操作符不能返回動態地被分派了的陣列或外部的陣列的尺寸

9.陣列作為引數傳給函式時傳的是指標而不是陣列,傳遞的是陣列的首地址, 如: fun(char [8]) fun(char []) 都等價於 fun(char *) 在C++裡引數傳遞陣列永遠都是傳遞指向陣列首元素的指標,編譯器不知道陣列的大小 如果想在函式內知道陣列的大小, 需要這樣做: 進入函式後用memcpy拷貝出來,長度由另一個形參傳進去 fun(unsiged char p1, int len) { unsigned char buf = new unsigned char[len+1] memcpy(buf, p1, len); }

我們能常在用到 sizeof 和 strlen 的時候,通常是計算字串陣列的長度 看了上面的詳細解釋,發現兩者的使用還是有區別的,從這個例子可以看得很清楚:

char str[20]=”0123456789”; int a=strlen(str); //a=10; >>>> strlen 計算字串的長度,以結束符 0x00 為字串結束。 int b=sizeof(str); //而b=20; >>>> sizeof 計算的則是分配的陣列 str[20] 所佔的記憶體空間的大小,不受裡面儲存的內容改變。

上面是對靜態陣列處理的結果,如果是對指標,結果就不一樣了

char* ss = “0123456789”; sizeof(ss) 結果 4 ===》ss是指向字串常量的字元指標,sizeof 獲得的是一個指標的之所佔的空間,應該是

長整型的,所以是4 sizeof(ss) 結果 1 ===》ss是第一個字元 其實就是獲得了字串的第一位’0’ 所佔的記憶體空間,是char類

型的,佔了 1 位

strlen(ss)= 10 >>>> 如果要獲得這個字串的長度,則一定要使用 strlen