string類的常規操作
1、定義
string陣列的定義有三種:
String arr[] = new String[10]; //建立一個長度為10的String 型別陣列。
String arr[] = {"張三","李四"};
String[] arr = new String[10];
2、求string類陣列的長度(元素個數)
sizeof(陣列名) / sizeof(陣列名[0])
整個陣列的長度/第一個元素的長度(長度是固定的)
sizeof其作用是返回一個物件或型別所佔的記憶體位元組數,在windows下string是28
例子
string A[] = { "Hello "};
sizeof(A)的結果為28,sizeof(A[0])的結果為28
string A[] = { "Hello " , "Hello World"};
sizeof(A)的結果為56,sizeof(A[0])的結果為28
string A[] = { "qwertyuiopasdfghjklzxcvbnmqwertyuiopasdfghjklzxcvbnm" , "Hello World","Hello"};
sizeof(A)的結果為84,sizeof(A[0])的結果還是為28(字元數量超過28)
3、獲取C/C++字串、字元陣列長度
在C/C++中常用的獲取字串長度或者字串陣列長度的函式有
sizeof()
length()
strlen()
size()
其中strlen(str)和str.length()和str.size()都可以用來求字串的長度
str.length()和str.size()是用於求string類物件的成員函式
strlen(str) 是用於求字串陣列的長度,其引數是char*
辨析strlen() 與 sizeof() 的區別
strlen(char*)
函式求是字串的實際長度,它可以用來獲取動態實際字元陣列的長度,是從開始到遇到第一個“\0”,如果只是定義沒有賦予初始值,這個結果是不確定的,它會從陣列的首地址開始一直找下去,直到遇到“\0”停止查詢。
sizeof()
求所佔總空間的位元組數,靜態的,跟初始狀態字元陣列的大小有關係,大小等於初始時字元陣列的大小或者等於初始時字元陣列的大小+1
在C++中,如果定義的是字串陣列的話,那麼如果想獲取陣列的長度,只能用sizeof(陣列名),而不能用strlen(str)
example
char str[20]="0123456789";
int a=strlen(str); //a=10;strlen 計算字串的長度,以\0'為字串結束標記。
int b=sizeof(str); //b=20;sizeof 計算的則是分配的陣列str[20] 所佔的記憶體空間的大小,不受裡面儲存的內容影響
char *str1="absde";
char str2[]="absde";
char str3[8]={'a',};
char ss[] = "0123456789";
輸出:
sizeof(str1)=4;
sizeof(str2)=6;
sizeof(str3)=8;
sizeof(ss)=11
首先說明一點,char型別佔一個位元組,所以sizeof(char)是1,這點要理解
str1是一個指標,只是指向了字串”absde”而已。所以sizeof(str1)不是字串佔的空間也不是字元陣列佔的空間,而是一個字元型指標佔的空間。所以sizeof(str1)=sizeof(char*)=4,在C/C++中一個指標佔4個位元組
str2是一個字元型陣列。C/C++規定,對於一個數組,返回這個陣列佔的總空間,所以sizeof(str2)取得的是字串”absde”佔的總空間。”absde”中,共有a b s d e \0六個字元,所以str2陣列的長度是6,所以sizeof(str2)=6*sizeof(char)=6
str3已經定義成了長度是8的陣列,所以sizeof(str3)為8
str4和str2類似,’0’ ‘1’ … ‘9’加上’\0’共11個字元,所以ss佔的空間是8
總之,對於指標,sizeof操作符返回這個指標佔的空間,一般是4個位元組;而對於一個數組,sizeof返回這個陣列所有元素佔的總空間。char*與char[]容易混淆,一定要分清,而且char*=”aaa”的寫法現在不被提倡,應予以避免
而strlen不區分是陣列還是指標,就讀到\0為止返回長度。而且strlen是不把\0計入字串的長度的。
一、sizeof
sizeof(...)是運算子,在標頭檔案中typedef為unsigned int,其值在編譯時即計算好了,引數可以是陣列、指標、型別、物件、函式等。
它的功能是:獲得保證能容納實現所建立的最大物件的位元組大小。
由於在編譯時計算,因此sizeof不能用來返回動態分配的記憶體空間的大小。實際上,用sizeof來返回型別以及靜態分配的物件、結構或陣列所佔的空間,返回值跟物件、結構、陣列所儲存的內容沒有關係。
具體而言,當引數分別如下時,sizeof返回的值表示的含義如下:
陣列——編譯時分配的陣列空間大小;
指標——儲存該指標所用的空間大小(儲存該指標的地址的長度,是長整型,應該為4);
型別——該型別所佔的空間大小;
物件——物件的實際佔用空間大小;
函式——函式的返回型別所佔的空間大小。函式的返回型別不能是void。
二、strlen
strlen(...)是函式,要在執行時才能計算。引數必須是字元型指標(char*)。當陣列名作為引數傳入時,實際上陣列就退化成指標了。
它的功能是:返回字串的長度。該字串可能是自己定義的,也可能是記憶體中隨機的,該函式實際完成的功能是從代表該字串的第一個地址開始遍歷,直到遇到結束符NULL。返回的長度大小不包括NULL。
三、舉例:
eg1、char arr[10] = "What?";
int len_one = strlen(arr);
int len_two = sizeof(arr);
cout << len_one << " and " << len_two << endl;
輸出結果為:5 and 10
點評:sizeof返回定義arr陣列時,編譯器為其分配的陣列空間大小,不關心裡面存了多少資料。strlen只關心儲存的資料內容,不關心空間的大小和型別。eg2、char * parr = new char[10];
int len_one = strlen(parr);
int len_two = sizeof(parr);
int len_three = sizeof(*parr);
cout << len_one << " and " << len_two << " and " << len_three << endl;
輸出結果:23 and 4 and 1
點評:第一個輸出結果23實際上每次執行可能不一樣,這取決於parr裡面存了什麼(從parr[0]開始知道遇到第一個NULL結束);第二個結果實際上本意是想計算parr所指向的動態記憶體空間的大小,但是事與願違,sizeof認為parr是個字元指標,因此返回的是該指標所佔的空間(指標的儲存用的是長整型,所以為4);第三個結果,由於*parr所代表的是parr所指的地址空間存放的字元,所以長度為1。
string 類的常見應用
可以參考該連結,獲取更為詳細的介紹
C++使用內建的資料型別string來處理字串會很方便,可以完全代替C語言中的char陣列和char指標。
使用string類需要包含標頭檔案string,同時string 型別的變數結尾沒有“\0”,其本質是一個string類,因此可以通過呼叫string類中成員函式length()函式,如:
string s = "hello world";
int len = s.lenght();
cout<<len<<endl;
執行結果為:11
由於string變數的末尾沒有“\0”字元,所以length()返回的是字串的真實長度,而不是長度+1
在C++中可以用string類來代替C中的char陣列形式的字串,但是有些情況下是需要轉換成C語言風格的,如以下程式碼:
#include <stdio.h>
#include <math.h>
#define MAX 51
int main(){
char s1 [MAX];
char s2 [MAX];scanf("%s%s",s1,s2);
int len = strlen(s1);for (int i=0;i<len;i++){
if(s1[i]==s2[i])
printf("1");
else
printf("0");
}
printf("\n");
return 0;
}
這裡需要一個個的訪問實際陣列中的元素,當時如果利用C++中的sizeof函式時,獲取的是陣列的固定空間,而不是實際的動態空間。所以這裡只能用strlen(str)來獲取char陣列的實際長度(也即是使用者輸入的字串的長度),如果用sizeof(str)所得到的長度大小為51。
string型別的字串轉換成char陣列字串
string filename = "test.txt";
ifstream in ;
in.open(filename.c_str());
為了使用檔案開啟函式,必須將string型別的變數轉換為字串陣列
#ifndef _ITERATOR_DEBUG_LEVEL
#define _ITERATOR_DEBUG_LEVEL 0
#else
#undef _ITERATOR_DEBUG_LEVEL
#define _ITERATOR_DEBUG_LEVEL 0
#endif#include <iostream>
#include <string>//string字串->c字串轉換
void main()
{
//string -> char*
string s1 = "far away";
const char* c = s1.c_str();
printf("%s\n",c);//
string s2 = c;//string->char[]
//從string中賦值字元到char[]
char arr[50] = {0};
s1.copy(arr,4,0);cout << arr << endl;
system("pause");
}
輸出結果:
far away
far
請按任意鍵繼續…
string字串的輸入輸出
string類過載了輸入輸出的運算子,用”>>”進行輸入,用”<<”進行輸出
#include <iostream>
#include <string>
using namespace std;
int main(){
string s;
cin >> s; //輸入字串
cout << s << endl; //輸出字串system("pause");
return 0;
}
執行結果:
c plus
c
請按任意鍵繼續…
雖然我們輸入了兩個由空格隔開的”c plus’,但是隻輸出了一個,這是因為輸入的運算子“>>”預設會忽略空格,遇到空格就認為輸入結束,所以最後輸入的plus沒有被儲存到變數裡面。
訪問字串中的字元
string 字串也可以像字串陣列一樣按照下標來訪問其中的每一個字元。string 字串的起始下標仍是從 0 開始。請看下面的程式碼:
#include <string>
using namespace std;//string遍歷
void main(){
string s1 = "abcdefg";//1、陣列方式
cout << "陣列方式:" << endl;
for (int i = 0; i < s1.length(); i++){
cout <<s1[i] << endl;}
//2、迭代方式
cout << "迭代方式:" << endl;
for (string::iterator it = s1.begin(); it != s1.end(); it++){cout<<*it<< endl;
}
system("pause");
}
輸出結果:
陣列方式:
a
b
c
d
e
f
g
迭代方式:
a
b
c
d
e
f
g
請按任意鍵繼續…
字串的拼接
有了string 類,我們可以使用”+“ 或者”+=“運算子來直接拼接字串,非常方便,再也不需要使用C語言中的strcat(),strcopy(),malloc()等函式來拼接字串了,再也不用擔心空間不夠溢位了。
下面來看列子:
//字串拼接
void main()
{
string s1 = "alan";
string s2 = "xiho";//1.
string s3 = s1 + s2;string s4 = " wahaha";
//2.
s3.append(s4);cout << s3 << endl;
system("pause");
}
輸出結果為:
alanxiho wahaha
請按任意鍵繼續…
四、參考資料:
Sizeof與Strlen的區別與聯絡(轉)
1.sizeof操作符的結果型別是size_t,它在標頭檔案中typedef為unsigned int型別。
該型別保證能容納實現所建立的最大物件的位元組大小。
2.sizeof是算符,strlen是函式。
3.sizeof可以用型別做引數,strlen只能用char*做引數,且必須是以”\0”結尾的。
sizeof還可以用函式做引數,比如:
short f();
printf(“%d\n”, sizeof(f()));
輸出的結果是sizeof(short),即2。
4.陣列做sizeof的引數不退化,傳遞給strlen就退化為指標了。
5.大部分編譯程式 在編譯的時候就把sizeof計算過了 是型別或是變數的長度這就是sizeof(x)可以用來定義陣列維數的原因
char str[20]=”0123456789”;
int a=strlen(str); //a=10;
int b=sizeof(str); //而b=20;
6.strlen的結果要在執行的時候才能計算出來,時用來計算字串的長度,不是型別佔記憶體的大小。
7.sizeof後如果是型別必須加括弧,如果是變數名可以不加括弧。這是因為sizeof是個操作符不是個函式。
8.當適用了於一個結構型別時或變數, sizeof 返回實際的大小,
當適用一靜態地空間陣列, sizeof 歸還全部陣列的尺寸。
sizeof 操作符不能返回動態地被分派了的陣列或外部的陣列的尺寸
9.陣列作為引數傳給函式時傳的是指標而不是陣列,傳遞的是陣列的首地址,
如:
fun(char [8])
fun(char [])
都等價於 fun(char *)
在C++裡引數傳遞陣列永遠都是傳遞指向陣列首元素的指標,編譯器不知道陣列的大小
如果想在函式內知道陣列的大小, 需要這樣做:
進入函式後用memcpy拷貝出來,長度由另一個形參傳進去
fun(unsiged char *p1, int len)
{
unsigned char* buf = new unsigned char[len+1]
memcpy(buf, p1, len);
}
我們能常在用到 sizeof 和 strlen 的時候,通常是計算字串陣列的長度
看了上面的詳細解釋,發現兩者的使用還是有區別的,從這個例子可以看得很清楚:
char str[20]=”0123456789”;
int a=strlen(str); //a=10; >>>> strlen 計算字串的長度,以結束符 0x00 為字串結束。
int b=sizeof(str); //而b=20; >>>> sizeof 計算的則是分配的陣列 str[20] 所佔的記憶體空間的大小,不受裡面儲存的內容改變。
上面是對靜態陣列處理的結果,如果是對指標,結果就不一樣了
char* ss = “0123456789”;
sizeof(ss) 結果 4 ===》ss是指向字串常量的字元指標,sizeof 獲得的是一個指標的之所佔的空間,應該是長整型的,所以是4
sizeof(*ss) 結果 1 ===》*ss是第一個字元 其實就是獲得了字串的第一位’0’ 所佔的記憶體空間,是char型別的,佔了 1 位
strlen(ss)= 10 >>>> 如果要獲得這個字串的長度,則一定要使用 strlen