c++中string類的原始碼
一:回顧
(1)c++中的string類是在面試中和筆試中經常考的題目;
(2)c++中的string類和fstream類合起來是處理外部資料的利器;
(3)string類經常用到find find_first_of find_first_not_of find_last_of find_last_not_of substr replace等,以及聯合使用來達到java中的split和trim
(4) 使用friend 僅僅是在類中進行宣告的非內部 卻可以訪問內部成員的外部函式,而且在外部不再需要friend關鍵字;它與成員函式的區別是,friend和外部函式不含有this物件指標;本文用到了const 定義的全域性最大值最小值變數(代替#define)
(5) 有些函式返回的是MyString& 、Char& 等(引用),MyString、Char 等(傳值)這得看你返回的物件是函式的區域性變數還是全域性變數(或者類當前物件成員變數);前者只能返回一個MyString、Char 等;後者強烈建議返回MyString& 、Char& 等(引用);
(6)有些函式的引數是const MyString& ,有些是MyString& (引用);這是為什麼?前者是把外部值傳提到子函式內部,且不允許改變;後者是作為函式的返回值傳遞進去的,返回的結果為函式的處理結果(而不用函式自身返回值了)。
二:下面是簡單的實現了一下string類,參照的是STL原始碼,但是自己理解的還是不夠深,難免有一些錯誤,請各位指教
(1)MyString.h檔案
#ifndef MYSTRING_H #define MYSTRING_H #include "MyExcept.h" #include <cstring> #include <iostream> const int INI_MAX = 0x7fffffff;//2^32npos const int INI_MIN = 0x80000000;// -2^32 const int npos = 0xffffffff;// npos using namespace std; class MyString { public: // constructor MyString();// MyString(const MyString &);// MyString(const char *); MyString(const size_t,const char); // destructor ~MyString(); // attributes size_t length();// 字串長度 bool isEmpty();// 返回字串是否為空 const char* c_str();// 返回c風格的trr的指標 // friend funs // read writer operations friend ostream& operator<< (ostream&, const MyString&); friend istream& operator>> (istream&, MyString&); //add operation friend MyString operator+(const MyString&,const MyString&); // compare operations friend bool operator==(const MyString&,const MyString&); friend bool operator!=(const MyString&,const MyString&); friend bool operator<(const MyString&,const MyString&); friend bool operator<=(const MyString&,const MyString&); friend bool operator>(const MyString&,const MyString&); friend bool operator>=(const MyString&,const MyString&); // 成員函式實現運算子過載,其實一般需要返回自身物件的,成員函式運算子過載會好一些 // index operation char& operator[](const size_t); const char& operator[](const size_t)const; // = MyString& operator=(const MyString&); // += MyString& operator+=(const MyString&); // += //MyString operator+=(const MyString&); cannot be overloaded // 成員操作函式 // substr MyString substr(size_t pos,const size_t n); // append MyString& append(const MyString&); //insert MyString& insert(size_t,const MyString&); //assign 替換 MyString& assign(MyString&,size_t,size_t); // erase 刪除 MyString& erase(size_t,size_t); //find_first_of 查詢某一個字元 size_t 是非符號數的,過載 // 查詢在字串中第一個與str中的某個字元匹配的字元,返回它的位置。 //搜尋從index開始,如果沒找到就返回string::npos int find_first_of(const char* str,size_t index=0); int find_first_of(const char ch,size_t index=0); int find_first_of(const MyString &,size_t index=0); // 在字串中查詢第一個與str中的字元都不匹配的字元,返回它的位置。搜尋從index開始。如果沒找到就返回string::nops int find_first_not_of(const char* str,size_t index=0); int find_first_not_of(const char ch,size_t index=0); int find_first_not_of(const MyString&,size_t index=0); // swap void swap(MyString& lhs,MyString& rhs); // replace_all MyString& replace_all(const char oldc,const char newc=NULL); MyString& replace(size_t index,size_t num1,size_t num2,const char ch); //find int find(const char* str,size_t index=0); int find(const MyString& str,size_t index=0); int find(const char ch,size_t index=0); //private private: char *p_str; size_t strLength; }; #endif // MYSTRING_H
(2)MyString.cpp檔案
#include "MyString.h"
#include <cassert>
// constructor
MyString::MyString():p_str(NULL),strLength(0){}
MyString::MyString(const MyString &str)//
{
if(NULL == str.p_str)
{
return;
}
strLength = str.strLength;
p_str = new char[strLength+1];
strcpy(p_str,str.p_str);
}
MyString::MyString(const char *str)
{
if(NULL == str)
{
return;
}
strLength = strlen(str);
p_str = new char[strLength+1];
strcpy(p_str,str);
}
MyString::MyString(const size_t len,const char ch)
{
if(NULL == ch)
{
return;
}
strLength = len;
p_str = new char[strLength+1];
for(size_t i=0;i<strLength;i++)
{
p_str[i] = ch;
}
p_str[strLength] = '\0';// 因為strset以'\0'結束的
cout << p_str << " &&" << endl;
//strset(p_str,ch);
//cout << p_str[0] << ",,,"<<strlen(p_str) << "," << strLength << endl;
}
// destructor
MyString::~MyString()
{
delete[] p_str;
}
// attributes
size_t MyString::length()// 字串長度
{
return strLength;
}
bool MyString::isEmpty()// 返回字串是否為空
{
return strLength==0?true:false;
}
const char* MyString::c_str()
{
return p_str;
}
// 為什麼不是引用呢??? friend 使用在類裡面進行宣告的,外面就不需要了,而且友元函式不屬於類的成員函式,所以不用MyString::
// ostream
ostream& operator<< (ostream& out,const MyString &str)
{
if(str.p_str != NULL)
{
out << str.p_str;
}
return out;
}
// istream,一個是const另一個不是,根據變還是不變
istream& operator>> (istream& in, MyString& str)
{
char tmp[100];// 臨時字串
if(in>>tmp)
{
delete[] str.p_str;
str.strLength = strlen(tmp);
str.p_str = new char[str.strLength+1];
strcpy(str.p_str,tmp);
}
return in;
}
// + 加
MyString operator+(const MyString& lhs,const MyString& rhs)
{
MyString ret;
ret.strLength = lhs.strLength + rhs.strLength;
ret.p_str = new char[ret.strLength+1];
strcpy(ret.p_str,lhs.p_str);
strcat(ret.p_str,rhs.p_str);
return ret;
}
// compare operations
bool operator==(const MyString& lhs,const MyString& rhs)
{
return strcmp(lhs.p_str,rhs.p_str)==0?true:false;
}
bool operator!=(const MyString& lhs,const MyString& rhs)
{
return strcmp(lhs.p_str,rhs.p_str)!=0?true:false;
}
bool operator<(const MyString& lhs,const MyString& rhs)
{
return strcmp(lhs.p_str,rhs.p_str)<0?true:false;
}
bool operator<=(const MyString& lhs,const MyString& rhs)
{
return strcmp(lhs.p_str,rhs.p_str)<=0?true:false;
}
bool operator>(const MyString& lhs,const MyString& rhs)
{
return strcmp(lhs.p_str,rhs.p_str)>0?true:false;
}
bool operator>=(const MyString& lhs,const MyString& rhs)
{
return strcmp(lhs.p_str,rhs.p_str)>=0?true:false;
}
// 成員函式實現運算子過載
// index operation
char& MyString::operator[](const size_t index)
{
if(index<0 || index>=strLength)
{
throw Outofbond() ;
}
return p_str[index];
}
const char& MyString::operator[](const size_t index)const
{
if(index<0 || index>=strLength)
{
throw Outofbond();
}
return p_str[index];
}
// = 賦值建構函式(判斷是否是自身) 為什麼要這樣刪除呢?
MyString& MyString::operator=(const MyString& other)
{
if(this != &other)
{
if(strLength<other.strLength)
{
delete[] p_str;
p_str = new char[other.strLength+1];
}
strLength = other.strLength;
strcpy(p_str,other.p_str);
}// 這樣可能會產生多餘的未釋放的空間
return *this;
}
// += 相當於返回的是備份的,內部物件的銷燬,不影響的 和 下面的完全不一樣的
// MyString MyString::operator+=(const MyString& other)
// {
// if(NULL == other.p_str)
// {
// return *this;
// }
// MyString ret;
// ret.strLength = strLength + other.strLength;
// ret.p_str = new char[ret.strLength+1];
// strcpy(ret.p_str,p_str);
// strcat(ret.p_str,other.p_str);
// return ret;
// }
// 返回的是當前物件的引用,當前物件就在呼叫函式裡,所以不會銷燬的
// 判斷一下是否是自身相加
MyString& MyString::operator+=(const MyString& other)
{
if(NULL == other.p_str)
{
return *this;
}
if(this == &other)
{
MyString copy(*this);
return *this += copy;
}// 必須判斷是否相等的,而且要+=的,這樣相當於呼叫了自身,但是這次直接下面去了,不進入if的
strLength += other.strLength;
//strLength *= 2;
char *p_old = p_str;
p_str = new char[strLength+1];
strcpy(p_str,p_old);
strcat(p_str,other.p_str);
delete[] p_old;// 刪除舊的空間
return *this;
}
// 成員操作函式
// substr 返回應用是不行的,錯誤的;取從pos開始的n個字元組成的子串
//MyString& MyString::substr(size_t pos,const size_t n)
MyString MyString::substr(size_t pos,const size_t n)
{
if((pos+n)>=strLength)
{
throw Outofbond();
}
MyString ret;
ret.strLength = n;
//ret.p_str = new char[n+1];
ret.p_str = new char[ret.strLength+1]; //也可以
for(size_t i=0;i<n;i++)
{
ret.p_str[i] = p_str[pos+i];
}
ret.p_str[n] = '\0';
// for(size_t i=0;i<ret.strLength;i++)
// {
// ret[i] = (*this)[pos+i];
// cout << ret[i] << ",,";
// }// 也行的,利用剛剛過載的【】,這樣更好,不用再次判斷越界了,不知道為什麼,報錯誤的
// ret[ret.strLength] = '\0';
return ret;
}
// append 同 += 追加到末尾
MyString& MyString::append(const MyString& other)
{
*this += other;// 利用剛剛那過載的+=
return *this;
}
//insert 從pos開始的插入other
MyString& MyString::insert(size_t pos,const MyString& other)
{
if(pos<0 || pos>=strLength)
{
throw Outofbond();
}
char *p_old = p_str;
strLength += other.strLength;
p_str = new char[strLength+1];
for(size_t i=0;i<pos;i++)
{
*(p_str+i) = *(p_old+i);
}
for(size_t i=pos;i<other.strLength+pos;i++)
{
*(p_str+i) = other.p_str[i-pos];
}
for(size_t i=other.strLength+pos;i<strLength;i++)
{
*(p_str+i) = p_old[i-other.strLength];
}
*(p_str+strLength) = '\0';
return *this;
}
//assign 替換 用other的POS開始的n對應替換this的pos開始的
MyString& MyString::assign(MyString&other,size_t pos,size_t n)
{
// if(pos<0 || pos>=strLength)
// {
// throw Outofbond();
// }
assert(pos>0 && pos<strLength);// assert 的好處
assert(pos+n<other.strLength);
if(strLength < pos + n)
{
char *p_old = p_str;
strLength = pos + n;
p_str = new char[strLength+1];
for(size_t i=0;i<pos;i++)
{
*(p_str+i) = *(p_old+i);
}
delete[] p_old;
}
for(size_t i=pos;i<pos+n;i++)
{
*(p_str+i) = other.p_str[i];
}
*(p_str+pos+n) = '\0';
return *this;
}
// erase 刪除 這個方法並不是很好的,並沒有釋放所erase的空間,請看下面的
// MyString& MyString::erase(size_t pos,size_t n)
// {
// if((pos+n)>strLength)
// {
// throw Outofbond();
// }
// size_t index = pos + n;
// while(*(p_str+index)!='\0')
// {
// *(p_str+index-n) = *(p_str+index);
// ++index;
// }
// *(p_str+index-n) = '\0';
// return *this;
// }
// erase 刪除 從pos開始的n個字元
MyString& MyString::erase(size_t pos,size_t n)
{
if((pos+n)>strLength)
{
throw Outofbond();
}
char *p_old = p_str;
strLength -= n;
p_str = new char[strLength+1];
for(size_t i=0;i<pos;i++)
{
p_str[i] = p_old[i];
}
for(size_t i=pos;i<strLength;i++)
{
p_str[i] = p_old[i+n];
}
*(p_str+strLength) = '\0';
return *this;
}
//find_first_of 查詢某一個字元 size_t 是非符號數的
// 查詢在字串中第一個與str中的某個字元匹配的字元,返回它的位置。
//搜尋從index開始,如果沒找到就返回string::npos
int MyString::find_first_of(const char* str,size_t index)
{
if(NULL == str || index >=strLength)
return npos;
int tmp_len = strlen(str),j;
size_t flag,min_index = INI_MAX;
for(j=0;j<tmp_len;j++)
{
flag = npos;
for(size_t i=index;i<strLength;i++)
{
if(str[j] == p_str[i])
{
flag = i;
break;
}
}
// indexs[j] = flag;
if(flag != npos)
{
min_index = min_index<flag?min_index:flag;
}
}
// for(j=0;j<tmp_len;j++)
// {
// if(indexs[j]!=npos)
// min = min<indexs[j]?min:indexs[j];
// }
if(min_index == INI_MAX)
{
return npos;
// min_index = npos;
// cout << "---npos----" << min_index << ",,,,";
}
return min_index;
}
int MyString::find_first_of(const char ch,size_t index)
{
if(NULL == ch || index >=strLength)
return npos;
int j;
size_t flag = npos;
for(size_t i=index;i<strLength;i++)
{
if(ch == p_str[i])
{
flag = i;
break;
}
}
return flag;
}
int MyString::find_first_of(const MyString& str,size_t index)
{
if(NULL == str || index >=strLength)
return npos;
int j;
size_t flag,min_index = INI_MAX;
for(j=0;j<str.strLength;j++)
{
flag = npos;
for(size_t i=index;i<strLength;i++)
{
if(str[j] == p_str[i])
{
flag = i;
break;
}
}
if(flag != npos)
{
min_index = min_index<flag?min_index:flag;
}
}
if(min_index == INI_MAX)
{
return npos;
}
return min_index;
}
// 在字串中查詢第一個與str中的字元都不匹配的字元,返回它的位置。
//搜尋從index開始。如果沒找到就返回string::nops O(N^2)
int MyString::find_first_not_of(const char *str,size_t index)
{
if(NULL == str || index >=strLength)
return npos;
size_t i=0,j=0;
size_t tmp_len = strlen(str);
for(i=index;i<strLength;i++)
{
for(;j<tmp_len;j++)
{
if(p_str[i]==str[j])
break;
}
if(j==tmp_len)
break;// 根據跳出的內層for的條件判斷,找到即結束迴圈
}
if(i==strLength)
return npos;// 未找到,// 根據跳出的內層for的條件判斷,找到即結束迴圈
return i;
}
int MyString::find_first_not_of(const MyString& str,size_t index)
{
if(NULL == str || index >=strLength)
return npos;
size_t i=0,j=0;
for(i=index;i<strLength;i++)
{
for(;j<str.strLength;j++)
{
if(p_str[i]==str[j])
break;// 如果相等 本輪i就無效了,進行下一輪
}
if(j==str.strLength)
break;// 根據跳出的內層for的條件判斷,找到即結束迴圈
}
if(i==strLength)
return npos;// 未找到,// 根據跳出的內層for的條件判斷,找到即結束迴圈
return i;
}
int MyString::find_first_not_of(const char ch,size_t index)
{
if(NULL == ch || index >=strLength)
return npos;
size_t i=0;
for(i=index;i<strLength;i++)
{
if(p_str[i]!=ch)// 跟上面的略微不同,找一個不等就可以了
break;
}
if(i==strLength)
return npos;// 未找到,// 根據跳出的內層for的條件判斷,找到即結束迴圈
return i;
}
// swap 都得變得,所以非const
void MyString::swap(MyString& lhs,MyString& rhs)
{
lhs.strLength ^= rhs.strLength;
rhs.strLength ^= lhs.strLength;
lhs.strLength ^= rhs.strLength;
char *p_tmp = rhs.p_str;
rhs.p_str = lhs.p_str;
lhs.p_str = p_tmp;
}
// replace_all 這個東西還是不太好弄的啊,不是很理想
MyString& MyString::replace_all(const char oldc,const char newc)
{
if(NULL == oldc)
{
return *(this);
}
for(size_t i=0;i<strLength;i++)
{
if(p_str[i] == oldc)
{
p_str[i] = newc;
}
}
return *(this);
}
MyString& MyString::replace(size_t index,size_t num1,size_t num2,const char ch)
{
}
// find 函式
int MyString::find(const char* str,size_t index)
{
assert(str!=NULL&&index<strLength);
// kmp 中的getnext函式
size_t len = strlen(str);
size_t next[len+1];
size_t j,k;
next[0] = npos;
j = 0;
k = npos;
while(j<len)
{
if(k==npos || str[j]==str[k])
{
j++;
k++;
next[j] = k;
}
else
k = next[k];
}
// kmp 演算法
k = index;
j = 0;
while(p_str[k]!='\0')
{
if(j==0 || p_str[k]==str[j])
{
k++;
j++;
}
else
{
j = next[j];// 消除指標回溯
}
if(str[j] == '\0')//匹配成功
return k-j;
}
return npos;
}
int MyString::find(const MyString& str,size_t index)
{
// if(this == &str)
// {
// MyString other(*this);
// find(other,index);
// }
assert(NULL!=str && index<strLength);
// kmp 中的getnext函式
size_t next[str.strLength+2];
size_t j,k;
next[0] = npos;
j = 0;
k = npos;
while(j<str.strLength)
{
if(k==npos || str.p_str[j]==str.p_str[k])
{
j++;
k++;
next[j] = k;
}
else
k = next[k];
}
int i;
for(i=1;i<=j;i++)
cout << next[i] << ",";
// kmp 演算法
k = index;
j = 0;
while(p_str[k]!='\0')
{
if(j==0 || p_str[k]==str.p_str[j])
{
k++;
j++;
}
else
{
j = next[j];// 消除指標回溯
}
if(str.p_str[j] == '\0')//匹配成功,不知道為什麼呼叫自身的str[]過載總是報錯的
return k-j;
}
if(str.p_str[j] == '\0')// 同一個字串
return k-j;
return npos;
}
int MyString::find(const char ch,size_t index)
{
assert(NULL!=ch && index<strLength);
for(size_t i=index;i<strLength;i++)
{
if(p_str[i] == ch)
return i;
}
return npos;
}
(3)測試函式main.cpp
#include "MyString.h"
#include <iostream>
using namespace std;
int main()
{
int n;
int choose = 1;
int p,l;
char cs[100];
MyString s1;
MyString s2("hello");
MyString s3 = "HELLO";
cout << "***** welcome *****\n";
cout << "******* MADE BY zyp **********\n";
cout << "s1= " << s1 << "s2= " << s2 << "s3= " << s3 << endl;
cout << "請輸入一個長度小於100的字串:例如world\n";
cin >> s1;
s1 = s1;
//s1 = s1+s1;
s1 += s1;
MyString s4(s1);
s4.append(s1);
s2.insert(2,s3);
s1.erase(4,4);
s1.assign(s2,1,7);
cout << "s1= " << s1 << "s2= " << s2 << "s3= " << s3 << "s4= " << s4 << endl;
s2 = s4.substr(2,7);
cout << "s4[3]= " << s4[3] << s4.length() << (s1>=s2) << "s4.substr() " << s2 << endl;
cout << "s1.find_first_of(beLE,2):" << s1.find_first_of("beLE",2) << ",s1.find_first_of(a,3):" << s1.find_first_of('a',3) << ",s1.find_first_of(s3,2):" << s1.find_first_of(s3,2) << endl;
MyString s5(5,'b');
s5 += s5;
//s5.append(s5);// 不知道為什就是不能append
cout << "s5 = " << s5 << "s5.find_first_not_of(aeHLEOl,2):" << s5.find_first_not_of("aeHLEOl",2) << "s5.find_first_not_of(aeHLEOl,0):" << s5.find_first_not_of("aeHLEOl") << endl;
cout << "s5.find_first_not_of(s1,2):" << s5.find_first_not_of(s1,2) << "s5.find_first_not_of(b,2):" << s5.find_first_not_of('b',2) << endl;
swap(s1,s5);
s5.replace_all('a','J');
MyString s6("LLO");
cout << s1 << "," << s5 << "s5.find(LLO,0) " << s5.find("LLO",0) << "s5.find(s6,0) " << s5.find(s5) << endl;
cout << npos << endl;
return 0;
}
三:感悟
(1)耗時將近2天的實現了它,自己與其從中學到了很多,倒不如說是重新認識了string類;
(2)自己知道這個簡單的string類,距離string原始碼還差的很遠很遠;但是它幫助我更好的理解了string類,至少會簡單的應用了。
(3)簡單的實現了一下string類,參照的是STL原始碼,但是自己理解的還是不夠深,難免有一些錯誤,請各位指教,萬分感謝!
(4)下一步進軍list