string的字串替換函式,類似於CString的Replace
阿新 • • 發佈:2019-01-27
標準C++中的string中的函式不多,沒有CString的功能強大,但是如果想在Unicode編碼下使用多位元組,就不能使用CString,於是自己寫了一個類似於CString的Replace函式。
string replace( const string& inStr, const char* pSrc, const char* pReplace )
{
string str = inStr;
string::size_type stStart = 0;
string::iterator iter = str.begin();
while( iter != str.end() )
{
// 從指定位置 查詢下一個要替換的字串的起始位置。
string::size_type st = str.find( pSrc, stStart );
if ( st == str.npos )
{
break;
}
iter = iter + st - stStart;
// 將目標字串全部替換。
str.replace( iter, iter + strlen( pSrc ), pReplace );
iter = iter + strlen( pReplace );
// 替換的字串下一個字元的位置
stStart = st + strlen( pReplace );
}
return str;
}
上述方法在執行replace( "h h h h h h h h h h h h h h h h h h h ", " ", " " )時出現問題。
下面再列出一種方法:
string CComFunc::replace( const string& inStr, const char* pSrc, const char* pReplace )
{
string strSrc = inStr;
string::size_type pos=0;
string::size_type srclen = strlen( pSrc );
string::size_type dstlen = strlen( pReplace );
while( (pos=strSrc.find(pSrc, pos)) != string::npos)
{
strSrc.replace(pos, srclen, pReplace);
pos += dstlen;
}
return strSrc;
}
補充,經過測試,上面方法再執行,replace( “暴”, "//","==" )時,依然會遇到問題。
在日文系統上,因為“暴”佔兩個位元組,而"//"只佔一個位元組,但與“暴”的低位位元組ASCII碼相同。
而string的Find函式,是按照位元組比較的,所以,將這個位元組替換了,導致文字替換出現問題。
於是考慮到不應該按位元組比較,應該按字元比較,測試發現,CString的替換函式沒有問題,於是考慮按照CString的方法重新寫一個replace函式。
程式碼如下:
因為CString在_MBCS和_UNICODE下是變寬的,而我寫的replace函式,只針對string。
string CComFunc::replace( const string& inStr, const char* pSrc, const char* pReplace )
{
string strSrc = inStr;
LPSTR lpch = ( CHAR* )strSrc.c_str();
int nOldLength = strlen( lpch );
int nSourceLen = strlen(pSrc);
if (nSourceLen == 0)
{
return lpch;
}
int nReplacementLen = strlen(pReplace);
LPSTR lpszStart = lpch;
LPSTR lpszEnd = lpszStart + nOldLength;
LPSTR lpszTarget;
// 先列出判斷替換字元是否存在的方法, 但在此函式中不使用這段程式碼。
/*
// judge whether exist
while (lpszStart < lpszEnd)
{
while ((lpszTarget = (CHAR*)_mbsstr(( const unsigned char * )lpszStart, ( const unsigned char * )pSrc)) != NULL)
{
nCount++;
lpszStart = lpszTarget + nSourceLen;
}
lpszStart += strStart.length() + 1;
}
*//
// 下面是替換的程式碼。
while (lpszStart < lpszEnd)
{
while ((lpszTarget = (CHAR*)_mbsstr(( const unsigned char * )lpszStart, ( const unsigned char * )pSrc)) != NULL)
{
int nBalance = nOldLength - (lpszTarget - lpch + nSourceLen);
memmove(lpszTarget + nReplacementLen, lpszTarget + nSourceLen,
nBalance * sizeof(CHAR));
memcpy(lpszTarget, pReplace, nReplacementLen*sizeof(CHAR));
lpszStart = lpszTarget + nReplacementLen;
lpszStart[nBalance] = '/0';
nOldLength += (nReplacementLen - nSourceLen);
}
lpszStart += strlen(lpszStart) + 1;
}
return lpch;
}
此方法最關鍵的是_mbsstr函式,在"MBSTRING.H"標頭檔案中宣告。
string replace( const string& inStr, const char* pSrc, const char* pReplace )
{
string str = inStr;
string::size_type stStart = 0;
string::iterator iter = str.begin();
while( iter != str.end() )
{
// 從指定位置 查詢下一個要替換的字串的起始位置。
string::size_type st = str.find( pSrc, stStart );
if ( st == str.npos )
{
break;
}
iter = iter + st - stStart;
// 將目標字串全部替換。
str.replace( iter, iter + strlen( pSrc ), pReplace );
iter = iter + strlen( pReplace );
// 替換的字串下一個字元的位置
stStart = st + strlen( pReplace );
}
return str;
}
上述方法在執行replace( "h h h h h h h h h h h h h h h h h h h ", " ", " " )時出現問題。
下面再列出一種方法:
string CComFunc::replace( const string& inStr, const char* pSrc, const char* pReplace )
{
string strSrc = inStr;
string::size_type pos=0;
string::size_type srclen = strlen( pSrc );
string::size_type dstlen = strlen( pReplace );
while( (pos=strSrc.find(pSrc, pos)) != string::npos)
{
strSrc.replace(pos, srclen, pReplace);
pos += dstlen;
}
return strSrc;
}
補充,經過測試,上面方法再執行,replace( “暴”, "//","==" )時,依然會遇到問題。
在日文系統上,因為“暴”佔兩個位元組,而"//"只佔一個位元組,但與“暴”的低位位元組ASCII碼相同。
而string的Find函式,是按照位元組比較的,所以,將這個位元組替換了,導致文字替換出現問題。
於是考慮到不應該按位元組比較,應該按字元比較,測試發現,CString的替換函式沒有問題,於是考慮按照CString的方法重新寫一個replace函式。
程式碼如下:
因為CString在_MBCS和_UNICODE下是變寬的,而我寫的replace函式,只針對string。
string CComFunc::replace( const string& inStr, const char* pSrc, const char* pReplace )
{
string strSrc = inStr;
LPSTR lpch = ( CHAR* )strSrc.c_str();
int nOldLength = strlen( lpch );
int nSourceLen = strlen(pSrc);
if (nSourceLen == 0)
{
return lpch;
}
int nReplacementLen = strlen(pReplace);
LPSTR lpszStart = lpch;
LPSTR lpszEnd = lpszStart + nOldLength;
LPSTR lpszTarget;
// 先列出判斷替換字元是否存在的方法, 但在此函式中不使用這段程式碼。
/*
// judge whether exist
while (lpszStart < lpszEnd)
{
while ((lpszTarget = (CHAR*)_mbsstr(( const unsigned char * )lpszStart, ( const unsigned char * )pSrc)) != NULL)
{
nCount++;
lpszStart = lpszTarget + nSourceLen;
}
lpszStart += strStart.length() + 1;
}
*//
// 下面是替換的程式碼。
while (lpszStart < lpszEnd)
{
while ((lpszTarget = (CHAR*)_mbsstr(( const unsigned char * )lpszStart, ( const unsigned char * )pSrc)) != NULL)
{
int nBalance = nOldLength - (lpszTarget - lpch + nSourceLen);
memmove(lpszTarget + nReplacementLen, lpszTarget + nSourceLen,
nBalance * sizeof(CHAR));
memcpy(lpszTarget, pReplace, nReplacementLen*sizeof(CHAR));
lpszStart = lpszTarget + nReplacementLen;
lpszStart[nBalance] = '/0';
nOldLength += (nReplacementLen - nSourceLen);
}
lpszStart += strlen(lpszStart) + 1;
}
return lpch;
}
此方法最關鍵的是_mbsstr函式,在"MBSTRING.H"標頭檔案中宣告。