C++字串處理

阿新 • • 發佈：2019-01-05

標題：常見字串處理程式碼示例

測試環境：boost 1.55、boost 1.57

注意：部份程式碼依賴Windows API

[1]刪除指定前後綴的字元

#include <boost/algorithm/string.hpp>

...

boost::trim_if(vecRec[0], boost::is_any_of("\" \n\r\t'"));

[2]分割字串

#include <boost/algorithm/string/split.hpp>

std::vector<std::string> vecRec;
boost::split(vecRec, vecDst[i], boost::is_any_of(":"));

[3]字元替換

x字元替換為y。

std::replace( s.begin(), s.end(),'x','y');

標頭檔案

#pragma once

#include <string>
#include <vector>
#include <map>

namespace StringHelper
{
	void SplitStr(const std::string& s, std::string& delim,std::vector<std::string> &ret);  
	void Str2Map(const std::string strSrc, std::map<std::string, std::string> &mapKeyValue);
	std::string UTF8ToGBK(const std::string &unicode);
	std::string GBKToUTF8(const std::string& gbk);
	std::wstring s2ws_UTF8ToGBK(std::string sUTF8);

	std::wstring s2ws_gbk(const std::string& s);
	std::string ws2s_gbk(const std::wstring& s);
	void  string_replace( std::wstring &strBig, const std::wstring &strsrc, const std::wstring &strdst );

	std::string encodeURI(std::string strSrc);

	std::string delHeapMemory(char *p);
};

實現檔案

#include "StringHelper.h"

#include <Windows.h>

#include <algorithm>  

#include <boost/regex.hpp>  
#include <boost/algorithm/string.hpp>  

#include <locale>
#include <codecvt>

#include <sstream>

using namespace std;

/*
VC++ 2008 SP1提供了個編譯選項，可以預設就構造出UTF8的string。
#pragma execution_character_set("utf-8") 

另外C++11定義了u8，類似L
std::string nstr = u8"123,我是誰？";
但VS2010SP1並不支援。
*/

namespace StringHelper
{
	void SplitStr(const std::string& s, std::string& delim,std::vector<std::string> &ret)
	{  
		size_t last = 0;
		size_t index=s.find_first_of(delim,last);
		while (index!=std::string::npos)
		{
			ret.push_back(s.substr(last,index-last));
			last=index+1;
			index=s.find_first_of(delim,last);

			if (index-last>0)
			{
				ret.push_back(s.substr(last,index-last));
			}
		}
	}//end func

	void Str2Map( const std::string strSrc, std::map<std::string, std::string> &mapKeyValue )
	{ 
		std::vector<std::string> line;  
		boost::split(line, strSrc, boost::is_any_of(";"));  
		for (unsigned int i = 0; i < line.size(); i++)  
		{  
			std::vector<std::string> vecT;  
			boost::split(vecT, line[i], boost::is_any_of("="));  
			if (vecT.size() == 2)  
			{  
				vecT[0] = vecT[0].substr(vecT[0].find_first_not_of(' '), vecT[0].find_last_not_of(' '));  
				mapKeyValue[vecT[0]] = vecT[1];  
			}//end if  
		}//end for  
	}

	wstring s2ws_UTF8ToGBK(string sUTF8)
	{
		std::wstring_convert<std::codecvt_utf8<wchar_t>> conv;
		std::wstring wsR =  conv.from_bytes(sUTF8);
		std::locale::global(std::locale("Chinese-simplified"));

		wstringstream wss;
		wss<<wsR;
		return wss.str();
	}

	std::string UTF8ToGBK( const std::string &strUTF8 )
	{
		try
		{
			std::wstring gbk = s2ws_UTF8ToGBK(strUTF8);
			std::string sGBK = ws2s_gbk(gbk);
			return sGBK;
		}
		catch (...)
		{			
		}
		return "";
	}

	std::string GBKToUTF8(const std::string& gbk)  
	{  
		std::string strOutUTF8 = "";  
		WCHAR * str1;  
		int n = MultiByteToWideChar(CP_ACP, 0, gbk.c_str(), -1, NULL, 0);  
		str1 = new WCHAR[n];  
		MultiByteToWideChar(CP_ACP, 0, gbk.c_str(), -1, str1, n);  
		n = WideCharToMultiByte(CP_UTF8, 0, str1, -1, NULL, 0, NULL, NULL);  
		char * str2 = new char[n];  
		WideCharToMultiByte(CP_UTF8, 0, str1, -1, str2, n, NULL, NULL);  
		strOutUTF8 = str2;  
		delete[]str1;  
		str1 = NULL;  
		delete[]str2;  
		str2 = NULL;  
		return strOutUTF8;  
	}

	std::wstring s2ws_gbk( const std::string& s )
	{
		int len;  
		int slength = (int)s.length() + 1;  
		len = MultiByteToWideChar(CP_ACP, 0, s.c_str(), slength, 0, 0);  
		wchar_t* buf = new wchar_t[len];  
		MultiByteToWideChar(CP_ACP, 0, s.c_str(), slength, buf, len);  
		std::wstring r(buf);  
		delete[] buf;  
		return r;  
	}

	std::string ws2s_gbk(const std::wstring& ws)  
	{  
		std::string curLocale = setlocale(LC_ALL, NULL); // curLocale = "C";
		setlocale(LC_ALL, "chs");
		const wchar_t* _Source = ws.c_str();
		size_t _Dsize = 2 * ws.size() + 1;
		char *_Dest = new char[_Dsize];
		memset(_Dest,0,_Dsize);
		wcstombs(_Dest,_Source,_Dsize);
		std::string result = _Dest;
		delete []_Dest;
		setlocale(LC_ALL, curLocale.c_str());
		return result;
	}

	void  string_replace( std::wstring &strBig, const std::wstring &strsrc, const std::wstring &strdst )  
	{  
		std::wstring::size_type pos = 0;  
		std::wstring::size_type srclen = strsrc.size();  
		std::wstring::size_type dstlen = strdst.size();  

		while( (pos=strBig.find(strsrc, pos)) != std::string::npos )  
		{  
			strBig.replace( pos, srclen, strdst );  
			pos += dstlen;  
		}  
	}

	std::string delHeapMemory( char *p )
	{
		std::string temp = p;
		delete p;
		return temp;
	}

	BOOL UrlEncode(const char* szSrc, char* pBuf, int cbBufLen, BOOL bUpperCase)  
	{  
		if (szSrc == NULL || pBuf == NULL || cbBufLen <= 0)  
			return FALSE;  

		size_t len_ascii = strlen(szSrc);  
		if (len_ascii == 0)  
		{  
			pBuf[0] = 0;  
			return TRUE;  
		}  

		//先轉換到UTF-8  
		char baseChar = bUpperCase ? 'A' : 'a';  
		int cchWideChar = MultiByteToWideChar(CP_ACP, 0, szSrc, len_ascii, NULL, 0);  
		LPWSTR pUnicode = (LPWSTR)malloc((cchWideChar + 1) * sizeof(WCHAR));  
		if (pUnicode == NULL)  
			return FALSE;  
		MultiByteToWideChar(CP_ACP, 0, szSrc, len_ascii, pUnicode, cchWideChar + 1);  

		int cbUTF8 = WideCharToMultiByte(CP_UTF8, 0, pUnicode, cchWideChar, NULL, 0, NULL, NULL);  
		LPSTR pUTF8 = (LPSTR)malloc((cbUTF8 + 1) * sizeof(CHAR));  
		if (pUTF8 == NULL)  
		{  
			free(pUnicode);  
			return FALSE;  
		}  
		WideCharToMultiByte(CP_UTF8, 0, pUnicode, cchWideChar, pUTF8, cbUTF8 + 1, NULL, NULL);  
		pUTF8[cbUTF8] = '\0';  

		unsigned char c;  
		int cbDest = 0; //累加  
		unsigned char *pSrc = (unsigned char*)pUTF8;  
		unsigned char *pDest = (unsigned char*)pBuf;  
		while (*pSrc && cbDest < cbBufLen - 1)  
		{  
			c = *pSrc;  
			if (isalpha(c) || isdigit(c) || c == '-' || c == '.' || c == '~')  
			{  
				*pDest = c;  
				++pDest;  
				++cbDest;  
			}  
			else if (c == ' ')  
			{  
				*pDest = '+';  
				++pDest;  
				++cbDest;  
			}  
			else  
			{  
				//檢查緩衝區大小是否夠用？  
				if (cbDest + 3 > cbBufLen - 1)  
					break;  
				pDest[0] = '%';  
				pDest[1] = (c >= 0xA0) ? ((c >> 4) - 10 + baseChar) : ((c >> 4) + '0');  
				pDest[2] = ((c & 0xF) >= 0xA) ? ((c & 0xF) - 10 + baseChar) : ((c & 0xF) + '0');  
				pDest += 3;  
				cbDest += 3;  
			}  
			++pSrc;  
		}  
		//null-terminator  
		*pDest = '\0';  
		free(pUnicode);  
		free(pUTF8);  
		return TRUE;  
	}  

	string encodeURI(string strSrc)  
	{  
		char *buf[512];  
		memset(buf, 0, sizeof(buf));  
		UrlEncode(strSrc.c_str(), (char*)(buf), sizeof(buf), TRUE);  

		string dst((char *)buf);  
		return dst;  
	}  
};

字串轉大寫（或小寫）

http://www.cnblogs.com/mmix2009/archive/2013/07/19/3200150.html

C和C++字串處理整理

標籤： c c++ 在刷leetcode題目的過程中，發現自己對於c和c++字串的處理並不是很拿手，處理起來比較費勁，而且，演算法題似乎很中意字串的處理，有很多題目都涉及到它。字串處理比較基礎，但是很重要，因此，整理和深入學習字串的處理對於後續的學習來說擁有巨大的作用。首先，看C語言環境下

C++字串處理函式

C++字串處理函式轉載自c/c++字串處理大集合 C++： <string> string str; 1. 字串長度 len = str.length(); len = str.size(); 2. 字串比較可

c/c++字串處理大集合

rember this strncpy(a,b,5); a[5]='\0'; char a[10]; memset(a,'#',sizeof(a)); a[10]='\0'; 剛開始學C/C++時，一直對字串處理函式一知半解，這裡列舉C/C++字串處理函式

C# 字串處理類

using System;using System.Collections.Generic;using System.Text;using System.Text.RegularExpressions; namespace ZD.Utilities{ /// <summary> /// 字串操作

C++字串處理大集合

#include <string> string str; 1. 字串長度 len = str.length(); len = str.size(); 2. 字串比較可以直接比較也可以: str1.com

C++字串處理

標題：常見字串處理程式碼示例測試環境：boost 1.55、boost 1.57 注意：部份程式碼依賴Windows API [1]刪除指定前後綴的字元 #include <boost/algorithm/string.hpp> ... boost::tri

C++字串處理（重寫）trcpy、strlen、strcat、strcmp、strlwr、strupr、strrev、strchr、strpbrk、strstr、strtokhttps://blog

轉載自：https://blog.csdn.net/sck5711/article/details/5995742最近有點懶很久沒有上CSDN上發表文章，抽出了點時間把字串處理函式重寫了一遍。本文僅供參考，如有錯誤請糾正。謝謝！/*函式： strcpy原型： char * s

C/C++ 字串處理函式

C語言中的字串處理函式： 1. 字串長度 extern int strlen(char *s); //返回s的長度，不包括結束符NULL。該函式以結束符為判斷字串長度結束的標誌。註釋：沒有memsize函式或是memlen函式嗎？ 2. 字串比較 extern int strcmp(char

C/C++字串處理庫

快使用Boost啊！簡單的複雜的都有，C++11的regex就是從這裡來的，我用過簡單的如格式化字串、數字和字串互轉、字串各種編碼之間互相轉化、字串查詢、替換、根據特定識別符號分割、去空白字元等；複雜點的用ptree解析json和xml，更復雜的還有做parser的spirit和專門用來做自動機的什麼什麼

C++筆試題字串處理

字串處理描述定義字串的以下幾種操作： • reverse(A)獲得A字串的逆序字串，例如reverse(“abc”) = “cba” • shuffle(A)獲得A隨機重排的字串，例如shuffle(“dog”) ∈ {“dog”, “dgo”, “odg”, “ogd”,

【C語言】字串處理自定義函式

1、字串求長度 #include <stdio.h> int Mystrlen1(const char *str) { int i=0; while(*(str++)!='\0') { i++; } return i; } int Mystrlen2(cons

(C/C++學習)14.C語言字串處理函式(二)

說明：上節著重解釋了字串處理的庫函式處理，這節將針對一些常用的需求，進行非庫函式的處理。一.去除某一個字串中的某個字元 1.去除字串右邊的空格 1 void trimStrRightSpace(char * str) 2 { 3 while(*str) 4 s

201403-3命令列選項（c++，字串處理）

試題編號： 201403-3 試題名稱：命令列選項時間限制： 1.0s 記憶體限制： 256.0MB 問題描述：問

C語言字串處理

//輸入一段字串，無論是否有重複字母出現， //都只打印出現過的小寫字母，並按照小寫字母順序列印。 //如輸入qewqwr322rqw<>211qESFSSEraZz，列印aeqrwz） #include <stdio.h> void fun(); voi

14. C語言 -- 字串處理函式

本部落格主要內容為 “小甲魚” 視訊課程《帶你學C帶你飛》【第一季】學習筆記，文章的主題內容均來自該課程，在這裡僅作學習交流。在文章中可能出現一些錯誤或者不準確的地方，如發現請積極指出，十分感謝。也歡迎大家一起討論交流，如果你覺得這篇文章對你有所幫助，記得評論、點贊哦　～(｡

C語言：字串處理類函式

strlen() 求字串的實際長度(不包括'\0') strcpy() char *strcpy(char* dest, const char *src); strcpy(目標串，源串); strcp

常用的c語言字串處理函式

1.獲取一個字串 char *p = fgets(buf, size, stdin); 2.字串查詢 ret = strstr(cmd, "test"); if(ret != NULL)

字串處理（c語言）

[提交] [統計] [提問] 題目描述讀入兩個字串，字串除了數字還可能包括 ‘—’、‘E’、‘e’、’．’，相加之後輸出結果，如果是浮點型，要求用科學計數法表示（最多包含10個有效數字）。輸入描述輸入包含多組測試資料。每組輸入佔兩行，每行一個字串，測試資料保證字串

[C/C++]_[初級]_[Windows上的字串處理實用函式]

場景 1.C/C++開發過程中, C字串函式或者std::string是相當實用的了, 可以查詢,擷取,移除等, 但是一般都是移除指定的一個字元而不是字串, 移除還是大小寫敏感的. 當然也可以用正則表示式來移除或查詢, 但是總也得3-4行程式碼吧. 2.std::string

C語言字元和字串處理函式(二)strchr,strpbrk,strstr

查詢字元或者字串查詢一個字元：和和和strchr（）。函式返回一個指向STR中CH首次出現的位置，當沒有在STR中找CH就報道檢視NULL。查詢任意字元：strpbrk（）函式返回一個指標，它指向字串STR2中任意字元在字串STR1首次出現的位置，如果不存在返

C++字串處理

相關推薦