VC中的字串轉換巨集
ATL7.0引入了幾個新的轉換類和巨集,現有的巨集提供了顯著的改善。新的字串轉換類和巨集的名稱,採取的形式如下:
C SourceType 2[C]DestinationType[EX]
其中,[C]表示目的型別是const型別的,[EX]表示指定了儲存字串資料的固定靜態快取區的大小,如果字串轉換的結果超過了模板引數的大小,使用malloc分配空間,並在物件超出範圍時釋放記憶體。所以說這個轉換巨集(實質是個類)在迴圈中使用也是安全,它不會堆疊溢位。另外,如果試圖分配堆記憶體和失敗,它會呼叫AtlThrow丟擲E_OUTOFMEMORY異常資訊。
比較好的使用方法如下:
CA2T szr(szReplaceFile);
不贊成使用如下方法:
LPCTSTR szr = CA2T(szReplaceFile);
另外,可以指定緩衝區大小來做為模板引數,如下:
// Changing the size of the buffer.
void ExampleFunction4(LPCWSTR pszW)
{
// Use a 16-character buffer.
ExampleFunctionA(CW2AEX<16>(pszW));
}
指定內碼表進行轉換,如下:
// Specifying the code page.
void ExampleFunction5(LPCWSTR pszW)
{
// Convert to the Macintosh code page
ExampleFunctionA(CW2A(pszW, CP_MACCP));
}
在實際應用中,Ansi、Unicode、Utf-8之間的轉換比較多,方法可如下:
Ansi→Unicode
CA2W pszW(pszA);
Ansi→Utf-8
CW2A pszU8(CA2W(pszA), CP_UTF8);
Unicode→Ansi
CW2A pszA(pszW);
Unicode→Utf-8
CW2A pszU8(pszW, CP_UTF8);
Utf-8→Ansi
CW2A pszA(CA2W(pszU8, CP_UTF8));
Utf-8→Unicode
CA2W pszW(pszU8, CP_UTF8);
對於通用字串_T()來說,如下:
_T→Ansi
CT2A pszA(pszT);
_T→Unicode
CT2W pszW(pszT);
_T→Utf-8
CW2A pszU8(CT2W(pszT), CP_UTF8);
Ansi→_T
CA2T pszT(pszA);
Unicode→_T
CW2T pszT(pszW);
Utf-8→_T
CW2T pszT(CA2W(pszU8, CP_UTF8));
另外,對於CString,還可以如下:
CStringA strA(pszW);
CStringW strW(pszA);
CString str(CA2W(pszU8, CP_UTF8));
測試程式碼如下:
void CTestFileTestDlg::OnTest()
{
char *pszAnsi = "akof1314無幻";
::MessageBoxA(NULL, pszAnsi, NULL, MB_OK);
::MessageBoxW(NULL, CA2W(pszAnsi), NULL, MB_OK);
wchar_t *pszUnicode = L"akof1314無幻";
::MessageBoxA(NULL, CW2A(pszUnicode), NULL, MB_OK);
::MessageBoxW(NULL, pszUnicode, NULL, MB_OK);
//以下是UTF-8編碼的字串"akof1314無幻"
char *pszUtf8 = "\x61\x6b\x6f\x66\x31\x33\x31\x34\xe6\x97\xa0\xe5\xb9\xbb";
::MessageBoxA(NULL, CW2A(CA2W(pszUtf8, CP_UTF8)), NULL, MB_OK);
::MessageBoxW(NULL, CA2W(pszUtf8, CP_UTF8), NULL, MB_OK);
CStringA strA(pszUnicode);
::MessageBoxA(NULL, strA, NULL, MB_OK);
CStringW strW(pszAnsi);
::MessageBoxW(NULL, strW, NULL, MB_OK);
CString str(CA2W(pszUtf8, CP_UTF8));
::MessageBox(NULL, str, NULL, MB_OK);
}
以上輸出全部一樣,不管在多位元組下,還是Unicode環境下。
參考資料:
1.ATL and MFC String Conversion Macros http://msdn.microsoft.com/en-us/library/87zae4a3(v=vs.110).aspx
2.C++中Ansi、Unicode、UTF8字串之間的轉換和寫入文字檔案 http://dark0729.blogbus.com/logs/51496111.html
3.UTF-8, CString and CFile? (C++, MFC) http://stackoverflow.com/questions/2318481/utf-8-cstring-and-cfile-c-mfc