1. 程式人生 > >VC中的字串轉換巨集

VC中的字串轉換巨集

  ATL7.0引入了幾個新的轉換類和巨集,現有的巨集提供了顯著的改善。新的字串轉換類和巨集的名稱,採取的形式如下:
C SourceType 2[C]DestinationType[EX] 
        其中,[C]表示目的型別是const型別的,[EX]表示指定了儲存字串資料的固定靜態快取區的大小,如果字串轉換的結果超過了模板引數的大小,使用malloc分配空間,並在物件超出範圍時釋放記憶體。所以說這個轉換巨集(實質是個類)在迴圈中使用也是安全,它不會堆疊溢位。另外,如果試圖分配堆記憶體和失敗,它會呼叫AtlThrow丟擲E_OUTOFMEMORY異常資訊。
比較好的使用方法如下:
CA2T szr(szReplaceFile);  
不贊成使用如下方法:
LPCTSTR szr = CA2T(szReplaceFile); 
另外,可以指定緩衝區大小來做為模板引數,如下:
// Changing the size of the buffer. 
void ExampleFunction4(LPCWSTR pszW) 

   // Use a 16-character buffer. 
   ExampleFunctionA(CW2AEX<16>(pszW)); 

指定內碼表進行轉換,如下:
// Specifying the code page. 
void ExampleFunction5(LPCWSTR pszW) 

   // Convert to the Macintosh code page 
   ExampleFunctionA(CW2A(pszW, CP_MACCP)); 

在實際應用中,Ansi、Unicode、Utf-8之間的轉換比較多,方法可如下:
Ansi→Unicode
CA2W pszW(pszA); 
Ansi→Utf-8
CW2A pszU8(CA2W(pszA), CP_UTF8); 
Unicode→Ansi
CW2A pszA(pszW); 
Unicode→Utf-8
CW2A pszU8(pszW, CP_UTF8); 
Utf-8→Ansi
CW2A pszA(CA2W(pszU8, CP_UTF8)); 
Utf-8→Unicode
CA2W pszW(pszU8, CP_UTF8); 
對於通用字串_T()來說,如下:
_T→Ansi
CT2A pszA(pszT); 
_T→Unicode
CT2W pszW(pszT); 
_T→Utf-8
CW2A pszU8(CT2W(pszT), CP_UTF8); 
Ansi→_T
CA2T pszT(pszA); 
Unicode→_T
CW2T pszT(pszW); 
Utf-8→_T
CW2T pszT(CA2W(pszU8, CP_UTF8)); 
另外,對於CString,還可以如下:
CStringA strA(pszW); 
CStringW strW(pszA); 
CString str(CA2W(pszU8, CP_UTF8)); 

測試程式碼如下:
void CTestFileTestDlg::OnTest() 

    char *pszAnsi = "akof1314無幻"; 
    ::MessageBoxA(NULL, pszAnsi, NULL, MB_OK); 
    ::MessageBoxW(NULL, CA2W(pszAnsi), NULL, MB_OK); 
 
 
    wchar_t *pszUnicode = L"akof1314無幻"; 
    ::MessageBoxA(NULL, CW2A(pszUnicode), NULL, MB_OK); 
    ::MessageBoxW(NULL, pszUnicode, NULL, MB_OK); 
 
 
    //以下是UTF-8編碼的字串"akof1314無幻" 
    char *pszUtf8 = "\x61\x6b\x6f\x66\x31\x33\x31\x34\xe6\x97\xa0\xe5\xb9\xbb"; 
    ::MessageBoxA(NULL, CW2A(CA2W(pszUtf8, CP_UTF8)), NULL, MB_OK); 
    ::MessageBoxW(NULL, CA2W(pszUtf8, CP_UTF8), NULL, MB_OK); 
 
 
    CStringA strA(pszUnicode); 
    ::MessageBoxA(NULL, strA, NULL, MB_OK); 
 
 
    CStringW strW(pszAnsi); 
    ::MessageBoxW(NULL, strW, NULL, MB_OK); 
 
 
    CString str(CA2W(pszUtf8, CP_UTF8)); 
    ::MessageBox(NULL, str, NULL, MB_OK); 

以上輸出全部一樣,不管在多位元組下,還是Unicode環境下。

參考資料:
1.ATL and MFC String Conversion Macros  http://msdn.microsoft.com/en-us/library/87zae4a3(v=vs.110).aspx
2.C++中Ansi、Unicode、UTF8字串之間的轉換和寫入文字檔案  http://dark0729.blogbus.com/logs/51496111.html
3.UTF-8, CString and CFile? (C++, MFC)  http://stackoverflow.com/questions/2318481/utf-8-cstring-and-cfile-c-mfc