C++中ASCII、unicode與Utf8之間的相互轉化

阿新 • • 發佈：2019-01-07

一、windows下轉換方法：

// 當type為CP_ACP時，GBK轉化為UNICODE；當type為CP_UTF8時，UTF8轉化為UNICODE
wchar_t* trans(const char * ch, int type = CP_ACP) {
    int len = MultiByteToWideChar(type, 0, ch, -1, nullptr, 0);
    wchar_t *str = new wchar_t[len + 1];
    wmemset(str, 0, len + 1);
    MultiByteToWideChar(type, 0, ch, -1, str, len);
    return str;
}
// 當type為CP_ACP時，UNICODE轉化為GBK；當type為CP_UTF8時，UNICODE轉化為UTF8
char* trans(const wchar_t * wch, int type = CP_ACP) {
    int len = WideCharToMultiByte(type, 0, wch, -1, nullptr, 0, nullptr, nullptr);
    char *str = new char[len + 1];
    memset(str, 0, len + 1);
    WideCharToMultiByte(type, 0, wch, -1, str, len, nullptr, nullptr);
    return str;
}

注意：轉換後的字串，使用之後，需要delete掉。

二、linux下轉換方法：

bool trans(const char *pFromCode,const char *pToCode,const char *pInBuf,size_t iInLen,char *pOutBuf,size_t iOutLen)
{
    //開啟字符集轉換
    iconv_t hIconv = iconv_open(pToCode, pFromCode);
    if (! hIconv) return false;
    //開始轉換
    size_t iRet = iRet = iconv(hIconv, (char **) (&pInBuf), &iInLen, &pOutBuf, &iOutLen);
    //關閉字符集轉換
    iconv_close(hIconv);
    return (bool)iRet;
}

使用方法：

    string result = "這是gbk字串";
    char ch[255];
    memset(ch,'\0',sizeof(ch));
    trans("GBK","UTF-8",result.c_str(),result.size(),ch,sizeof(ch));

注意：需要安裝libiconv的開發包，並引入標頭檔案#include "iconv.h"

三、c++11自帶的編碼轉換器，程式碼如下：

#include "stdafx.h"
#include <iostream>
#include <string>
#include <codecvt>

using namespace std;

using WCHAR_GBK		= codecvt_byname<wchar_t, char, mbstate_t>;
using WCHAR_UTF8	= codecvt_utf8<wchar_t>;

// linux下為"zh_CN.GBK"
#define GBK_NAME ".936"

int main()
{
	// 定義一個utf8字串
	string result = u8"中國人"; 
	// gbk與unicode之間的轉換器
	wstring_convert<WCHAR_GBK>  cvtGBK(new WCHAR_GBK(GBK_NAME));
	// utf8與unicode之間的轉換器
	wstring_convert<WCHAR_UTF8> cvtUTF8;
	// 從utf8轉換為unicode
	wstring ustr = cvtUTF8.from_bytes(result);
	// 從unicode轉換為gbk
	string str = cvtGBK.to_bytes(ustr);

	cout << str << endl;
	getchar();
    return 0;
}

C++中ASCII、unicode與Utf8之間的相互轉化

一、windows下轉換方法： // 當type為CP_ACP時，GBK轉化為UNICODE；當type為CP_UTF8時，UTF8轉化為UNICODE wchar_t* trans(const c

ASCII、 Unicode 和 UTF8

abcd 表達 sci 因此便是存儲 clas 編碼方式個數 ASCII：英文字母與數字編號的一一對應。每個英文字母對應一個編號。範圍0~127 Unicode：全世界所有語言中字符與數字編號的一一對應。也即為存在的每個字符指定一個唯一的編號。範圍為0~0x10

字符編碼，ASCII、Unicode與UTF-8的理解

F5 標準化一般來說簡書打開文件說了 tps can 常用首先我們先要明白的兩點是：1、計算機中的信息都是由二進制的0和1儲存的；2、我們再計算機屏幕上看到的各種字符都是計算機系統按照一定的規則將二進制數字轉換而來的。一、基本概念。 1、字符集（charse

【轉載】字元編碼中ASCII、Unicode和UTF-8的區別

1. ASCII碼我們知道，在計算機內部，所有的資訊最終都表示為一個二進位制的字串。每一個二進位制位（bit）有0和1兩種狀態，因此八個二進位制位就可以組合出256種狀態，這被稱為一個位元組（byte）。也就是說，一個位元組一共可以用來表示256種不同的狀態，每一個狀態對應一個符

關於字元編碼：ascii、unicode與utf-8

轉自：https://foofish.net/unicode_utf-8.html 阮一峰老師對普及計算機基礎技術功不可沒，但畢竟老師不是神，因此也避免不了對某些概念有一些錯誤的理解，《字元編碼筆記：ASCII，Unicode 和 UTF-8 》是阮老師10年前寫的一篇關於字元編

【C++】C++中typedef、auto與decltype的作用

typedef 類型別名（type alias）是一個名字，使用typedef不會真正地建立一種新的資料型別，它只是已經存在資料型別的一個新名稱。語法： typedef type name; 其中type是c++中的資料型別，name是這個型別的一個別名。C++11提供了引用的功能，關於引用的

Go語言高級特性總結——Struct、Map與JSON之間的轉化

err bsp make 特性 clas 高級 string comm tag Struct與Map之間互相轉換 1 // Struct2Map convert struct to map 2 func Struct2Map(st interface{}) map[s

C#中父類和子類之間相互轉換

mage all spa 分享 mic ack 子類 utl round 所用到的類文件:Person.cs:Student.cs:Teacher.cs:問題1:總結:1 父類不能直接強制轉換成子類2 只有父類對象指向子類，那麽父類是可以強制轉換成子類，如果父類對象沒有指向

C# 中 double 型數值與 DateTime 的相互轉換

double n = 0; DateTime origintime = DateTime.FromOADate(0); // origintime.ToString()等於“1899-12-30 0：00：00” while (DateTime.FromOADate(n) != Command

java 列表、集合與陣列之間的轉化

package test; import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util

C++中int或double與string的相互轉換

一、int轉string 1.c++11標準增加了全域性函式std::to_string: string to_string (int val); string to_string (long val); string to_string (long l

列表、集合與陣列之間的轉化

陣列和List、Set都可以存放多個元素，陣列的特點是長度固定，訪問速度非常快，元素型別單一；List的特點是長度可以動態增加，能夠維護元素的次序，存入的所有元素都當做Object，允許元素重複；Set的特點是長度可以動態增加，能夠保證元素不重複，存入的所有元素都當做Object。本節例項介紹Set

Java Bean與Map之間相互轉化的實現

涵蓋 ffffff ger 動態性 ring eth 名稱分享圖片 tro 目錄樹概述Apache BeanUtils將Bean轉MapApache BeanUtils將Map轉Bean理解BeanUtils將Bean轉Map的實現之手寫Bean轉Map 概述　　Apac

C/C++中ASCII與Unicode字串相互轉換

轉載地址:https://blog.csdn.net/wbq2018/article/details/8806431 1、ASCII to Unicode 函式: wcstombs(VC6)、wcstombs_s 例項: //crt_wcstombs_s.c //This examp

C#中變數與物件、型別與類之間的區別

在C#中，我們經常通過宣告一個變數來儲存資料，那麼什麼叫宣告（declare）變數呢？宣告變數是指在宣告一個變數時，要告訴程式這個變數的型別（type）和變數名（name），如int n。那什

所謂編碼--泛談ASCII、Unicode、UTF8、UTF16、UCS-2等編碼格式

dia 做了 enter log 一起數量字符編碼 bmp src 　　最近在看nodejs的源碼，看到stream的實現裏面滿地都是encoding，不由想起以前看過的一篇文章——在前面的隨筆裏面有提到過——阮一峰老師的《字符編碼筆記:ASCII，Unicode和UT

關於UTF-8、ASCII、Unicode、gbk、gb2312之間的關系的筆記

之間 class image 特殊字符 ade ner strong asc 清晰一直對於字符編碼不是很清晰，只知道所有都sublime編輯文檔時候設置：文檔編碼為UTF-8、PHP的header也就是瀏覽器http響應頭顯示UTF-8、HTML的meta信息也聲明為UT

C++中的動態型別與動態繫結、虛擬函式、執行時多型的實現【轉】

（轉自：https://blog.csdn.net/iicy266/article/details/11906509）動態型別與靜態型別靜態型別是指不需要考慮表示式的執行期語

C#中IEnumerable、ICollection、IList、IQueryable 、List之間的區別

一：一個簡單的例子 1 2 3 4 5 6 7 8 int[] myArray = { 1, 32, 43, 343 };

java中unicode與字串之間的互相轉換

字串與unicode之間的互相轉換/*** 字串轉換unicode*/public static String string2Unicode(String string) { StringBuffer unicode = new StringBuffer(); for (i

C++中ASCII、unicode與Utf8之間的相互轉化

相關推薦