C++11 之字符集

阿新 • • 發佈：2019-02-12

基礎概念理解
1）通常我們將一個標準中能夠表示所有字元的一個集合稱為字符集，如Unicode字符集。
2）在字符集中每個字元佔用一個唯一的碼位。如Unicode就有1114112個字元碼使用0x0~0x10FFFF的16進位制數唯一表示每一個字元。
3）由於計算機中通常時以位元組為單位進行儲存的，因此就要有一種編碼方式對字元碼位進行編碼儲存。如：基於Unicode字集的編碼方式有：UTF-8（1-6個位元組變長編碼方式表示Unicode）、UTF-16、UTF-32。
4）其它字符集ASCII、GB2312（簡體中文及器相關符號，基於區位碼編碼方式），BIG5(繁體中文及其相關字元。2個位元組表示一個漢字)

5）ASCII以7個二進位制為進行表示128個字元，因此其也可以理解為一種編碼方式。
6）不同的編碼方式對於相同二進位制字符集的解釋結果時不同的，這就是網頁有時候按不同編碼方式顯示會出現亂碼的原因。
7）由於眾多的字符集帶來的麻煩，因此ISO/Unicode兩個組織聯合釋出了Unicode字符集，Unicode字符集仍然再發展中，因此過多種字符集及編碼方式共存的情況在相當長的一段時間內仍然會存在。基礎概念理解
C++11對於Unicode支援的改進
1）C++98標準中，定義了wchar_t來支援“Unicode”,由於wchar_t太寬容了，導致成員寫的wcht_t的移植性不好。因為C++98 標準中wchar_t的寬度由編譯器決定，這就出現了wchar_t通常在windows上被實現為16位寬，而Linux下實現為32位寬的情況發生。

2）UTF_8 1~6個位元組的變長編碼，UTF-16 2個位元組定長編碼， UTF-32 4個子節的定長編碼。
3）系統上能否正常考到Unicode字元受：原始檔的儲存格式、編譯器設定的編碼格式、輸出裝置支援的編碼型別。 C++11在語言層面上支援Unicode，由於Linux系統下shell、vi、g++等都依賴locale設定而採用UTF-8編碼，因此UTF-16，UTF-32編碼的字元不能正常顯示。
C++的編碼轉換
1）C++11說是ucchar標頭檔案中有c16rttomb、 mbrttoc16、c32rttomb、mbrttoc32 等四個字元編碼轉換函式，但是嘗試了下，沒有這個標頭檔案及函式。

2）C++對編碼轉換新方法都源於C++的locale機制支援，locale描述的是一些必需知道的區域特徵，如：程式執行的國家/地區的數字符號、日期表示、錢幣符號等。通常知道了一個地區的locale,要使用不同的地區特徵，則需要訪問該locale的一個facet。 facet可以理解為locale的一些介面，比如：num_put/num_get、money_put/money_get、codecvt等。
3） codecvt是一個模板類，實現從當前locale下的多字元編碼字串到多種Unicode編碼轉換的一個facet。每種facet負責不同型別的編碼資料轉換，現行編譯支援的情況下，一種locale並不能支援所有的codecvt facet。程式設計師可以通過has_facet檢視locale在本機的支援情況。例如：
#inlude <locale>
#include <iostream>
using namespace std;

int mian
{
//定義一個locale
locale loc("en_US.UTF-8");

//判斷loc的facet的支援情況
if (!has_facet<codecvt<wchar_t, char, mbstate_t>>(lc))
{
cout << "Do not support muti char to wchar_t facet" << endl;
}

if (!has_facet<codecvt<char, char, mbstate_t>>(lc))
{
cout << "Do not support muti char to char facet" << endl;
}

if (!has_facet<codecvt<char16_t, char, mbstate_t>>(lc))
{
cout << "Do not support utf-16 to utf-8 facet" << endl;
}

if (!has_facet<codecvt<char32_t, char, mbstate_t>>(lc))
{
cout << "Do not support utf-32 to utf-8 facet" << endl;
}
return 0;
}

C++11 之字符集

基礎概念理解 1）通常我們將一個標準中能夠表示所有字元的一個集合稱為字符集，如Unicode字符集。 2）在字符集中每個字元佔用一個唯一的碼位。如Unicode就有1114112個字元碼使用0x0~0x10FFFF的16進位制數唯一表示每一個字元。 3）由於計算機中通常時

C++11之decltype

family 有變 con mod decltype space word div c++11 使用場景在C++中常常要用到非常長的變量名。假設已經有變量和你將使用的變量是一個類型。就可以使用decltypekeyword 來申明

C++11之右值引用與移動構造

添加 oooo 返回對象 oat 值引用 apc 定義 tco pri ----------------------------右值引用--------------------------------- 右值定義：　　通俗來講，賦值號左邊的就是左值，賦值號右邊的就

C++11之智能指針

周期智能指針文件的指向 delet 多個構造循環引用出現 1、關於智能指針的理解　　1）智能指針是使用RAII技術（資源的獲取即初始化）對普通指針進行封裝得到的，其實質是一個指針，使用起來像指針。　　2）智能指針可以用來解決程序員忘記使用delete釋放內存

C++11之for迴圈

簡單使用：輸出每個元素： string s = "biu biu biu"; for(auto i : s) { cout<<i<<endl; } 順帶

C++11之initialization_list

轉自http://blog.csdn.net/hailong0715/article/details/54018002 在我們實際程式設計中，我們經常會碰到變數初始化的問題，對於不同的變數初始化的手段多種多樣，比如說對於一個數組我們可以使用 int arr[] = {1,2,

C++11之for迴圈的新用法 for（：）語句

轉載自：https://www.cnblogs.com/jiayayao/p/6138974.html C++使用如下方法遍歷一個容器： #include "stdafx.h" #include<iostream> #include<vector>

c++11之初始化列表

一、前言 C++的學習中，我想每個人都被變數定義和申明折磨過，比如我在大學筆試過的幾家公司，都考察了const和變數，型別的不同排列組合，讓你區別有啥不同。反正在學習C++過程中已經被折磨慣了，今天再來看看重溫下那段“輝煌的歷史”。先來看一段程式碼： Playe

C++ 11之 && 右值引用

最近在看cocos2dx的原始碼，發現了一個模板類有一個奇怪的語法&&： inline RefPtr(RefPtr<T> && other) {

C++11之std::function和std::bind

std::function是可呼叫物件的包裝器，它最重要的功能是實現延時呼叫： #include "stdafx.h" #include<iostream>// std::cout #include<functional>// std::fu

c++11之move和forward

　　stout中大量使用了c++11的特性，而c++11中move和forward大概是最神奇的特性了. 左值和右值的區別 int a = 0; // a是左值，0是右值 int b = rand(); // b是左值，rand()是右值　　直觀理解：左值在等

stout程式碼分析之十：c++11之move和forward

　　stout中大量使用了c++11的特性，而c++11中move和forward大概是最神奇的特性了. 左值和右值的區別 int a = 0; // a是左值，0是右值 int b = rand(); // b是左值，rand()是右值　　直觀理解：左值在等號左邊，右值在等號

C++11之begin、end函式

C++11引入了 begin 和 end 的函式，這兩個函式與容器中的兩個同名成員功能類似，不過這兩個函式不是成員函式，而是含有引數的函式。用法說明： begin 返回首元素的地址，end 返回尾

C++11之std--future和std--promise

　　為什麼C++11引入std::future和std::promise？C++11建立了執行緒以後，我們不能直接從thread.join()得到結果，必須定義一個變數，線上程執行時，對這個變數賦值，然後執行join()，過程相對繁瑣。　　thread庫提供了future

C++11之final關鍵字

時間：2014.06.05 地點：基地 ----------------------------------------------------------------------------- 一、禁用繼承 C++11中允許將類標記為final，方法時直接在類名稱後面使用

C++11之AOP實現

AOP 相信大家對面向物件程式設計一定都熟悉透了。面向物件程式設計的繼承是一種從上而下的關係，不適合從左到右的橫向關係，試想一下如果很多無關聯的物件有公共的行為，這些公共的行為可能分散在不同元件和不同物件中，通過繼承實現一定是很不好的。那應該怎麼實現呢？對滴，

c++11之單例模式

以往用C++實現一個單例模式需要寫以下程式碼： 1 class CSingleton 2 { 3 private: 4 CSingleton() //建構函式是私有的 5 { 6 } 7 static CSingleton

初探c++11之for迴圈篇

轉自：https://www.cnblogs.com/l00l/archive/2012/02/03/2337557.html在很多語言中都有類似foreach之類的迴圈關鍵字。在C++11中，也添加了類似的語言特性。不過，這裡首先說一句，在STL已經有類似的東西，std::

C++11之如何實現控制反轉

一個小例子我們先寫一個不使用控制反轉的小例子： #include <iostream> using namespace std; struct A{ virtual void func(){} virtual ~A(){

C++11之lock_guard學習總結和程式碼例項

std::lock_gurad 是 C++11 中定義的模板類。定義如下： template<class _Mutex> class lock_guard { // class with destructor that un

C++11 之字符集

相關推薦