1. 程式人生 > >PYTHON 之 字符編碼的區別與介紹

PYTHON 之 字符編碼的區別與介紹

設計 code water image 組織 ffffff 代碼 watermark nic

理解字符編碼的歷史與使用原因

技術分享圖片

1、計算機只能認0與1。
2、通過0與1,二進制數,計算機能很容易識別出各種數字。
3、為了能讓計算機識別各種字符,美國人制定了ASCII碼,能識別出127種字母與特殊字符,只需使用一個字節。
3、因為ASCII碼不支持中文,在1980設計出gb2312 ,收錄了7445個漢字。
4、到了1995年 設計出BGK1.0 收錄了2萬多個漢字。
5、到了2000年,設置出GB18030 收錄了2萬7千多個漢字。
6、到了不個不知道什麽年份的時候,國際組織為了統一全世界的字符,設置出unicode ,使用了2個字節
7、後面又設置出現在的utf-8可變長字符編碼,為了解決英文字符只占用一字節的大小(不要浪費空間嗎),此時的的英文是:1byte, 中文:3bytes

關於python2的版本是不支持中文字符的,而只支持ASCII碼,意思是只支持英文或特殊字符的顯示。

為了能使python2能顯示中文,必須在代碼前加上以下字符:
技術分享圖片

備註:PYTHON3默認直接使用的字符編碼就是UTF-8,可直接使用中文字符

PYTHON 之 字符編碼的區別與介紹