四.python3 字符編碼
阿新 • • 發佈:2017-10-18
mage 進制 中文 alt 1.0 編碼 log .py logs
計算機最底層能識別的
二進制數:0,1
為將二進制數轉變成人能看懂的文字
中國
發展出 ------>ASCII:只能存英文和拉丁字符。 一個字符占一個字節,八位
------>gb2312 :只能存6700多個中文, 1980
------>gbk1.0:存了2萬多字符, 1995
------>gb18030:存了2萬7千個中文, 2000
國際
----------------------------->unicode(相當於一個標準):utf-32(unicode的一個表現形式,編碼集): 一個任意字符占4個字節
------>unicode:utf-16: 一個字符占2個字節或2個以上(如果找不到字符對應的編碼就在utf-32中去找)
------>unicode-8: 一個英文用ASCII碼來存,一個中文占3個字節
中國標準用的是gbk
windows系統用的是gb18030
編碼和解碼
四.python3 字符編碼