1. 程式人生 > >day2---字元編碼

day2---字元編碼

 1 # -*- coding:utf-8 -*-
 2 '''
 3 1、二進位制:
 4 計算機能夠識別的語言是機械語言,也就是我們所說的二進位制:00011001 11110001
 5 
 6 2、ASCII碼:
 7 之前說過python2 預設編碼為Ascii,Ascii碼中只包含英文字母、數字、特殊字元,不包含中文,所以用python2執行中文需要在檔案頭申明編碼格式。
 8 ASCII最多支援2**8個字元。一個英文字母為一個位元組為8位,也就是8個二進位制。 1byte == 8bit
 9 所有ASCII碼的最左邊一個是0,因為剛開始設計為7位就滿足了美國所有編碼,為了後續擴充套件多留了一位,多的補充0.
10 1byte(位元組)== 8bit 11 1KB ==1024byte 12 1MB ==1024KB 13 1GB ==1024M 14 1TB ==1024G 15 16 3、Unicode 17 隨著計算機的發展,到了中國需要支援中文以及其他國家語言,美國開發了一套新的編碼表,我們稱為Unicode,萬國碼。 18 作用: 19 支援全球所有國家的語言。 20 有一套完整的編碼對映表。 21 Unicode中: 22 一個英文字母為1個位元組表示,足夠了 2**8 ==256 23 一箇中文用4個位元組表示,足夠了 2**32 == 4294967296 24 25 4、UTF-8
26 雖然Unicode用4個位元組表示中文足夠了,但是卻太浪費了,所以出現了對Unicode的升級為utf-8 27 在utf -8中: 28 一箇中文為3個位元組,(2**24)==16777216 29 一個英文為1個位元組 30 31 5、GBK 32 我們自己國家開發的編碼表,一箇中文用兩個位元組,包含2**16 == 65536個編碼 33 windows 預設的編碼就是GBK 34 35 ''' 36 37 print(2**16)