python語法_字元編碼

阿新 • • 發佈：2018-11-26

二進位制：

ascll：只能存英文和拉聽字元，一個字元佔一個位元組，8位

gb2312:只能存6700多箇中文，1980年

gbk1.0:能存2萬多字元，1995年

gbk18030:2000 27000萬字符

unicode:統一各個國家的編碼，萬國碼。每個位元組佔四個位元組，

最初表現形式utf-32，一個字元佔4個位元組，後面出現了utf-16,一個字元佔2個位元組或者2個以上（65535個字元），

最後出現utf-8:英文用ascll來存，一箇中文佔三個位元組，其他文字有佔2個位元組的。

所有的在中國發行的軟體都必須支援gb18030字元編碼。

計算機裡，unicode 稱呼為萬國碼，可以作為中間語言用於不同編碼的軟體進行互動。

把gpk 轉成unicode，為編碼encode,

gbk將unicode編碼的程式碼轉換成gbk能理解的，為解碼decode

in python2

預設編碼為ASCII編碼，寫中文的時候，必須先宣告 -*-coding:utf8-*-

GBK 轉換成UTF-8流程：

1 gbk 通過decode 成unicode編碼.

2 unicoe 通過encode 成utf-8編碼

in python3

所有檔案的預設字元編碼為unicode，所以在編碼時可以直接編碼成所需的編碼型別，不需要先decode了

但是如果unicode 去轉換成gbk,顯示的就是bytes了,其實unicode預設就支援中文的，沒什麼非常的必要，不需轉成gbk　　

encode 在編碼的同時，會把資料轉換成bytes型別

decode 在解碼的同時，會把bytes轉換成字串型別

b =bytes 位元組型別一種資料型別，不同

python語法_字元編碼

二進位制： ascll：只能存英文和拉聽字元，一個字元佔一個位元組，8位 gb2312:只能存6700多箇中文，1980年 gbk1.0:能存2萬多字元，1995年 gbk18030:2000 27000萬字符 unicode:統一各個國家的編碼，萬國碼。每個位元組佔四個位元組，最初

python語法_字符編碼

數據多個語法 odi 進制 font nic 直接 gb2 二進制： ascll：只能存英文和拉聽字符，一個字符占一個字節，8位 gb2312:只能存6700多個中文，1980年 gbk1.0:能存2萬多字符，1995年 gbk18030:2000 27000萬字符

009 python語法_類 range

使用 nbsp stop 查看分享圖片 cif 概述 ins bject ‘‘‘ 時間：2018/10/28 目錄: 　　一: 概述 1 help查看 2 文件查看 3 類型查看　　二: 使用

011 python語法_錯誤處理 try except finally raise

''' 時間：2018/11/03 目錄: 　　一: 正常執行 1 正常 2 else 　　二: 發生錯誤 1 異常 2 異常三: BaseException 四: 多層錯誤 - 多層

012 python語法_匯入模組

''' 時間：2018/11/05 目錄: 一: 匯入模組二: 匯入函式三: 匯入自編 ''' 匯入模組 1 系統自帶 import time impo

python語法_算數運算+賦值運算子

算出運算子 + - * / 加減乘除 5/2 = 2.5 5//2 = 2 整除，地板除　　 5%2= 1 取餘數 2**10 指數運算 2的10次方算術優先順序無論多少級，都使用（）小括號進行優先順序管理比較運算子 True 真正確

python語法_使用佔位符進行格式化輸出

“%s” 佔位符 name = input("name:") age = input("age:") job = input("job:") msg = ''' -------------info for %s------------- N

python語法_嵌套

pan 不同 col python print asd 類型嵌套 style 列表裏面每個元素可以是不同的數據類型，每一個元素也可以是一個列表或者元組等，a = [[1,2,3],"a",13,(5,7,9,"dasd")] b = a[3] a[0][2] = 4 pr

python語法_字串

字串 a = 'asdb' #雙引號和列印號沒區別，操作 "abc"*2 列印兩遍"abc" #字串加* 重複列印字串 “abc”[2:1] #切片,根據索引進行切片 "ab" in “abc” #判斷值是否包含在字串裡面 %s %變數名格式化輸出 a = "a

python語法_字符串

判斷拼接 art center 字符串 pan 第一個 name exp 字符串 a = ‘asdb‘ #雙引號和打印號沒區別，操作 "abc"*2 打印兩遍"abc" #字符串加* 重復打印字符串 “abc”[2:1] #切片,根據索引進行切片 "ab" in

python學習day9 字元編碼和檔案處理

1.字元編碼 x='上' #unicode的二進位制---------》編碼--------》gbk格式的二進位制 res=x.encode('gbk') #bytes 位元組型別 print(res,type(res)) m=res.decode('gbk') print(m)&nb

python語法_深淺拷貝

淺拷貝，.copy 只拷貝第一層（可用於建立銀行共享賬號）。 s1 = [‘a’,'b','c'] s2 = s1.copy() s2[0]='d' print(s2) print(s1) 此時修改s2對應s1沒有影響。 s1 = [[1，2],'b','c'] s2 = s1.copy()

python語法_集合

集合：不同的元素（不可hash）組合在一起的就叫做集合,去掉重複的，以空字元返回，無序的可以分為可變集合和不可變集合（frozenset）建立: s = set('gm gyx') print(s){' ', 'x', 'm', 'g', 'y'} 集合不能作為字典的鍵， s = frozen

python語法_函式

---恢復內容開始--- 函式： 1 減少重複程式碼 2 定義一個功能，需要直接呼叫 3 保持程式碼一致性 def funcation_name(引數s): 　　功能程式碼塊0 引數可以為多個，傳入時按照前後順序進行摻入，定義時為形參，實際傳入的為實參。形參有幾個，就需要傳入多少實參

python語法_內建函式

a = filter(函式名，序列) 返回一個迭代器物件/。函式裡必須加過濾條件 ret = ['a','b','c','d','e']def ft(s): if s != 'a': return srat = filter(ft,ret)print(rat)##############

【Python學習】字元編碼

先說兩個基礎知識。（1）計算機內部，資料是由0,1組成的；（2）計算機最小的資料單位，就是一個二進位制單位即bit，接下來就是8個二進位制單位表示一個位元組(Byte)。 1 ASCII碼 ASCII碼（American Standard Code for Information Intercha

python語法_列表生成式_生成式

python 類比 span 生成器進行生成式什麽 next 之前列表生成式 a = [x for x in range(10)] print(a) x 可進行操作 a = [x*2 for x in range(10)] print(a) x甚至可以為函數， de

python語法_模組_time_datetime_random

模組：可以被公共呼叫的。 time import time print(time.time()) 時間戳方式顯示時間。 time.sleep(3) 休眠3秒 time.clock() 計算cpu執行時間 time.gmtime() 結構化時間 time.locatime() 本地化時間 str

python語法_模組_loggin_hashlib

loggin模組日誌模組,級別從上往下依次增強，debug 和 info 預設不輸出資訊，只有後三種級別有輸出資訊 loggin.debug('') loggin.info('') loggin.waring('') loggin.error('') loggin.critical('') 日誌

python語法_模組_re(正則表達)

字串操作方法有： s = 'hello word' s.find('l') 查詢第一個l的索引 s.replace('ll','xx') 替換 s.split('w') 以w進行分割這些都是完全匹配，要進入模糊匹配就需要引進正則表示式正則表示式，主要作為字串模糊匹配的作用正

python語法_字元編碼

相關推薦