大蛇04 字符編碼和文件操作
阿新 • • 發佈:2019-03-27
格式 comm tell 三種 腳本 python 解碼 二進制位 什麽是
‘‘‘
1. 什麽是字符編碼:將人識別的字符轉換計算機能識別的01,轉換的規則就是字符編碼表
2. 常用的編碼表:ascii、unicode、GBK、Shift_JIS、Euc-kr
3. 編碼操作:編碼encode()、解碼decode()
‘‘‘
知識儲備
# 電腦三大核心:cpu - 內存 - 硬盤(數據的存取過程)
# 軟件及python解釋器讀取文件過程:啟動 - 讀取 - 展示|解釋執行
# python2環境的文件頭:# coding: 編碼格式
簡介與發展
‘‘‘
1. ascii - 各國編碼 - 萬國編碼
2. 存取不一致的亂碼現象
3. unicode與utf-8
‘‘‘
核心
# 編碼操作:編碼encode()、解碼decode()
字符與字節
重點
‘‘‘
1. 字節的存儲方式:8個二進制位
2. 字符所占字節數:根據編碼的不同,所占字節數可能不同
3. 三種格式字符串:u‘‘、b‘‘、r‘‘
‘‘‘
了解
‘‘‘
u、b格式字符串轉換: str(b‘‘, encode=‘utf-8‘)、bytes(u‘‘, encode=‘utf-8‘)
‘‘‘
文件操作
重點
‘‘‘
1. 文件操作的三步驟:打開文件 - 使用文件 - 關閉文件
2. 文件操作三要素:文件源、操作模式、編碼
3. with語法:with open(...) as 別名, ..., open(...) as 別名: pass
4. 重點方法:read() | write() | readline() | close() | f.flush() | f.seek()
‘‘‘
操作模式
‘‘‘
主模式:r | w | a
從模式:b | t | +
了解:x | U
‘‘‘
操作方法
讀:read() | readline() | readlines() 寫:write() | writelines() | flush() 光標:seek() | tell() 特征:encoding | closed 了解:readable() | writable() | name
案例
1. 文件復制 2. 文件修改 了解:py文件腳本機制
大蛇04 字符編碼和文件操作