python學習點滴記錄-Day02補充-文件操作
字符編碼:
把人類的字符翻譯成計算機能認識的數字
字符編碼表
存放著人類字符和計算機數字的對應關系表
ascii、gbk、utf-8、unicode
unicode》encode(utf8)》bytes
bytes》decode(utf8)》unicode
文件處理補充:
字符以什麽格式編碼的,就要以什麽格式解碼
文件的打開模式
文件句柄 = open(‘文件路徑‘, ‘模式‘)打開文件時,需要指定文件路徑和以何等方式打開文件,打開後,即可獲取該文件句柄,日後通過此文件句柄對該文件操作。
打開文件的模式有:
- r ,只讀模式【默認模式,文件必須存在,不存在則拋出異常】
- w,只寫模式【不可讀;不存在則創建;存在則清空內容】
- x, 只寫模式【不可讀;不存在則創建,存在則報錯】
- a, 追加模式【可讀; 不存在則創建;存在則只追加內容】
"+" 表示可以同時讀寫某個文件
- r+, 讀寫【可讀,可寫】
- w+,寫讀【可讀,可寫】
- x+ ,寫讀【可讀,可寫】
- a+, 寫讀【可讀,可寫】
"b"表示以字節的方式操作
- rb 或 r+b
- wb 或 w+b
- xb 或 w+b
- ab 或 a+b
註:以b方式打開時,讀取到的內容是字節類型,寫入時也需要提供字節類型,不能指定編碼
練習,利用b模式,編寫一個cp工具,要求如下:
1. 既可以拷貝文本又可以拷貝視頻,圖片等文件
2. 用戶一旦參數錯誤,打印命令的正確使用方法,如usage: cp source_file target_file
提示:可以用import sys,然後用sys.argv獲取腳本後面跟的參
上下文管理
with open(‘a.txt‘,‘w‘) as f: pass with open(‘a.txt‘,‘r‘) as read_f,open(‘b.txt‘,‘w‘) as write_f: data=read_f.read() write_f.write(data)
模擬copy
import sys if len(sys.argv) != 3:#如果接收到的參數不等3,提示信息並退出程序 print(‘提示:python3 copy.py source.file target.file‘) sys.exit() with open(r‘%s‘%sys.argv[1],‘rb‘) as read_f, open(r‘%s‘%sys.argv[2],‘wb‘) as write_f:# for line in read_f:#循環源文件內容的二進制內容依次寫入到目標文件中,同樣是以二進制 write_f.write(line)
光標的位置
一: read(3):
1. 文件打開方式為文本模式時,代表讀取3個字符
2. 文件打開方式為b模式時,代表讀取3個字節
二: 其余的文件內光標移動都是以字節為單位如seek,tell,truncate
註意:
1. seek有三種移動方式0,1,2,其中1和2必須在b模式下進行,但無論哪種模式,都是以bytes為單位移動的
2. truncate是截斷文件,所以文件的打開方式必須可寫,但是不能用w或w+等方式打開,因為那樣直接清空文件了,所以truncate要在r+或a或a+等模式下測試效果
模擬tail -f
import time with open(‘access.log‘,‘rb‘) as f: f.seek(0,2)#直接移動的文件末尾 while True:#while循環的讀取文件新內容 line=f.readline() if line: print(line.decode(‘utf-8‘),end=‘‘)#如果有新內容就打印出decode解碼後的內容 else: time.sleep(0.2)#沒有新內容就sleep後重來
模擬文件的修改
import os with open(‘a.txt‘,‘r‘,encoding=‘utf-8‘) as read_f, open(‘.a.txt.swap‘,‘w‘,encoding=‘utf-8‘) as write_f: for line in read_f: if line.startswith(‘hello‘): line=‘哈哈哈\n‘ write_f.write(line) os.remove(‘a.txt‘) os.rename(‘.a.txt.swap‘,‘a.txt‘)
python學習點滴記錄-Day02補充-文件操作