python中檔案及其操作(File)
- 檔案是用於資料儲存的單位
- 檔案通常用於長期儲存資料
- 檔案中是以位元組為單位順序儲存資料的
檔案的操作流程
- 開啟檔案
- 讀/寫檔案
- 關閉檔案
注:
任何的作業系統,一個應用程式同時開啟檔案的數量有最大數限制
檔案的開啟函式
open(file, mode='rt') 用於開啟一個檔案,返回此檔案流物件,如果開啟檔案失敗,則會觸發OSError錯誤
(檔案流物件是可迭代物件,迭代過程中將以換行符'\n'作為分隔符)
示例:
f = open('phonenumber.txt')
for line in f:
print(line) # 列印每一行的資料
mode 模式字元的含義
字元 含義 'r' 以只讀方式開啟(預設) 'w' 以只寫方式開啟,刪除原有檔案內容(如果檔案不存在,則建立該檔案並以只寫方式開啟) 'x' 建立一個新檔案, 並以寫模式開啟這個檔案,如果檔案存在則會產生"FileExistsError"錯誤 'a' 以只寫檔案開啟一個檔案,如果有原檔案則追加到檔案末尾 'b' 用二進位制模式開啟 't' 文字檔案模式開啟 (預設) '+' 為更新內容開啟一個磁碟檔案 (可讀可寫)
- 預設模式是 'rt'
- 'w+b' 可以實現二進位制隨機讀寫,當開啟檔案時,檔案內容將被清零
- 'r+b' 以二進位制讀和更新模式開啟檔案,開啟檔案時不會清空檔案內容
- 'r+' 以文字模式讀和更新模式開啟檔案,開啟檔案時不會清空檔案內容
檔案的關閉方法
F.close() #關閉檔案釋放系統資源
文字檔案操作
操作模式:
't'
說明:
1. 預設檔案中儲存的都為字元資料,在讀寫過程中會自動進行編解碼操作,
2. 文字檔案以行為單位進行分隔,在python內部統一用'\n'作用為換行符進行分隔
3. 對文字檔案的讀寫操作需要用字串(str) 進行資料操作各作業系統的換行符:
Linux換行符: '\n'
Windows 換行符: '\r\n'
新的Mac OS 換行符: '\n'
標準輸入輸出檔案:
sys.stdin 標準輸入檔案
ctrl+d 輸入檔案結束符
sys.stdout 標準輸出檔案
sys.stderr 標準錯誤輸出檔案
模組名:sys
注:
標準檔案不需要開啟和關閉就可以使用
讀取檔案內容:
- F.read(size=-1) 從一個檔案流中最多讀取size個字元(文字檔案)或位元組(二進位制檔案),如果不給出引數,則預設讀取檔案中全部的內容並返回
- F.readline() 讀取一行資料, 如果到達檔案尾則返回空行
- F.readlines(max_chars=-1) 讀取所有的行到數組裡面, 返回每行字串的列表,max_chars為最大字元(或位元組)數
寫入檔案
- F.write(text) 寫一個字串到檔案流中,返回寫入的字元數(文字檔案)或位元組數(二進位制檔案)
- F.writelines(line) 將字串的列表或字串的列表中的內容寫入檔案
二進位制檔案操作:
二進位制檔案操作模式字元: 'b'
預設檔案中儲存的是以位元組為單位資料,通常有人為規定的格式
二進位制檔案操作需要用位元組串進行讀寫
注意:
F.read() / F.readline() / F.readlines() 返回型別
對於文字檔案,F.read()等函式返回為字串(str)
對於二進位制檔案,F.read()等函式返回為位元組串(bytes)F.write() 對於二進位制檔案與需要用位元組串進行操作
檔案中內容定位:
- F.read() 讀取之後,檔案指標到達檔案的末尾,如果再來一次f.read()將會發現讀取的是空內容,如果想再次讀取全部內容,必須將定位指標移動到檔案開始:
- F.tell方法:
作用:
返回當前的讀寫位置(從檔案頭以位元組為單位)F.seek方法
作用:
設定讀寫位置F.seek(偏移量, whence=相對位置)
偏移量
大於0的數代表向檔案末尾方向移動的位元組數
小於0的數代表向檔案頭方向中移動的位元組數
相對位置
0 代表從檔案頭開始偏移
1 代表從檔案當前讀寫位置開始偏移
2 代表從檔案尾開始偏移
python 檔案常用方法:
方法 | 說明 |
---|---|
F.close() | 關閉檔案(關閉後文件不能再讀寫會發生ValueError錯誤) |
F.readline() | 讀取一行資料, 如果到達檔案尾則返回空行 |
F.readlines(max_chars=-1) | 返回每行字串的列表,max_chars為最大字元(或位元組)數 |
F.writelines(lines) | 將字串的列表或字串的列表中的內容寫入檔案 |
二進位制檔案操作方法 | |
F.read(size=-1) | 從一個檔案流中最多讀取size個字元(文字檔案)或位元組(二進位制檔案),如果不給出引數,則預設讀取檔案中全部的內容並返回 |
F.write(text) | 寫一個字串到檔案流中,返回寫入的字元數(文字檔案)或位元組數(二進位制檔案) |
F.tell() | 返回當前檔案流讀寫指標的絕對位置(位元組為單位) |
F.seek(offset, whence=0) | 改變資料流讀寫指標的位置,返回新的絕對位置 |
F.flush() | 把寫入檔案物件的快取內容寫入到磁碟 |
F.readable() | 判斷這個檔案是否可讀,可讀返回True,否則返回False |
F.writable() | 判斷這個檔案是否可寫,可寫返回True,否則返回False |
F.seekable() | 返回這個檔案物件是否支援隨機定位 |
F.truncate(pos = None) | 剪掉 自pos位置之後的資料,返回新的檔案長度 |
總結:
一、python中對檔案、資料夾操作時經常用到的os模組和shutil模組常用方法。
1.得到當前工作目錄,即當前Python指令碼工作的目錄路徑: os.getcwd()
2.返回指定目錄下的所有檔案和目錄名:os.listdir()
3.函式用來刪除一個檔案:os.remove()
4.刪除多個目錄:os.removedirs(r"c:\python")
5.檢驗給出的路徑是否是一個檔案:os.path.isfile()
6.檢驗給出的路徑是否是一個目錄:os.path.isdir()
7.判斷是否是絕對路徑:os.path.isabs()
8.檢驗給出的路徑是否真地存:os.path.exists()
9.返回一個路徑的目錄名和檔名:os.path.split()
例子:程式碼如下:
os.path.split('/home/swaroop/byte/code/poem.txt') 結果:('/home/swaroop/byte/code', 'poem.txt')
10.分離副檔名:os.path.splitext()
11.獲取路徑名:os.path.dirname()
12.獲取檔名:os.path.basename()
13.執行shell命令: os.system()
14.讀取和設定環境變數:os.getenv() 與os.putenv()
15.給出當前平臺使用的行終止符:os.linesep Windows使用'\r\n',Linux使用'\n'而Mac使用'\r'
16.指示你正在使用的平臺:os.name 對於Windows,它是'nt',而對於Linux/Unix使用者,它是'posix'
17.重新命名:os.rename(old, new)
18.建立多級目錄:os.makedirs(r"c:\python\test")
19.建立單個目錄:os.mkdir("test")
20.獲取檔案屬性:os.stat(file)
21.修改檔案許可權與時間戳:os.chmod(file)
22.終止當前程序:os.exit()
23.獲取檔案大小:os.path.getsize(filename)
二、檔案操作方法大全
1.os.mknod("test.txt") 建立空檔案
2.fp = open("test.txt",w) 直接開啟一個檔案,如果檔案不存在則建立檔案
3.關於open 模式:r:以讀方式開啟檔案,可讀取檔案資訊。
w:以寫方式開啟檔案,可向檔案寫入資訊。如檔案存在,則清空該檔案,再寫入新內容
a:以追加模式開啟檔案(即一開啟檔案,檔案指標自動移到檔案末尾),如果檔案不存在則建立
b:以二進位制模式開啟檔案,而不是以文字模式。該模式只對Windows或Dos有效,類Unix的檔案是用二進位制模式進行操作的。
r+:以讀寫模式開啟
w+:以讀寫模式開啟 (參見 w )
a+:以讀寫模式開啟 (參見 a )
rb:以二進位制讀模式開啟
wb:以二進位制寫模式開啟 (參見 w )
ab:以二進位制追加模式開啟 (參見 a )
rb+:以二進位制讀寫模式開啟 (參見 r+ )
wb+:以二進位制讀寫模式開啟 (參見 w+ )
ab+:以二進位制讀寫模式開啟 (參見 a+ )
二、檔案物件方法
- f.close():關閉檔案,記住用open()開啟檔案後一定要記得關閉它,否則會佔用系統的可開啟檔案控制代碼數。
- f.fileno():獲得檔案描述符,是一個數字
- f.flush():重新整理輸出快取
- f.isatty():如果檔案是一個互動終端,則返回True,否則返回False。
- f.read([count]):讀出檔案,如果有count,則讀出count個位元組。
- f.readline():讀出一行資訊。
- f.readlines():
- 讀出所有行,也就是讀出整個檔案的資訊。
- f.seek(offset[,where]):把檔案指標移動到相對於where的offset位置。where為0表示檔案開始處,這是預設值 ;1表示當前位置;2表示檔案結尾。
- f.tell():獲得檔案指標位置。
- f.truncate([size]):擷取檔案,使檔案的大小為size。
- f.write(string):把string字串寫入檔案。
- f.writelines(list):把list中的字串一行一行地寫入檔案,是連續寫入檔案,沒有換行。
- fp.read([size]) #size為讀取的長度,以byte為單位
- fp.readline([size]) #讀一行,如果定義了size,有可能返回的只是一行的一部分
- fp.readlines([size]) #把檔案每一行作為一個list的一個成員,並返回這個list。其實它的內部是通過迴圈呼叫readline()來實現的。如果提供size引數,size是表示讀取內容的總長,也就是說可能只讀到檔案的一部分。
- fp.write(str) #把str寫到檔案中,write()並不會在str後加上一個換行符
- fp.writelines(seq) #把seq的內容全部寫到檔案中(多行一次性寫入)。這個函式也只是忠實地寫入,不會在每行後面加上任何東西。
- fp.close() #關閉檔案。python會在一個檔案不用後自動關閉檔案,不過這一功能沒有保證,最好還是養成自己關閉的習慣。 如果一個檔案在關閉後還對其進行操作會產生ValueError
- fp.flush() #把緩衝區的內容寫入硬碟
- fp.fileno() #返回一個長整型的"檔案標籤"
- fp.isatty() #檔案是否是一個終端裝置檔案(unix系統中的)
- fp.tell() #返回檔案操作標記的當前位置,以檔案的開頭為原點
- fp.next() #返回下一行,並將檔案操作標記位移到下一行。把一個file用於for … in file這樣的語句時,就是呼叫next()函式來實現遍歷的。
- fp.seek(offset[,whence]) #將檔案打操作標記移到offset的位置。這個offset一般是相對於檔案的開頭來計算的,一般為正數。但如果提供了whence引數就不一定了,whence可以為0表示從頭開始計算,1表示以當前位置為原點計算。2表示以檔案末尾為原點進行計算。需要注意,如果檔案以a或a+的模式開啟,每次進行寫操作時,檔案操作標記會自動返回到檔案末尾。
- fp.truncate([size]) #把檔案裁成規定的大小,預設的是裁到當前檔案操作標記的位置。如果size比檔案的大小還要大,依據系統的不同可能是不改變檔案,也可能是用0把檔案補到相應的大小,也可能是以一些隨機的內容加上去。
三、目錄操作方法大全
1.建立目錄
os.mkdir("file")
2.複製檔案:
shutil.copyfile("oldfile","newfile") #oldfile和newfile都只能是檔案
shutil.copy("oldfile","newfile") #oldfile只能是資料夾,newfile可以是檔案,也可以是目標目錄
3.複製資料夾:
4.shutil.copytree("olddir","newdir") #olddir和newdir都只能是目錄,且newdir必須不存在
5.重新命名檔案(目錄)
os.rename("oldname","newname") #檔案或目錄都是使用這條命令
6.移動檔案(目錄)
shutil.move("oldpos","newpos")
7.刪除檔案
os.remove("file")
8.刪除目錄
os.rmdir("dir") #只能刪除空目錄
shutil.rmtree("dir") #空目錄、有內容的目錄都可以刪
9.轉換目錄
os.chdir("path") #換路徑
- 目錄操作:
- os.mkdir("file") 建立目錄
- 複製檔案:
- shutil.copyfile("oldfile","newfile") oldfile和newfile都只能是檔案
- shutil.copy("oldfile","newfile") oldfile只能是資料夾,newfile可以是檔案,也可以是目標目錄
- 複製資料夾:
- shutil.copytree("olddir","newdir") olddir和newdir都只能是目錄,且newdir必須不存在
- 重新命名檔案(目錄)
- os.rename("oldname","newname") 檔案或目錄都是使用這條命令
- 移動檔案(目錄)
- shutil.move("oldpos","newpos")
- 刪除檔案
- os.remove("file")
- 刪除目錄
- os.rmdir("dir")只能刪除空目錄
- shutil.rmtree("dir") 空目錄、有內容的目錄都可以刪
- 轉換目錄
- os.chdir("path") 換路徑