python 檔案處理(基礎字元)
基於字元read & write
最基本的檔案操作當然就是在檔案中讀寫資料。這也是很容易掌握的。現在開啟一個檔案以進行寫操作:
1. fileHandle = open ( 'test.txt', 'w' )
fileHandle = open ( 'test.txt', 'w' )
‘w'是指檔案將被寫入資料,語句的其它部分很好理解。下一步就是將資料寫入檔案:
1. fileHandle.write ( 'This is a test.\nReally, it is.' )
fileHandle.write ( 'This is a test.\nReally, it is.' )
這個語句將“This is a test.”寫入檔案的第一行,“Really, it is.”寫入檔案的第二行。最後,我們需要做清理工作,並且關閉檔案:
1. fileHandle.close()
fileHandle.close()
正如你所見,在Python的面向物件機制下,這確實非常簡單。需要注意的是,當你再次使用“w”方式在檔案中寫資料,所有原來的內容都會被刪除。如果想保留原來的內容,可以使用“a”方式在檔案中結尾附加資料:
1. fileHandle = open ( 'test.txt', 'a' )
2. fileHandle.write ( '\n\nBottom line.' )
3. fileHandle.close()
fileHandle = open ( 'test.txt', 'a' )
fileHandle.write ( '\n\nBottom line.' )
fileHandle.close()
然後,我們讀取test.txt,並將內容顯示出來:
1. fileHandle = open ( 'test.txt' )
2. print fileHandle.read()
3. fileHandle.close()
fileHandle = open ( 'test.txt' )
print fileHandle.read()
fileHandle.close()
以上語句將讀取整個檔案並顯示其中的資料。
基於行的讀寫 line
1. fileHandle = open ( 'test.txt' )
2. print fileHandle.readline() # "This is a test."
3. fileHandle.close()
fileHandle = open ( 'test.txt' )
print fileHandle.readline() # "This is a test."
fileHandle.close()
同時,也可以將檔案內容儲存到一個list中:
1. fileHandle = open ( 'test.txt' )
2. fileList = fileHandle.readlines()
3. for fileLine in fileList:
4. print '>>', fileLine
5. fileHandle.close()
fileHandle = open ( 'test.txt' )
fileList = fileHandle.readlines()
for fileLine in fileList:
print '>>', fileLine
fileHandle.close()
或者在檔案中一次讀取幾個位元組的內容:
1. fileHandle = open ( 'test.txt' )
2. print fileHandle.read ( 1 ) # "T"
3. fileHandle.seek ( 4 )
4. print FileHandle.read ( 1 ) # " "(原文有錯)
fileHandle = open ( 'test.txt' )
print fileHandle.read ( 1 ) # "T"
fileHandle.seek ( 4 )
print FileHandle.read ( 1 ) # " "(原文有錯)
關於open 模式:
w 以寫方式開啟,
a 以追加模式開啟 (從 EOF 開始, 必要時建立新檔案)
r+ 以讀寫模式開啟
w+ 以讀寫模式開啟 (參見 w )
a+ 以讀寫模式開啟 (參見 a )
rb 以二進位制讀模式開啟
wb 以二進位制寫模式開啟 (參見 w )
ab 以二進位制追加模式開啟 (參見 a )
rb+ 以二進位制讀寫模式開啟 (參見 r+ )
wb+ 以二進位制讀寫模式開啟 (參見 w+ )
ab+ 以二進位制讀寫模式開啟 (參見 a+ )
1 #基本操作 2 __author__ = 'ctz' 3 #只讀操作r 檔案不存在則報錯 4 #f=open(r"1","r",encoding="utf-8") 5 #r代表後面的是單純的字串,避免轉義字元 6 # print(f.read())#一次讀完整個檔案 7 # print(f.readline(),end="")#一次讀一行檔案 8 # print(f.readline(),end="") 9 # print(f.readline(),end="") 10 # print(f.readlines())#把檔案讀出一個列表每一個元素就是一行 11 # f.close() 12 13 14 #只寫操作w 檔案不存在則建立空檔案,檔案存在則清空 15 # f=open("2","w",encoding="utf-8") 16 # f.write("hello world ctz\n") 17 # f.writelines(["aaaaa\n","bbbbbb\n"]) 18 # f.close() 19 20 #只追加模式a 檔案不存在則建立,檔案存在 則在後面追加 21 # f=open("2","a",encoding="utf-8") 22 # print(f.readable()) 23 # print(f.writable()) 24 # f.write("aaaaaaaaaaaaaa\n") 25 # f.writelines(["ctzctz\n","tzctzc\n"]) 26 27 #rb wb ab b模式不考慮字元的編碼 可以操作圖片 視訊之類的複雜檔案 28 29 #rb 30 # f=open("1.jpg","rb") 31 # print(f.read()) 32 33 # f=open("1","rb") 34 # print(f.read().decode("utf-8")) 35 36 #wb 37 # f=open("1.jpg","rb") 38 # data=f.read() 39 # f=open("2.jpg","wb") 40 # f.write(data) 41 42 # f=open("4.txt","wb") 43 # f.write("aaaaaaa\n".encode("utf-8")) 44 45 #ab 46 47 # f=open("1","ab") 48 # f.write("我就是我\n".encode("utf-8"))
fp.read([size]) #size為讀取的長度,以byte為單位
fp.readline([size]) #讀一行,如果定義了size,有可能返回的只是一行的一部分
fp.readlines([size]) #把檔案每一行作為一個list的一個成員,並返回這個list。其實它的內部是通過迴圈呼叫readline()來實現的。如果提供size引數,size是表示讀取內容的總長,也就是說可能只讀到檔案的一部分。
fp.write(str) #把str寫到檔案中,write()並不會在str後加上一個換行符
fp.writelines(seq) #把seq的內容全部寫到檔案中(多行一次性寫入)。這個函式也只是忠實地寫入,不會在每行後面加上任何東西。
fp.close() #關閉檔案。python會在一個檔案不用後自動關閉檔案,不過這一功能沒有保證,最好還是養成自己關閉的習慣。 如果一個檔案在關閉後還對其進行操作會產生ValueError
fp.flush() #把緩衝區的內容寫入硬碟
fp.fileno() #返回一個長整型的”檔案標籤“
fp.isatty() #檔案是否是一個終端裝置檔案(unix系統中的)
fp.tell() #返回檔案操作標記的當前位置,以檔案的開頭為原點
fp.next() #返回下一行,並將檔案操作標記位移到下一行。把一個file用於for … in file這樣的語句時,就是呼叫next()函式來實現遍歷的。
fp.seek(offset[,whence]) #將檔案打操作標記移到offset的位置。這個offset一般是相對於檔案的開頭來計算的,一般為正數。但如果提供了whence引數就不一定了,whence可以為0表示從頭開始計算,1表示以當前位置為原點計算。2表示以檔案末尾為原點進行計算。需要注意,如果檔案以a或a+的模式開啟,每次進行寫操作時,檔案操作標記會自動返回到檔案末尾。
fp.truncate([size]) #把檔案裁成規定的大小,預設的是裁到當前檔案操作標記的位置。如果size比檔案的大小還要大,依據系統的不同可能是不改變檔案,也可能是用0把檔案補到相應的大小,也可能是以一些隨機的內容加上去。