1. 程式人生 > >python中檔案及其操作(File)

python中檔案及其操作(File)

  • 檔案是用於資料儲存的單位
  • 檔案通常用於長期儲存資料
  • 檔案中是以位元組為單位順序儲存資料的

    檔案的操作流程

  1. 開啟檔案
  2. 讀/寫檔案
  3. 關閉檔案

  注:
       任何的作業系統,一個應用程式同時開啟檔案的數量有最大數限制 

檔案的開啟函式 

open(file, mode='rt')  用於開啟一個檔案,返回此檔案流物件,如果開啟檔案失敗,則會觸發OSError錯誤

(檔案流物件是可迭代物件,迭代過程中將以換行符'\n'作為分隔符)

示例:
    f = open('phonenumber.txt')
    for line in f:
        print(line)  # 列印每一行的資料

mode 模式字元的含義

字元 含義
'r' 以只讀方式開啟(預設)
'w' 以只寫方式開啟,刪除原有檔案內容(如果檔案不存在,則建立該檔案並以只寫方式開啟)
'x' 建立一個新檔案, 並以寫模式開啟這個檔案,如果檔案存在則會產生"FileExistsError"錯誤
'a' 以只寫檔案開啟一個檔案,如果有原檔案則追加到檔案末尾
'b' 用二進位制模式開啟
't' 文字檔案模式開啟 (預設)
'+' 為更新內容開啟一個磁碟檔案 (可讀可寫)
  • 預設模式是 'rt'
  • 'w+b' 可以實現二進位制隨機讀寫,當開啟檔案時,檔案內容將被清零
  • 'r+b' 以二進位制讀和更新模式開啟檔案,開啟檔案時不會清空檔案內容
  • 'r+' 以文字模式讀和更新模式開啟檔案,開啟檔案時不會清空檔案內容

檔案的關閉方法

F.close()         #關閉檔案釋放系統資源

 文字檔案操作

操作模式:
     't'
說明:
    1. 預設檔案中儲存的都為字元資料,在讀寫過程中會自動進行編解碼操作,
    2. 文字檔案以行為單位進行分隔,在python內部統一用'\n'作用為換行符進行分隔
    3. 對文字檔案的讀寫操作需要用字串(str) 進行資料操作

各作業系統的換行符:
    Linux換行符: '\n'
    Windows 換行符: '\r\n'
    新的Mac OS 換行符: '\n'

 標準輸入輸出檔案:

  sys.stdin     標準輸入檔案
                           ctrl+d 輸入檔案結束符
  sys.stdout    標準輸出檔案
  sys.stderr    標準錯誤輸出檔案
    模組名:sys 
  注:
    標準檔案不需要開啟和關閉就可以使用

讀取檔案內容:

  1. F.read(size=-1)           從一個檔案流中最多讀取size個字元(文字檔案)或位元組(二進位制檔案),如果不給出引數,則預設讀取檔案中全部的內容並返回
  2. F.readline()                讀取一行資料, 如果到達檔案尾則返回空行
  3. F.readlines(max_chars=-1)           讀取所有的行到數組裡面, 返回每行字串的列表,max_chars為最大字元(或位元組)數

寫入檔案

  1. F.write(text)      寫一個字串到檔案流中,返回寫入的字元數(文字檔案)或位元組數(二進位制檔案)
  2. F.writelines(line)     將字串的列表或字串的列表中的內容寫入檔案

二進位制檔案操作:

二進位制檔案操作模式字元: 'b'

  預設檔案中儲存的是以位元組為單位資料,通常有人為規定的格式
  二進位制檔案操作需要用位元組串進行讀寫

注意:

F.read() / F.readline() / F.readlines() 返回型別
       對於文字檔案,F.read()等函式返回為字串(str)
       對於二進位制檔案,F.read()等函式返回為位元組串(bytes)

F.write() 對於二進位制檔案與需要用位元組串進行操作

檔案中內容定位:

  1. F.read()       讀取之後,檔案指標到達檔案的末尾,如果再來一次f.read()將會發現讀取的是空內容,如果想再次讀取全部內容,必須將定位指標移動到檔案開始:
  2. F.tell方法:
      作用:
        返回當前的讀寫位置(從檔案頭以位元組為單位)
  3. F.seek方法
      作用:
        設定讀寫位置

      F.seek(偏移量, whence=相對位置)
        偏移量
           大於0的數代表向檔案末尾方向移動的位元組數
           小於0的數代表向檔案頭方向中移動的位元組數
        相對位置
           0 代表從檔案頭開始偏移
           1 代表從檔案當前讀寫位置開始偏移
           2 代表從檔案尾開始偏移

python 檔案常用方法:

方法 說明
F.close() 關閉檔案(關閉後文件不能再讀寫會發生ValueError錯誤)
F.readline() 讀取一行資料, 如果到達檔案尾則返回空行
F.readlines(max_chars=-1) 返回每行字串的列表,max_chars為最大字元(或位元組)數
F.writelines(lines) 將字串的列表或字串的列表中的內容寫入檔案
二進位制檔案操作方法  
F.read(size=-1) 從一個檔案流中最多讀取size個字元(文字檔案)或位元組(二進位制檔案),如果不給出引數,則預設讀取檔案中全部的內容並返回
F.write(text) 寫一個字串到檔案流中,返回寫入的字元數(文字檔案)或位元組數(二進位制檔案)
F.tell() 返回當前檔案流讀寫指標的絕對位置(位元組為單位)
F.seek(offset, whence=0) 改變資料流讀寫指標的位置,返回新的絕對位置
F.flush() 把寫入檔案物件的快取內容寫入到磁碟
   
F.readable() 判斷這個檔案是否可讀,可讀返回True,否則返回False
F.writable() 判斷這個檔案是否可寫,可寫返回True,否則返回False
F.seekable() 返回這個檔案物件是否支援隨機定位
F.truncate(pos = None) 剪掉 自pos位置之後的資料,返回新的檔案長度

 

總結:

一、python中對檔案、資料夾操作時經常用到的os模組和shutil模組常用方法。
1.得到當前工作目錄,即當前Python指令碼工作的目錄路徑: os.getcwd()
2.返回指定目錄下的所有檔案和目錄名:os.listdir()
3.函式用來刪除一個檔案:os.remove()
4.刪除多個目錄:os.removedirs(r"c:\python")
5.檢驗給出的路徑是否是一個檔案:os.path.isfile()
6.檢驗給出的路徑是否是一個目錄:os.path.isdir()
7.判斷是否是絕對路徑:os.path.isabs()
8.檢驗給出的路徑是否真地存:os.path.exists()
9.返回一個路徑的目錄名和檔名:os.path.split()     
例子:

程式碼如下:

os.path.split('/home/swaroop/byte/code/poem.txt') 結果:('/home/swaroop/byte/code', 'poem.txt')


10.分離副檔名:os.path.splitext()
11.獲取路徑名:os.path.dirname()
12.獲取檔名:os.path.basename()
13.執行shell命令: os.system()
14.讀取和設定環境變數:os.getenv() 與os.putenv()
15.給出當前平臺使用的行終止符:os.linesep    Windows使用'\r\n',Linux使用'\n'而Mac使用'\r'
16.指示你正在使用的平臺:os.name       對於Windows,它是'nt',而對於Linux/Unix使用者,它是'posix'
17.重新命名:os.rename(old, new)
18.建立多級目錄:os.makedirs(r"c:\python\test")
19.建立單個目錄:os.mkdir("test")
20.獲取檔案屬性:os.stat(file)
21.修改檔案許可權與時間戳:os.chmod(file)
22.終止當前程序:os.exit()
23.獲取檔案大小:os.path.getsize(filename)
二、檔案操作方法大全
1.os.mknod("test.txt")        建立空檔案
2.fp = open("test.txt",w)     直接開啟一個檔案,如果檔案不存在則建立檔案
3.關於open 模式:

r:以讀方式開啟檔案,可讀取檔案資訊。
w:以寫方式開啟檔案,可向檔案寫入資訊。如檔案存在,則清空該檔案,再寫入新內容
a:以追加模式開啟檔案(即一開啟檔案,檔案指標自動移到檔案末尾),如果檔案不存在則建立
b:以二進位制模式開啟檔案,而不是以文字模式。該模式只對Windows或Dos有效,類Unix的檔案是用二進位制模式進行操作的。
r+:以讀寫模式開啟
w+:以讀寫模式開啟 (參見 w )
a+:以讀寫模式開啟 (參見 a )
rb:以二進位制讀模式開啟
wb:以二進位制寫模式開啟 (參見 w )
ab:以二進位制追加模式開啟 (參見 a )
rb+:以二進位制讀寫模式開啟 (參見 r+ )
wb+:以二進位制讀寫模式開啟 (參見 w+ )
ab+:以二進位制讀寫模式開啟 (參見 a+ )



二、檔案物件方法

  1. f.close():關閉檔案,記住用open()開啟檔案後一定要記得關閉它,否則會佔用系統的可開啟檔案控制代碼數。
  2. f.fileno():獲得檔案描述符,是一個數字
  3. f.flush():重新整理輸出快取
  4. f.isatty():如果檔案是一個互動終端,則返回True,否則返回False。
  5. f.read([count]):讀出檔案,如果有count,則讀出count個位元組。
  6. f.readline():讀出一行資訊。
  7. f.readlines():
  8. 讀出所有行,也就是讀出整個檔案的資訊。
  9. f.seek(offset[,where]):把檔案指標移動到相對於where的offset位置。where為0表示檔案開始處,這是預設值 ;1表示當前位置;2表示檔案結尾。
  10. f.tell():獲得檔案指標位置。
  11. f.truncate([size]):擷取檔案,使檔案的大小為size。
  12. f.write(string):把string字串寫入檔案。
  13. f.writelines(list):把list中的字串一行一行地寫入檔案,是連續寫入檔案,沒有換行。
  14. fp.read([size])                     #size為讀取的長度,以byte為單位
  15. fp.readline([size])                 #讀一行,如果定義了size,有可能返回的只是一行的一部分
  16. fp.readlines([size])                #把檔案每一行作為一個list的一個成員,並返回這個list。其實它的內部是通過迴圈呼叫readline()來實現的。如果提供size引數,size是表示讀取內容的總長,也就是說可能只讀到檔案的一部分。
  17. fp.write(str)                       #把str寫到檔案中,write()並不會在str後加上一個換行符
  18. fp.writelines(seq)                  #把seq的內容全部寫到檔案中(多行一次性寫入)。這個函式也只是忠實地寫入,不會在每行後面加上任何東西。
  19. fp.close()                          #關閉檔案。python會在一個檔案不用後自動關閉檔案,不過這一功能沒有保證,最好還是養成自己關閉的習慣。  如果一個檔案在關閉後還對其進行操作會產生ValueError
  20. fp.flush()                          #把緩衝區的內容寫入硬碟
  21. fp.fileno()                         #返回一個長整型的"檔案標籤"
  22. fp.isatty()                         #檔案是否是一個終端裝置檔案(unix系統中的)
  23. fp.tell()                           #返回檔案操作標記的當前位置,以檔案的開頭為原點
  24. fp.next()                           #返回下一行,並將檔案操作標記位移到下一行。把一個file用於for … in file這樣的語句時,就是呼叫next()函式來實現遍歷的。
  25. fp.seek(offset[,whence])            #將檔案打操作標記移到offset的位置。這個offset一般是相對於檔案的開頭來計算的,一般為正數。但如果提供了whence引數就不一定了,whence可以為0表示從頭開始計算,1表示以當前位置為原點計算。2表示以檔案末尾為原點進行計算。需要注意,如果檔案以a或a+的模式開啟,每次進行寫操作時,檔案操作標記會自動返回到檔案末尾。
  26. fp.truncate([size])                 #把檔案裁成規定的大小,預設的是裁到當前檔案操作標記的位置。如果size比檔案的大小還要大,依據系統的不同可能是不改變檔案,也可能是用0把檔案補到相應的大小,也可能是以一些隨機的內容加上去。

三、目錄操作方法大全

1.建立目錄

os.mkdir("file")                   

2.複製檔案:

shutil.copyfile("oldfile","newfile")        #oldfile和newfile都只能是檔案

shutil.copy("oldfile","newfile")            #oldfile只能是資料夾,newfile可以是檔案,也可以是目標目錄

3.複製資料夾:

4.shutil.copytree("olddir","newdir")        #olddir和newdir都只能是目錄,且newdir必須不存在

5.重新命名檔案(目錄)

os.rename("oldname","newname")              #檔案或目錄都是使用這條命令

6.移動檔案(目錄)

shutil.move("oldpos","newpos")   

7.刪除檔案

os.remove("file")

8.刪除目錄

os.rmdir("dir")                             #只能刪除空目錄

shutil.rmtree("dir")                        #空目錄、有內容的目錄都可以刪

9.轉換目錄

os.chdir("path")                            #換路徑

 

  • 目錄操作:
  • os.mkdir("file")                   建立目錄
  • 複製檔案:
  • shutil.copyfile("oldfile","newfile")       oldfile和newfile都只能是檔案
  • shutil.copy("oldfile","newfile")            oldfile只能是資料夾,newfile可以是檔案,也可以是目標目錄
  • 複製資料夾:
  • shutil.copytree("olddir","newdir")        olddir和newdir都只能是目錄,且newdir必須不存在
  • 重新命名檔案(目錄)
  • os.rename("oldname","newname")       檔案或目錄都是使用這條命令
  • 移動檔案(目錄)
  • shutil.move("oldpos","newpos")   
  • 刪除檔案
  • os.remove("file")
  • 刪除目錄
  • os.rmdir("dir")只能刪除空目錄
  • shutil.rmtree("dir")    空目錄、有內容的目錄都可以刪
  • 轉換目錄
  • os.chdir("path")   換路徑