1. 程式人生 > 程式設計 >Python fileinput模組如何逐行讀取多個檔案

Python fileinput模組如何逐行讀取多個檔案

Python 提供了 fileinput 模組,通過該模組中的 input() 函式,我們能同時開啟指定的多個檔案,還可以逐個讀取這些檔案中的內容。

fileinput 模組中 input() 該函式的語法格式如下:

fileinput.input(files="filename1,filename2,...",inplace=False,backup='',bufsize=0,mode='r',openhook=None)

此函式會返回一個 FileInput 物件,它可以理解為是將多個指定檔案合併之後的檔案物件。其中,各個引數的含義如下:

  • files:多個檔案的路徑列表;
  • inplace:用於指定是否將標準輸出的結果寫回到檔案,此引數預設值為 False;
  • backup:用於指定備份檔案的副檔名;
  • bufsize:指定緩衝區的大小,預設為 0;
  • mode:開啟檔案的格式,預設為 r(只讀格式);
  • openhook:控制檔案的開啟方式,例如編碼格式等。

注意,和 open() 函式不同,input() 函式不能指定開啟檔案的編碼格式,這意味著使用該函式讀取的所有檔案,除非以二進位制方式進行讀取,否則該檔案編碼格式都必須和當前作業系統預設的編碼格式相同,不然 Python 直譯器可能會提示 UnicodeDecodeError 錯誤。

和 open() 函式返回單個的檔案物件不同,fileinput 物件無需呼叫類似 read()、readline()、readlines() 這樣的函式,直接通過 for 迴圈即可按次序讀取多個檔案中的資料。

值得一提的是,fileinput 模組還提供了很多使用的函式(如表 1 所示),通過呼叫這些函式,可以幫我們更快地實現想要的功能。

表 fileinput 模組常用函式

函式名 功能描述
fileinput.filename() 返回當前正在讀取的檔名稱。
fileinput.fileno() 返回當前正在讀取檔案的檔案描述符。
fileinput.lineno() 返回當前讀取了多少行。
fileinput.filelineno() 返回當前正在讀取的內容位於當前檔案中的行號。
fileinput.isfirstline() 判斷當前讀取的內容在當前檔案中是否位於第 1 行。
fileinput.nextfile() 關閉當前正在讀取的檔案,並開始讀取下一個檔案。
fileinput.close() 關閉 FileInput 物件。

檔案描述符是一個檔案的代號,其值為一個整數。後續章節將會介紹關於檔案描述符的操作。

講了這麼多,接下來舉個例子。假設使用 input() 讀取 2 個檔案,分別為 my_file.txt 和 file.txt,它們位於同一目錄,且各自包含的內容如下所示:

#file.txt
Python教程
http://c.biancheng.net/python/

#my_file.txt
Linux教程
http://c.biancheng.net/linux_tutorial/

下面程式演示瞭如何使用 input() 函式依次讀取這 2 個檔案:

import fileinput
#使用for迴圈遍歷 fileinput 物件
for line in fileinput.input(files=('my_file.txt','file.txt')):
# 輸出讀取到的內容
print(line)
# 關閉檔案流
fileinput.close()

在使用 fileinput 模組中的 input() 函式之前,一定要先引入 fileinput 模組。

程式執行結果為:

Linux教程

http://c.biancheng.net/linux_tutorial/
Python教程

http://c.biancheng.net/python/

顯然,讀取檔案內容的次序,取決於 input() 函式中檔名的先後次序。

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支援我們。