計算一個檔案中有多少行即讀取檔案行數 linecache
檔案D:\123.txt的內容如下:
1abc中國
2abc中國
3abc中國
4abc中國
5abc中國
6abc中國
讀取檔案行數程式碼如下:
- #encoding=utf-8
- print'中國'
- #計算一個檔案中有多少行
- #檔案比較小
- count = len(open(r"d:\123.txt",'rU').readlines())
- print count
- #檔案比較大
- count = -1
- for count,line in enumerate(open(r"d:\123.txt",'rU')):
- pass
- count += 1
-
print count
- #更好的方法
- count = 0
- thefile = open(r"d:\123.txt",'rb')
- whileTrue:
- buffer = thefile.read(1024 * 8192)
- ifnot buffer:
- break
- count += buffer.count('\n')
- thefile.close()
- print count
列印結果如下:
中國
6
6
6
拓展:
二、讀取檔案某一行的內容(測試過1G大小的檔案,效率還可以)
import linecache
count = linecache.getline(filename,linenum)
三、用linecache讀取檔案內容(測試過1G大小的檔案,效率還可以)
str = linecache.getlines(filename)
str為列表形式,每一行為列表中的一個元素
python linecache模組讀取檔案
在python中,有個好用的模組linecache,該模組允許從任何檔案裡得到任何的行,並且使用快取進行優化,常見的情況是從單個檔案讀取多行。
linecache.getlines(filename)
從名為filename的檔案中得到全部內容,輸出為列表格式,以檔案每行為列表中的一個元素,並以linenum-1為元素在列表中的位置儲存
linecache.getline(filename,lineno)
如果檔案沒有找到,這個函式將會在sys.path搜尋。
linecache.clearcache()
清除快取。如果你不再需要先前從getline()中得到的行
linecache.checkcache(filename)
檢查快取的有效性。如果在快取中的檔案在硬碟上發生了變化,並且你需要更新版本,使用這個函式。如果省略filename,將檢查快取裡的所有條目。
linecache.updatecache(filename)
更新檔名為filename的快取。如果filename檔案更新了,使用這個函式可以更新linecache.getlines(filename)返回的列表。
用法舉例:
1a
2b
3c
4d
5e
6f
7g
1、獲取a.txt檔案的內容
>>> a
['1a\n', '2b\n', '3c\n', '4d\n', '5e\n', '6f\n', '7g\n']
2、獲取a.txt檔案中第1-4行的內容
>>> a
['1a\n', '2b\n', '3c\n', '4d\n']
3、獲取a.txt檔案中第4行的內容
>>> a
'4d\n'
注意:使用linecache.getlines('a.txt')開啟檔案的內容之後,如果a.txt檔案發生了改變,如果要再次用linecache.getlines獲取的內容,不是檔案的最新內容,還是之前的內容,此時有兩種方法:
1、使用linecache.checkcache(filename)來更新檔案在硬碟上的快取,然後在執行linecache.getlines('a.txt')就可以獲取到a.txt的最新內容;
2、直接使用linecache.updatecache('a.txt'),即可獲取最新的a.txt的罪行內容
另外:
1)、讀取檔案之後,不需要使用檔案的快取時,需要在最後清理一下快取,使linecache.clearcache()清理快取,釋放快取。
2)、此模組使用記憶體來快取檔案內容,所以需要耗費記憶體,開啟檔案的大小和開啟速度和你的記憶體大小有關係。