1. 程式人生 > >計算一個檔案中有多少行即讀取檔案行數 linecache

計算一個檔案中有多少行即讀取檔案行數 linecache

檔案D:\123.txt的內容如下:

1abc中國
2abc中國
3abc中國
4abc中國
5abc中國
6abc中國

讀取檔案行數程式碼如下:

  1. #encoding=utf-8
  2. print'中國'
  3. #計算一個檔案中有多少行
  4. #檔案比較小
  5. count = len(open(r"d:\123.txt",'rU').readlines())  
  6. print count  
  7. #檔案比較大
  8. count = -1
  9. for count,line in enumerate(open(r"d:\123.txt",'rU')):  
  10.     pass
  11. count += 1
  12. print count  
  13. #更好的方法
  14. count = 0
  15. thefile = open(r"d:\123.txt",'rb')  
  16. whileTrue:  
  17.     buffer = thefile.read(1024 * 8192)  
  18.     ifnot buffer:  
  19.         break
  20.     count += buffer.count('\n')  
  21. thefile.close()  
  22. print count  

列印結果如下:

中國
6
6
6

拓展:

二、讀取檔案某一行的內容(測試過1G大小的檔案,效率還可以)

import linecache

count = linecache.getline(filename,linenum)

三、用linecache讀取檔案內容(測試過1G大小的檔案,效率還可以)

str = linecache.getlines(filename)

str為列表形式,每一行為列表中的一個元素

python linecache模組讀取檔案

在python中,有個好用的模組linecache,該模組允許從任何檔案裡得到任何的行,並且使用快取進行優化,常見的情況是從單個檔案讀取多行。

linecache.getlines(filename)
從名為filename的檔案中得到全部內容,輸出為列表格式,以檔案每行為列表中的一個元素,並以linenum-1為元素在列表中的位置儲存

linecache.getline(filename,lineno)

從名為filename的檔案中得到第lineno行。這個函式從不會丟擲一個異常–產生錯誤時它將返回”(換行符將包含在找到的行裡)。
如果檔案沒有找到,這個函式將會在sys.path搜尋。

linecache.clearcache()
清除快取。如果你不再需要先前從getline()中得到的行

linecache.checkcache(filename)
檢查快取的有效性。如果在快取中的檔案在硬碟上發生了變化,並且你需要更新版本,使用這個函式。如果省略filename,將檢查快取裡的所有條目。

linecache.updatecache(filename)
更新檔名為filename的快取。如果filename檔案更新了,使用這個函式可以更新linecache.getlines(filename)返回的列表。

用法舉例:
 

複製程式碼程式碼示例: # cat a.txt
1a
2b
3c
4d
5e
6f
7g

1、獲取a.txt檔案的內容
 

複製程式碼程式碼示例: >>> a=linecache.getlines('a.txt')
>>> a
['1a\n', '2b\n', '3c\n', '4d\n', '5e\n', '6f\n', '7g\n']

2、獲取a.txt檔案中第1-4行的內容
 

複製程式碼程式碼示例: >>> a=linecache.getlines('a.txt')[0:4]
>>> a
['1a\n', '2b\n', '3c\n', '4d\n']

3、獲取a.txt檔案中第4行的內容
 

複製程式碼程式碼示例: >>> a=linecache.getline('a.txt',4)
>>> a
'4d\n'

注意:使用linecache.getlines('a.txt')開啟檔案的內容之後,如果a.txt檔案發生了改變,如果要再次用linecache.getlines獲取的內容,不是檔案的最新內容,還是之前的內容,此時有兩種方法:
1、使用linecache.checkcache(filename)來更新檔案在硬碟上的快取,然後在執行linecache.getlines('a.txt')就可以獲取到a.txt的最新內容;
2、直接使用linecache.updatecache('a.txt'),即可獲取最新的a.txt的罪行內容

另外:
1)、讀取檔案之後,不需要使用檔案的快取時,需要在最後清理一下快取,使linecache.clearcache()清理快取,釋放快取。
2)、此模組使用記憶體來快取檔案內容,所以需要耗費記憶體,開啟檔案的大小和開啟速度和你的記憶體大小有關係。