Python 讀取大檔案

阿新 • • 發佈：2019-01-04

最近在學習python的過程中接觸到了python對檔案的讀取。python讀取檔案一般情況是利用open()函式以及read()函式來完成：

f = open(filename,'r')
f.read()

這種方法讀取小檔案，即讀取遠遠大小小於記憶體的檔案顯然沒有什麼問題。但是如果是將一個10G大小的日誌檔案讀取，即檔案大於記憶體的大小，這麼處理就有問題了，會造成MemoryError ... 也就是發生記憶體溢位。

發生這種錯誤的原因在於，read()方法執行操作是一次性的都讀入記憶體中，顯然檔案大於記憶體就會報錯。

解決方法：

這裡發現跟read()類似的還有其他的方法：read(引數)、readline()、readlines()

(1)read(引數)：通過引數指定每次讀取的大小長度,這樣就避免了因為檔案太大讀取出問題。

while True:
    block = f.read(1024)
    if not block:
        break

(2)readline()：每次讀取一行

while True:
    line = f.readline()
    if not line:
        break

(3)readlines()：讀取全部的行，構成一個list，通過list來對檔案進行處理，但是這種方式依然會造成MemoyError

for line in f.readlines():
    ....

以上基本分析了python中讀取檔案的方法，但是總感覺不能達到python中所強調的優雅，後來發現了還有下面的解決方法：

pythonic（我理解的是很python的python程式碼）的解決辦法：

with open(filename, 'r') as flie:
    for line in file:
        ....

對可迭代物件file進行迭代，這樣會自動的使用buffered IO以及記憶體管理，這樣就不必擔心大檔案問題了。

後來，又發現了一個模組：linecache，這個模組也可以解決大檔案讀取的問題，並且可以指定讀取哪一行，

# 輸出第2行
text = linecache.getline(filename, 2)

python讀取大檔案的方法 python計算檔案的行數和讀取某一行內容的實現方法

python計算檔案的行數和讀取某一行內容的實現方法：最簡單的辦法是把檔案讀入一個大的列表中,然後統計列表的長度.如果檔案的路徑是以引數的形式filepath傳遞的,那麼只用一行程式碼就可以完成我們的需求了: 1、http://blog.csdn.net/shudaq

python讀取大檔案和普通檔案

讀取檔案，最常見的方式是： with open('filename', 'r', encoding = 'utf-8') as f: for line in f.readlines(): do_something(line) 但是，當完成這一操作時，readlines()

Python 讀取大檔案的方式

對於讀取容量小的檔案，可以使用下面的方法： with open("path", "r") as f: f.read() 但是如果檔案容量很大，高達幾個G或者十幾個G，使用上面這種方式就容易造成記憶體溢位的問題，所以如果進行大容量的檔案讀取建議使用下面這種方式： with open

Python 讀取大檔案

最近在學習python的過程中接觸到了python對檔案的讀取。python讀取檔案一般情況是利用open()函式以及read()函式來完成：f = open(filename,'r') f.read()這種方法讀取小檔案，即讀取遠遠大小小於記憶體的檔案顯然沒有什麼問題。但是

用Python讀取大檔案（下）

上篇講到如何寫一個python程式去處理大檔案的內容讀取。中間涉及了幾個很關鍵的概念，可迭代物件，生成器和檔案物件。本篇解釋下這幾個概念。可迭代物件：在python中一個列表，就是一個可迭代物件，同時它也是迭代器。我們可以用for i in mylist

使用python讀取大檔案

python中讀取資料的時候有幾種方法，無非是read，readline，readlings和xreadlines幾種方法，在幾種方法中，read和xreadlines可以作為迭代器使用，從而在讀取大

PYTHON讀取大文字檔案時的注意事項

1. <span style="font-family:Arial;background-color: rgb(255, 255, 255);"> </span>f = open("bigFile.txt", "r") while True:

Python按行讀取大檔案

with open('X:/xxx/xxx', 'r', encoding='utf-8', errors='ignore') as inputFile: for line in inputFile: // 可以對檔案物件直接進行遍歷操作，此時記憶體管理等問題交由程

python 讀取大文件

treat pan 出現擔心 code including open hand you 要讀取個大文件，文件大概是3G左右，擔心read會出現內存溢出的情況，網上找了個靠譜的用法： with open(...) as f: for line in f:

python 讀取大文件越來越慢（判斷 key 在 map 中，千萬別用 in keys()）

方案使用 tail 千萬上傳 true 文件夾 blog alt 背景：今天樂樂姐寫代碼，讀取一個四五百兆的文件，然後做一串的處理。結果處理了一天還沒有出來結果。問題出在哪裏呢？解決： 1. 樂樂姐打印了在不同時間點的時間，直接print time() 即可。發

python讀取大文件的方法

href 形式 art source logs 簡單 body med tle python計算文件的行數和讀取某一行內容的實現方法：最簡單的辦法是把文件讀入一個大的列表中,然後統計列表的長度.如果文件的路徑是以參數的形式filepath傳遞的,那麽只用一行代碼就可以

python讀取yaml檔案中的資料

注意：在python2中進行讀取方式有兩種程式碼中的其中一種方式以註釋的形式展現出來： yaml中檔案的內容如下： 'top寬度:': '27' # ----------- 必須 ----------------------- # 計算機使用者名稱 username: onepoi

fread讀取大檔案以及返回值問題(轉載)

今天fread檔案讀取遇到問題，本來很小的一個問題，但是一直沒有注意到，導致花了不少時間除錯，所以寫下來備忘一下。 size_t fread ( void * ptr, size_t size, size_t count, FILE * stream ); /

pandas.read_csv——分塊讀取大檔案

訪問本站觀看效果更佳 read_csv中有個引數chunksize，通過指定一個chunksize分塊大小來讀取檔案，返回的是一個可迭代的物件TextFileReader，IO Tools 舉例如下： In [138]: reader = pd.read_table('

pandas讀取大檔案時memoryerror的解決辦法

再用pd.read_csv讀取大檔案時，如果檔案太大，會出現memoryerror的問題。解決辦法一：pd.read_csv的引數中有一個chunksize引數，為其賦值後，返回一個可迭代物件TextFileReader，對其遍歷即可 reader = pd.read_csv(file_

python讀取.caffemodel檔案

想讀取預訓練好的.caffemodel檔案的資訊，瞭解模型引數和結構 import caffe.proto.caffe_pb2 as caffe_pb2 caffemodel_filename = 'resnet101_faster_rcnn_final.caffemodel' model =

Python讀取scel檔案

背景介紹：將搜狗詞庫中 .scel 檔案轉化為 .txt 檔案搜狗詞庫連結：https://pinyin.sogou.com/dict/ 搜狗的scel詞庫就是儲存的文字的unicode編碼，每兩個位元組一個字元（中文漢字或者英文字母）找出其每部分的偏移位置即可，主要兩部分：

python讀取xls檔案

#!/usr/bin/env python # -*- coding: utf-8 -*- # @Time : 2018/10/17 14:41 # @Author : Sa.Song # @Desc : # @File : read_xls.py # @Software: PyC

python讀取大文件和普通文件

readlines error 如何 lines bsp utf span 異常 spa 讀取文件，最常見的方式是： with open(‘filename‘, ‘r‘, encoding = ‘utf-8‘) as f: for line in f.readli

python讀取xlsx檔案

# encoding: UTF-8 from openpyxl import load_workbook workbook = load_workbook(u'xxxxxx.xlsx') #相對路徑，找到需要開啟的檔案位置 booksheet = workbook.active

Python 讀取大檔案

相關推薦