使用python讀取大檔案

阿新 • • 發佈：2019-02-11

python中讀取資料的時候有幾種方法，無非是read，readline，readlings和xreadlines幾種方法，在幾種方法中，read和xreadlines可以作為迭代器使用，從而在讀取大資料的時候比較有效果.

在測試中，先建立一個大檔案，大概1GB左右，使用的程式如下：

import os.path
import time
while os.path.getsize('messages') <1000000000:
    f = open('messages','a')
    f.write('this is a file/n')
    f.close()

print 'file create complted'

在這裡使用迴圈判斷檔案的大小，如果大小在1GB左右，那麼結束建立檔案。--需要花費好幾分鐘的時間。

測試程式碼如下：

#22s
start_time = time.time()
f = open('messages','r')
for i in f:
    end_time = time.time()
    print end_time - start_time
    break
f.close()

#22s
start_time = time.time()
f = open('messages','r')
for i in f.xreadlines():
    end_time = time.time()
    print end_time - start_time
    break
f.close()


start_time = time.time()
f = open('messages','r')
k= f.readlines()
f.close()
end_time = time.time()
print end_time - start_time

使用迭代器的時候，兩者的時間是差不多的，記憶體消耗也不是很多，使用的時間大概在22秒作用

在使用完全讀取檔案的時候，使用的時間在40s，並且記憶體消耗相當嚴重，大概使用了1G的記憶體。。

其實，在使用跌倒器的時候，如果進行連續操作，進行print或者其他的操作，記憶體消耗還是不可避免的，但是記憶體在那個時候是可以釋放的，從而使用迭代器可以節省記憶體，主要是可以釋放。

而在使用直接讀取所有資料的時候，資料會保留在記憶體中，是無法釋放這個記憶體的，從而記憶體卡死也是有可能的。

在使用的時候，最好是直接使用for i in f的方式來使用，在讀取的時候，f本身就是一個迭代器，其實也就是f.read方法

python讀取大檔案的方法 python計算檔案的行數和讀取某一行內容的實現方法

python計算檔案的行數和讀取某一行內容的實現方法：最簡單的辦法是把檔案讀入一個大的列表中,然後統計列表的長度.如果檔案的路徑是以引數的形式filepath傳遞的,那麼只用一行程式碼就可以完成我們的需求了: 1、http://blog.csdn.net/shudaq

python讀取大檔案和普通檔案

讀取檔案，最常見的方式是： with open('filename', 'r', encoding = 'utf-8') as f: for line in f.readlines(): do_something(line) 但是，當完成這一操作時，readlines()

Python 讀取大檔案的方式

對於讀取容量小的檔案，可以使用下面的方法： with open("path", "r") as f: f.read() 但是如果檔案容量很大，高達幾個G或者十幾個G，使用上面這種方式就容易造成記憶體溢位的問題，所以如果進行大容量的檔案讀取建議使用下面這種方式： with open

Python 讀取大檔案

最近在學習python的過程中接觸到了python對檔案的讀取。python讀取檔案一般情況是利用open()函式以及read()函式來完成：f = open(filename,'r') f.read()這種方法讀取小檔案，即讀取遠遠大小小於記憶體的檔案顯然沒有什麼問題。但是

用Python讀取大檔案（下）

上篇講到如何寫一個python程式去處理大檔案的內容讀取。中間涉及了幾個很關鍵的概念，可迭代物件，生成器和檔案物件。本篇解釋下這幾個概念。可迭代物件：在python中一個列表，就是一個可迭代物件，同時它也是迭代器。我們可以用for i in mylist

使用python讀取大檔案

python中讀取資料的時候有幾種方法，無非是read，readline，readlings和xreadlines幾種方法，在幾種方法中，read和xreadlines可以作為迭代器使用，從而在讀取大

PYTHON讀取大文字檔案時的注意事項

1. <span style="font-family:Arial;background-color: rgb(255, 255, 255);"> </span>f = open("bigFile.txt", "r") while True:

Python按行讀取大檔案

with open('X:/xxx/xxx', 'r', encoding='utf-8', errors='ignore') as inputFile: for line in inputFile: // 可以對檔案物件直接進行遍歷操作，此時記憶體管理等問題交由程

python 讀取大文件

treat pan 出現擔心 code including open hand you 要讀取個大文件，文件大概是3G左右，擔心read會出現內存溢出的情況，網上找了個靠譜的用法： with open(...) as f: for line in f:

python 讀取大文件越來越慢（判斷 key 在 map 中，千萬別用 in keys()）

方案使用 tail 千萬上傳 true 文件夾 blog alt 背景：今天樂樂姐寫代碼，讀取一個四五百兆的文件，然後做一串的處理。結果處理了一天還沒有出來結果。問題出在哪裏呢？解決： 1. 樂樂姐打印了在不同時間點的時間，直接print time() 即可。發

python讀取大文件的方法

href 形式 art source logs 簡單 body med tle python計算文件的行數和讀取某一行內容的實現方法：最簡單的辦法是把文件讀入一個大的列表中,然後統計列表的長度.如果文件的路徑是以參數的形式filepath傳遞的,那麽只用一行代碼就可以

python讀取yaml檔案中的資料

注意：在python2中進行讀取方式有兩種程式碼中的其中一種方式以註釋的形式展現出來： yaml中檔案的內容如下： 'top寬度:': '27' # ----------- 必須 ----------------------- # 計算機使用者名稱 username: onepoi

fread讀取大檔案以及返回值問題(轉載)

今天fread檔案讀取遇到問題，本來很小的一個問題，但是一直沒有注意到，導致花了不少時間除錯，所以寫下來備忘一下。 size_t fread ( void * ptr, size_t size, size_t count, FILE * stream ); /

pandas.read_csv——分塊讀取大檔案

訪問本站觀看效果更佳 read_csv中有個引數chunksize，通過指定一個chunksize分塊大小來讀取檔案，返回的是一個可迭代的物件TextFileReader，IO Tools 舉例如下： In [138]: reader = pd.read_table('

pandas讀取大檔案時memoryerror的解決辦法

再用pd.read_csv讀取大檔案時，如果檔案太大，會出現memoryerror的問題。解決辦法一：pd.read_csv的引數中有一個chunksize引數，為其賦值後，返回一個可迭代物件TextFileReader，對其遍歷即可 reader = pd.read_csv(file_

python讀取.caffemodel檔案

想讀取預訓練好的.caffemodel檔案的資訊，瞭解模型引數和結構 import caffe.proto.caffe_pb2 as caffe_pb2 caffemodel_filename = 'resnet101_faster_rcnn_final.caffemodel' model =

Python讀取scel檔案

背景介紹：將搜狗詞庫中 .scel 檔案轉化為 .txt 檔案搜狗詞庫連結：https://pinyin.sogou.com/dict/ 搜狗的scel詞庫就是儲存的文字的unicode編碼，每兩個位元組一個字元（中文漢字或者英文字母）找出其每部分的偏移位置即可，主要兩部分：

python讀取xls檔案

#!/usr/bin/env python # -*- coding: utf-8 -*- # @Time : 2018/10/17 14:41 # @Author : Sa.Song # @Desc : # @File : read_xls.py # @Software: PyC

python讀取大文件和普通文件

readlines error 如何 lines bsp utf span 異常 spa 讀取文件，最常見的方式是： with open(‘filename‘, ‘r‘, encoding = ‘utf-8‘) as f: for line in f.readli

python讀取xlsx檔案

# encoding: UTF-8 from openpyxl import load_workbook workbook = load_workbook(u'xxxxxx.xlsx') #相對路徑，找到需要開啟的檔案位置 booksheet = workbook.active

使用python讀取大檔案

相關推薦