Python Numpy中資料的常用儲存與讀取方法

阿新 • • 發佈：2020-04-02

在經常性讀取大量的數值檔案時(比如深度學習訓練資料),可以考慮現將資料儲存為Numpy格式,然後直接使用Numpy去讀取,速度相比為轉化前快很多.

下面就常用的儲存資料到二進位制檔案和儲存資料到文字檔案進行介紹:

1.儲存為二進位制檔案(.npy/.npz)

numpy.save

儲存一個數組到一個二進位制的檔案中,儲存格式是.npy

引數介紹

numpy.save(file,arr,allow_pickle=True,fix_imports=True)
file:檔名/檔案路徑
arr:要儲存的陣列
allow_pickle:布林值,允許使用Python pickles儲存物件陣列(可選引數,預設即可)

fix_imports:為了方便Pyhton2中讀取Python3儲存的資料(可選引數,預設即可)

使用

>>> import numpy as np 
#生成資料 
>>> x=np.arange(10) 
>>> x 
array([0,1,2,3,4,5,6,7,8,9]) 
 
#資料儲存 
>>> np.save('save_x',x) 
 
#讀取儲存的資料 
>>> np.load('save_x.npy') 
array([0,9]) 
numpy.savez

這個同樣是儲存陣列到一個二進位制的檔案中,但是厲害的是,它可以儲存多個數組到同一個檔案中,儲存格式是.npz,它其實就是多個前面np.save

的儲存的npy,再通過打包(未壓縮)的方式把這些檔案歸到一個檔案上,不行你去解壓npz檔案就知道了,裡面是就是自己儲存的多個npy.

引數介紹

numpy.savez(file,*args,**kwds)
file:檔名/檔案路徑
*args:要儲存的陣列,可以寫多個,如果沒有給陣列指定Key,Numpy將預設從'arr_0','arr_1'的方式命名
kwds:(可選引數,9]) >>> y=np.sin(x) >>> y array([ 0.,0.84147098,0.90929743,0.14112001,-0.7568025,-0.95892427,-0.2794155,0.6569866,0.98935825,0.41211849]) #資料儲存 >>> np.save('save_xy',x,y) #讀取儲存的資料 >>> npzfile=np.load('save_xy.npz') >>> npzfile #是一個物件,無法讀取 <numpy.lib.npyio.NpzFile object at 0x7f63ce4c8860> #按照組數預設的key進行訪問 >>> npzfile['arr_0'] array([0,9]) >>> npzfile['arr_1'] array([ 0.,0.41211849])

更加神奇的是,你可以不適用Numpy預設給陣列的Key,而是自己給陣列有意義的Key,這樣就可以不用去猜測自己載入資料是否是自己需要的.
#資料儲存 
>>> np.savez('newsave_xy',x=x,y=y) 
 
#讀取儲存的資料 
>>> npzfile=np.load('newsave_xy.npz') 
 
#按照儲存時設定組數key進行訪問 
>>> npzfile['x'] 
array([0,9]) 
>>> npzfile['y'] 
array([ 0.,0.41211849]) 
簡直不能太爽,深度學習中,有時候你儲存了訓練集,驗證集,測試集,還包括他們的標籤,用這個方式儲存起來,要啥載入啥,檔案數量大大減少,也不會到處改檔名去.

numpy.savez_compressed

這個就是在前面numpy.savez的基礎上加了壓縮,前面我介紹時尤其註明numpy.savez是得到的檔案打包,不壓縮的.這個檔案就是對檔案進行打包時使用了壓縮,可以理解為壓縮前各npy的檔案大小不變,使用該函式比前面的numpy.savez得到的npz檔案更小.

注:函式所需引數和numpy.savez一致,用法完成一樣.

2.儲存到文字檔案

numpy.savetxt

儲存陣列到文字檔案上,可以直接開啟檢視檔案裡面的內容.

引數介紹

numpy.savetxt(fname,X,fmt='%.18e',delimiter=' ',newline='\n',header='',footer='',comments='# ',encoding=None)
fname:檔名/檔案路徑,如果檔案字尾是.gz,檔案將被自動儲存為.gzip格式,np.loadtxt可以識別該格式
X:要儲存的1D或2D陣列
fmt:控制資料儲存的格式
delimiter:資料列之間的分隔符
newline:資料行之間的分隔符
header:檔案頭步寫入的字串
footer:檔案底部寫入的字串
comments:檔案頭部或者尾部字串的開頭字元,預設是'#'
encoding:使用預設引數

使用
>>> import numpy as np 
#生成資料 
>>> x = y = z = np.ones((2,3)) 
>>> x 
array([[1.,1.,1.],[1.,1.]]) 
  
#儲存資料 
np.savetxt('test.out',x) 
np.savetxt('test1.out',fmt='%1.4e') 
np.savetxt('test2.out',delimiter=',') 
np.savetxt('test3.out',newline='a') 
np.savetxt('test4.out',',newline='a') 
np.savetxt('test5.out',header='abc') 
np.savetxt('test6.out',footer='abc') 
儲存下來的檔案都是友好的,可以直接開啟看看有什麼變化.

numpy.loadtxt

根據前面定製的儲存格式,相應的載入資料的函式也得變化.

引數介紹

numpy.loadtxt(fname,dtype=<class 'float'>,comments='#',delimiter=None,converters=None,skiprows=0,usecols=None,unpack=False,ndmin=0,encoding='bytes')
fname:檔名/檔案路徑,如果檔案字尾是.gz或.bz2,檔案將被解壓,然後再載入
dtype:要讀取的資料型別
comments:檔案頭部或者尾部字串的開頭字元,用於識別頭部,尾部字串
delimiter:劃分讀取上來值的字串
converters:資料行之間的分隔符
.......後面不常用的就不寫了

使用
np.loadtxt('test.out') 
np.loadtxt('test2.out',') 
總結

到此這篇關於Python Numpy中資料的常用儲存與讀取方法的文章就介紹到這了,更多相關python numpy 資料儲存讀取內容請搜尋我們以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援我們！

Python Numpy中資料的常用儲存與讀取方法

在經常性讀取大量的數值檔案時(比如深度學習訓練資料),可以考慮現將資料儲存為Numpy格式,然後直接使用Numpy去讀取,速度相比為轉化前快很多.

記憶體中資料的儲存與獲取

資料的獲取 CPU 通過段地址和偏移地址獲取記憶體中的資料, 根據暫存器的大小獲取相應的位元組數目: mov al,ds:[0]

Numpy中常用的儲存與讀取資料的方法

技術標籤：人工智慧tensorflowpytorch神經網路深度學習在遇到經常性的讀取數值檔案的時候，比如在做深度學習處理的資料，將原始資料轉為Numpy格式的資料，然後使用Numpy直接讀取，這樣可以加快資料的讀取速度，

詳解Python list和numpy array的儲存和讀取方法

numpy array儲存為.npy 儲存： import numpy as np numpy_array = np.array([1,2,3]) np.save(\'log.npy\',numpy_array )

Python cookie的儲存與讀取、SSL講解

一、cookie的儲存與讀取 1.cookie的儲存-FileCookie.Jar from urllib import request,parse from http import cookiejar

Python 儲存與讀取HDF5檔案

HDF5 簡介 HDF（Hierarchical Data Format）指一種為儲存和處理大容量科學資料設計的檔案格式及相應庫檔案。HDF 最早由美國國家超級計算應用中心 NCSA 開發，目前在非盈利組織 HDF 小組維護下繼續發展。當前流行

Properties集合。使用Properties集合儲存資料，遍歷取出Properties集合中的資料。store與load方法的使用

package com.chunzhi.Test07Prop; import java.io.FileReader; import java.io.FileWriter; import java.io.IOException;

Python入門基礎篇 No.27 —— 列表_二維列表_表格資料的儲存和讀取

技術標籤：# 基礎列表python經驗分享程式人生windows Python入門基礎篇 No.27 —— 列表_二維列表_表格資料的儲存和讀取

python教程：35個numpy 中不常用的方法

技術標籤：pythonnumpy 挑戰 1：引入 numpy 並檢視 numpy 的版本。要求：這是第一步，以後我們使用 numpy 時都將用別名 np。

Python爬取資料並儲存到csv檔案中

1、資料來源 2、Python程式碼 import requests from lxml import etree import csv url = \'http://211.103.175.222:5080/zentaopms/www/index.php?m=project&f=task&projectID=830\'

Python中順序表原理與實現方法詳解

本文例項講述了Python中順序表原理與實現方法。分享給大家供大家參考，具體如下：

python numpy中cumsum的用法詳解

Cumsum ：計算軸向元素累加和，返回由中間結果組成的陣列重點就是返回值是“由中間結果組成的陣列”

在python Numpy中求向量和矩陣的範數例項

np.linalg.norm(求範數):linalg=linear（線性）+algebra（代數），norm則表示範數。函式引數

tensorflow實現訓練變數checkpoint的儲存與讀取

1.儲存變數先建立（在tf.Session()之前）saver saver = tf.train.Saver(tf.global_variables(),max_to_keep=1)#max_to_keep這個保證只儲存最後一次training的訓練資料

python numpy中array和mat型別矩陣乘法的三種方式比較（np.dot()、*、np.multiply()）

技術標籤：# 矩陣pythonnumpy線性代數 import numpy as np # np.array() # 1. np.dot() 矩陣乘法

python基礎中資料型別

1、變數的定義：在Python中，儲存一個數據，需要一個叫做變數的東西，如下示例：

C語言中資料的儲存

C語言中資料的儲存一、型別的基本歸類 1、整型 char unsigned char （0-255） signed char（-128-127）

java實現xml檔案儲存與讀取

　　 File GGCNimages_update1XMLFile = FileUtil.isExistXmlFile(\"http://www.baidu.com/sitemap.xml\", getContext());if (GGCNimages_update1XMLFile != null) {Log.d(\"debug\", \"從本地快取檔案中載入輪播圖

用二叉搜尋樹來實現資料的儲存與訪問(C++)

遞迴實現二叉搜尋樹多的插入與搜尋上程式碼~~ 1 #pragma warning(disable:4996) 2 #include<iostream>

MatLab---基本繪圖功能(下)+資料的儲存和讀取(上)

一、grid on 與 grid off gird on 顯示網格 gird off 關閉網格顯示二、legend() 顯示圖示

Python Numpy中資料的常用儲存與讀取方法

相關推薦