Python影象讀寫方法對比

阿新 • • 發佈：2020-11-15

　　訓練視覺相關的神經網路模型時，總是要用到影象的讀寫。方法有很多，比如matplotlib、cv2、PIL等。下面比較幾種讀寫方式，旨在選出一個最快的方式，提升訓練速度。

實驗標準

　　因為訓練使用的框架是Pytorch，因此讀取的實驗標準如下：

　　1、讀取解析度都為1920x1080的5張圖片（png格式一張，jpg格式四張）並儲存到陣列。

　　2、將讀取的陣列轉換為維度順序為CxHxW的Pytorch張量，並儲存到視訊記憶體中（我使用GPU訓練），其中三個通道的順序為RGB。

　　3、記錄各個方法在以上操作中所耗費的時間。因為png格式的圖片大小差不多是質量有微小差異的jpg格式的10倍，所以資料集通常不會用png來儲存，就不比較這兩種格式的讀取時間差異了。

　　寫入的實驗標準如下：

　　1、將5張1920x1080的5張影象對應的Pytorch張量轉換為對應方法可使用的資料型別陣列。

　　2、以jpg格式儲存五張圖片。

　　3、記錄各個方法儲存圖片所耗費的時間。

實驗情況

cv2

　　因為有GPU，所以cv2讀取圖片有兩種方式：

　　1、先把圖片都讀取為一個numpy陣列，再轉換成儲存在GPU中的pytorch張量。

　　2、初始化一個儲存在GPU中的pytorch張量，然後將每張圖直接複製進這個張量中。

　　第一種方式實驗程式碼如下：

import os, torch
import cv2 as cv 
import numpy as np 
from time import time 
 
read_path = 'D:test'
write_path = 'D:test\\write\\'
 
# cv2讀取 1
start_t = time()
imgs = np.zeros([5, 1080, 1920, 3])
for img, i in zip(os.listdir(read_path), range(5)): 
  img = cv.imread(filename=os.path.join(read_path, img))
  imgs[i] = img   
imgs = torch.tensor(imgs).to('cuda')[...,[2,1,0]].permute([0,3,1,2])/255 
print('cv2 讀取時間1：', time() - start_t) 
# cv2儲存
start_t = time()
imgs = (imgs.permute([0,2,3,1])[...,[2,1,0]]*255).cpu().numpy()
for i in range(imgs.shape[0]): 
  cv.imwrite(write_path + str(i) + '.jpg', imgs[i])
print('cv2 儲存時間：', time() - start_t)

　　實驗結果：

cv2 讀取時間1： 0.39693760871887207
cv2 儲存時間： 0.3560612201690674

　　第二種方式實驗程式碼如下：

import os, torch
import cv2 as cv 
import numpy as np 
from time import time 
 
read_path = 'D:test'
write_path = 'D:test\\write\\'
 
 
# cv2讀取 2
start_t = time()
imgs = torch.zeros([5, 1080, 1920, 3], device='cuda')
for img, i in zip(os.listdir(read_path), range(5)): 
  img = torch.tensor(cv.imread(filename=os.path.join(read_path, img)), device='cuda')
  imgs[i] = img   
imgs = imgs[...,[2,1,0]].permute([0,3,1,2])/255 
print('cv2 讀取時間2：', time() - start_t) 
# cv2儲存
start_t = time()
imgs = (imgs.permute([0,2,3,1])[...,[2,1,0]]*255).cpu().numpy()
for i in range(imgs.shape[0]): 
  cv.imwrite(write_path + str(i) + '.jpg', imgs[i])
print('cv2 儲存時間：', time() - start_t)

　　實驗結果：

cv2 讀取時間2： 0.23636841773986816
cv2 儲存時間： 0.3066873550415039

matplotlib

　　同樣兩種讀取方式，第一種程式碼如下：

import os, torch 
import numpy as np
import matplotlib.pyplot as plt 
from time import time 
 
read_path = 'D:test'
write_path = 'D:test\\write\\'
 
# matplotlib 讀取 1
start_t = time()
imgs = np.zeros([5, 1080, 1920, 3])
for img, i in zip(os.listdir(read_path), range(5)): 
  img = plt.imread(os.path.join(read_path, img)) 
  imgs[i] = img    
imgs = torch.tensor(imgs).to('cuda').permute([0,3,1,2])/255  
print('matplotlib 讀取時間1：', time() - start_t) 
# matplotlib 儲存
start_t = time()
imgs = (imgs.permute([0,2,3,1])).cpu().numpy()
for i in range(imgs.shape[0]):  
  plt.imsave(write_path + str(i) + '.jpg', imgs[i])
print('matplotlib 儲存時間：', time() - start_t)

　　實驗結果：

matplotlib 讀取時間1： 0.45380306243896484
matplotlib 儲存時間： 0.768944263458252

　　第二種方式實驗程式碼：

import os, torch 
import numpy as np
import matplotlib.pyplot as plt 
from time import time 
 
read_path = 'D:test'
write_path = 'D:test\\write\\'
 
# matplotlib 讀取 2
start_t = time()
imgs = torch.zeros([5, 1080, 1920, 3], device='cuda')
for img, i in zip(os.listdir(read_path), range(5)): 
  img = torch.tensor(plt.imread(os.path.join(read_path, img)), device='cuda')
  imgs[i] = img    
imgs = imgs.permute([0,3,1,2])/255  
print('matplotlib 讀取時間2：', time() - start_t) 
# matplotlib 儲存
start_t = time()
imgs = (imgs.permute([0,2,3,1])).cpu().numpy()
for i in range(imgs.shape[0]):  
  plt.imsave(write_path + str(i) + '.jpg', imgs[i])
print('matplotlib 儲存時間：', time() - start_t)

　　實驗結果：

matplotlib 讀取時間2： 0.2044532299041748
matplotlib 儲存時間： 0.4737534523010254

　　需要注意的是，matplotlib讀取png格式圖片獲取的陣列的數值是在$[0, 1]$範圍內的浮點數，而jpg格式圖片卻是在$[0, 255]$範圍內的整數。所以如果資料集內圖片格式不一致，要注意先轉換為一致再讀取，否則資料集的預處理就麻煩了。

PIL

　　PIL的讀取與寫入並不能直接使用pytorch張量或numpy陣列，要先轉換為Image型別，所以很麻煩，時間複雜度上肯定也是佔下風的，就不實驗了。

torchvision

　　torchvision提供了直接從pytorch張量儲存圖片的功能，和上面讀取最快的matplotlib的方法結合，程式碼如下：

import os, torch  
import matplotlib.pyplot as plt 
from time import time 
from torchvision import utils 

read_path = 'D:test'
write_path = 'D:test\\write\\'
 
# matplotlib 讀取 2
start_t = time()
imgs = torch.zeros([5, 1080, 1920, 3], device='cuda')
for img, i in zip(os.listdir(read_path), range(5)): 
  img = torch.tensor(plt.imread(os.path.join(read_path, img)), device='cuda')
  imgs[i] = img    
imgs = imgs.permute([0,3,1,2])/255  
print('matplotlib 讀取時間2：', time() - start_t) 
# torchvision 儲存
start_t = time() 
for i in range(imgs.shape[0]):   
  utils.save_image(imgs[i], write_path + str(i) + '.jpg')
print('torchvision 儲存時間：', time() - start_t)

　　實驗結果：

matplotlib 讀取時間2： 0.15358829498291016
torchvision 儲存時間： 0.14760661125183105

　　可以看出這兩個是最快的讀寫方法。另外，要讓圖片的讀寫儘量不影響訓練程序，我們還可以讓這兩個過程與訓練並行。另外，utils.save_image可以將多張圖片拼接成一張來儲存，具體使用方法如下：

utils.save_image(tensor = imgs,     # 要儲存的多張圖片張量 shape = [n, C, H, W]
                 fp = 'test.jpg',   # 儲存路徑
                 nrow = 5,          # 多圖拼接時，每行所佔的圖片數
                 padding = 1,       # 多圖拼接時，每張圖之間的間距
                 normalize = True,  # 是否進行規範化，通常輸出影象用tanh，所以要用規範化 
                 range = (-1,1))    # 規範化的範圍

Python影象讀寫方法對比

　　訓練視覺相關的神經網路模型時，總是要用到影象的讀寫。方法有很多，比如matplotlib、cv2、PIL等。下面比較幾種讀寫方式，旨在選出一個最快的方式，提升訓練速度。實驗標準　　因為訓練使用的框架是Pytorch，因此讀取的實驗標準如下：　　1、讀取解析度都為1920x1080的5張圖片（png格

Python---影象讀寫操作(scipy)

這裡介紹的僅僅是深度學習中常用的操作：#read and save images operations import os import glob import random from scipy im

Map四種方法的讀寫效能對比

package lzh; import java.util.HashMap; import java.util.Hashtable; import java.util.LinkedHashMap; import java.util.Map; import java.ut

Python excel讀寫

pty xxx oam 切換 ont ext ces cell 創建 1 # coding=utf-8 2 3 print "----------------分割線 xlrd--------------------" 4 import xlrd 5

cookies的簡單讀寫方法

cookie一、cookie的寫入//定義COOKIES，實例化HttpCookie類並添加值HttpCookie cookie = new HttpCookie(key, value); //設置保存時間 cookie.Expires = DateTime.Now.AddDays(1);//添加當前實例化

python--ConfigParser讀寫改配置文件

得到 pen with open ring 文件 open 打開 work add from configparser import ConfigParser fp = ‘conf.ini‘ #定義配置文件名 conf = ConfigParser() #實例化

python中讀寫excel並存入mysql

xxxxx 指定 pytho 一個讀寫連接 size mysq 亂碼為了一個突如其來的想法：用python簡單解決就好。現在算是把這個項目需要的基礎功能坑都填完了。剩下就是AI和數據展示方面的坑了。今天遇到的坑是： 1、從excel讀出的中文

Spark SQL讀寫方法

data 類型編程記錄 sim 效率 top 行數 gty 一、DataFrame：有列名的RDD 首先，我們知道SparkSQL的目的是用sql語句去操作RDD，和Hive類似。SparkSQL的核心結構是DataFrame，如果我們知道RDD裏面的字段，也知道裏面的

python檔案讀寫指南（二）

我們知道當檔案不存在的時候，open()方法的寫模式與追加模式都會新建檔案，但是對檔案進行判斷的場景還有很多，比如，在爬蟲下載圖片的時候，可能需要判斷檔案是否存在，以免重複下載；又比如，建立新檔案的時候，可能需要判斷檔案是否存在，存在就先做個備份......所以，學習判斷檔案是否存在，還是很有必要的

python檔案讀寫指南（一）

目錄如何將列表資料寫入檔案？如何從檔案中讀取內容？多樣需求的讀寫任務從with語句到上下文管理器如何將列表資料寫入檔案？首先，我們來看看下面這段程式碼，並思考：這段程式碼有沒有問題，如果有問題的話，要怎麼改？ li =

遇到錯誤：python檔案讀寫許可權permission denied

程式碼shutil.copyfile(os.path.join(sourcepath+'/'+eachclass+ '/',im),valpath+'/'+eachclass+'/'+im)中訪問後一個路徑上的檔案valpath+'/'+eachclass+'/'+im，im是一個*

學習OpenCV-Python——視訊讀寫

#0表示讀取攝像頭，輸入視訊檔案路徑可以讀取視訊檔案 capture = cv2.VideoCapture(0) ret, frame = capture.read() while ret: #1表示左右翻轉，-1表示上下翻轉 frame = cv2.flip(frame,1

心田花開小學一年級快速掌握拼音複韻母ai ei ui讀寫方法

複韻母ai ei ui對一年級學生認識生字及生字讀音有很大的幫助，同時拼音韻母ai ei ui讀法寫法等對一年級學生來說是一個較大的難點。心田花開從以下三方面讓一年級學生快速學會複韻母ai ei ui的讀寫法並認識相應的生字。一、漢語拼音韻母ai ei ui兒歌激發孩子的學習興趣，並瞭解漢

Python檔案讀寫深入

讀模式 r 開啟不存在的檔案會報錯、不能寫,如不指定模式則預設是r 寫模式 w 開啟不存在的檔案會,會新建一個檔案；開啟存在的檔案會先清空後覆蓋原有檔案；不能讀追加模式 a 開啟不存在的檔

Python檔案讀寫之r+/w+/a+

讀模式 r 開啟不存在的檔案會報錯、不能寫；如不指定模式則預設是r 寫模式 w 開啟不存在的檔案會,會新建一個檔案；開啟存在的檔案會先清空後覆蓋原有檔案；不能讀追加模式 a 開啟不存在的檔

【python】讀寫excel

轉載：http://blog.csdn.net/majordong100/article/details/50708365 學習Python的過程中，我們會遇到Excel的讀寫問題。通過搜尋得知，我們可以使用xlwt module將資料寫入Excel表格，使用xlrd module從Ex

python的讀寫操作

注意倒數第三行的f.write('hello') #------------------------------------- f= open('C://Users//Administrator//Desktop//test.txt' , 'r+')#只能這樣寫檔案位

python 檔案讀寫模式r,r+,w,w+,a,a+的區別（附程式碼示例）

如下表模式可做操作若檔案不存在是否覆蓋 r 只能讀報錯 - r+ 可讀可寫報錯是 w 只能寫建立是 w+　可讀可寫建立是

Python 檔案讀寫

一.file物件（file-like Object）在標準庫中，不需要安裝 1.file 物件使用 open 函式來建立： f = open(/path/1.txt, mode='r') 2.open函式引數： open(file, mode=‘r’,

Python檔案讀寫注意編碼

檔案的讀寫操作1.python3中的預設的編碼解碼方式為utf-8 windows預設使用的編碼方式為gbk 當讀取一個windows檔案(gbk),可以指定讀取時使用的編碼encoding=('gbk')或者不需要指定 with open('a.txt','r','encoding=(gbk)') as f

Python影象讀寫方法對比

實驗標準

實驗情況

cv2

matplotlib

PIL

torchvision

相關推薦