1. 程式人生 > >Python-OpenCV基本操作

Python-OpenCV基本操作

基本屬性

  1. cv2.imread(檔名,屬性) 讀入影象
    屬性:指定影象用哪種方式讀取檔案
    • cv2.IMREAD_COLOR:讀入彩色影象,預設引數,Opencv 讀取彩色影象為BGR模式 !!!注意
    • cv2.IMREAD_GRAYSCALE:讀入灰度影象。
  2. cv2.imshow(視窗名,影象檔案) 顯示影象
    可以建立多個視窗
  3. cv2.waitKey() 鍵盤繫結函式
    函式等待特定的幾毫秒,看是否由鍵盤輸入。
  4. cv2.namedWindow(視窗名,屬性) 建立一個視窗
    屬性:指定視窗大小模式
    • cv2.WINDOW_AUTOSIZE:根據影象大小自動建立大小
    • cv2.WINDOW_NORMAL:視窗大小可調整
  5. cv2.destoryAllWindows(視窗名) 刪除任何建立的視窗

程式碼例項:

    import cv2
    img=cv2.imread('test.py',cv2.IMREAD_COLOR)
    cv2.namedWindow('image',cv2.WINDOW_NORMAL)
    cv2.imshow('image',img)
    cv2.waitKey(0)
    cv2.destoryAllWindows()
  1. cv2.imwrite(儲存影象名,需儲存影象) 儲存影象

程式碼例項:

    import cv2
    img=cv2.imread('test.png',0)
    cv2.imshow('image',img)
    k=cv2.waitKey(0)
    if k==27:    #等待 ESC 鍵
        cv2.destoryAllWindows()
    elif k==ord('s') #等待 's' 鍵來儲存和退出
        cv2.imwrite('messigray.png',img)
        cv2.destoryAllWindows()

對於影象的一些操作

0x01. 獲取圖片屬性

import cv2
img=img.imread('test.png')
print img.shape
#(768,1024,3)
print img.size
#2359296  768*1024*3
print img.dtype
#uint8

0x02. 輸出文字

在處理圖片時,將一些資訊直接以文字的形式輸出在圖片上
cv2.putText(圖片名,文字,座標,文字顏色)

0x03. 縮放圖片

實現縮放圖片並儲存,在使用OpenCV時常用的操作。cv2.resize()支援多種插值演算法,預設使用cv2.INTER_LINEAR,縮小最適合使用:cv2.INTER_AREA,放大最適合使用:cv2.INTER_CUBIC或cv2.INTER_LINEAR。
res=cv2.resize(image,(2*width,2*height),interpolation=cv2.INTER_CUBIC)
或者:
res=cv2.resize(image,None,fx=2,fy=2,interpolation=cv2.INTER_CUBIC)
此處None本應該是輸出影象的尺寸,因為後邊設定了縮放因子

0x04. 影象平移

cv2.warpAffine(src, M, dsize[, dst[, flags[, borderMode[, borderValue]]]])
平移就是將影象換個位置,如果要沿(x,y)方向移動,移動距離為(tx,ty),則需要構建偏移矩陣M。
這裡寫圖片描述

例如 平移圖片(100,50)

    import cv2
    img=cv2.imread('test.png',1)
    rows,cols,channel=img.shape
    M=np.float32([[1,0,100],[0,1,50]])
    dst=cv2.warpAffine(img,M,(cols,rows))
    cv2.imshow('img',dst)
    cv2.waitKey(0)
    cv2.destoryALLWindows()

其中 (cols,rows)代表輸出影象的大小,M為變換矩陣,100代表x的偏移量,50代表y的偏移量,單位為畫素。

0x05. 影象旋轉

OpenCV中首先需要構造一個旋轉矩陣,通過cv2.getRotationMatrix2D獲得。

import cv2
img=cv2.imread('test.png',0)
rows,cols=img.shape
#第一個引數為旋轉中心,第二個為旋轉角度,第三個為旋轉後的縮放因子
M=cv2.getRotationMatrix2D((cols/2,rows/2),45,0.6)
#第三個引數為影象的尺寸中心
dst=cv2.warpAffine(img,M,(2*cols,2*rows))
cv2.imshow('img',dst)
cv2.waitKey(0)
cv2.destoryALLWindows()

0x06. 仿射變換

在仿射變換中,原圖中所有的平行線在結果影象中同樣平行。為了建立偏移矩陣,需要在原影象中找到三個點以及它們在輸出影象中的位置。然後OpenCV中提供了cv2.getAffineTransform建立2*3的矩陣,最後將矩陣傳給函式cv2.warpAffine。

import cv2
import matplotlib.pyplot as plt
import numpy as np
img=cv2.imread('test.png')
rows,cols,ch=img.shape
pts1=np.float32([[50,50],[200,50],[50,200]])
pts2=np.float32([[10,100],[200,50],[100,250]])
M=cv2.getAffineTransform(pts1,pts2)
dst=cv2.warpAffine(img,M,(cols,rows))
plt.subplot(121),plt.imshow(img),plt.title('Input')
plt.subplot(122),plt.imshow(dst),plt.title('Output')
plt.show()

這裡寫圖片描述

0x07. 透視變換

視角變換,需要一個3*3變換矩陣。在變換前後要保證直線還是直線。構建此矩陣需要在輸入影象中找尋4個點,以及在輸出影象中對應的位置。這四個點中的任意三個點不能共線。變換矩陣OpenCV提供cv2.getPerspectiveTransform()構建。然後將矩陣傳入函式cv2.warpPerspective。

import cv2
import numpy as np
import matplotlib.pyplot as plt
img=cv2.imread('test.png')
rows,cols,ch=img.shape
pts1=np.float32([[56,65],[368,52],[28,387],[389,390]])
pts2=np.float32([[0,0],[300,0],[0,300],[300,300]])
M=cv2.getPerspectiveTransform(pts1,pts2)
dst=cv2.warpPerspective(img,M,(300,300))
plt.subplot(121),plt.imshow(img),plt.title('Input')
plt.subplot(122),plt.imshow(dst),plt.title('Output')
plt.show()

這裡寫圖片描述

0x09. 影象 regions of Interest

有時需要對一副影象的特定區域進行操作,ROI使用Numpy索引來獲得的。

import cv2
import numpy as np
import matplotlib.pyplot as plt

image=cv2.imread('test.png')
rows,cols,ch=image.shape
tall=image[0:100,300:700]
image[0:100,600:1000]=tallall
cv2.imshow("image",image)
cv2.waitKey(0)
cv2.destoryALLWindows()

這裡寫圖片描述

0x10. 通道的拆分/合併處理

有時需要對BGR三個通道分別進行操作。這時需要將BGR拆分成單個通道。同時有時需要把獨立通道的圖片合併成一個BGR影象。
使用OpenCV庫函式版本

import cv2
import numpy as np
import matplotlib.pyplot as plt

image=cv2.imread('pitt1.jpg')
rows,cols,ch=image.shape
#拆分通道,cv2.split()是一個比較耗時的操作。只有需要時使用,儘量Numpy
b,g,r=cv2.split(image)
print b.shape
#(768,1024)
#合併通道
image=cv2.merge(b,g,r)

使用Numpy索引版本:

import cv2
import numpy as np
import matplotlib.pyplot as plt

image=cv2.imread('pitt1.jpg')
rows,cols,ch=image.shape
#直接獲取
b=img[:,:,0]