python3深度學習：計算機視覺OpenCV的安裝及使用(旋轉後圖像黑邊的去除未完成)

阿新 • • 發佈：2019-01-14

1.OpenCV庫的安裝與使用

OpenCV全稱為Open Source Computer Vision Library，是Intel公司支援開發的計算機視覺處理開源軟體庫，採用C或C++編寫，同樣提供了Python、MATLAB等語言的介面，可以自由的與醒來linux、Windows、Mac等多平臺作業系統中。其充分利用了Intel處理器的高效能多媒體函式庫的手工優化效能，提高了執行速度。其覆蓋了醫學影像、設計外觀、定位標記、生物體檢測等多個行業領域。

1.1 庫下載連結

https://www.lfd.uci.edu/~gohlke/pythonlibs/#opencv

1.2 庫安裝

Anaconda Prompt: pip install *.whl

引用形式：import cv2

2.OpenCV的基本圖片讀取

2.1 圖片儲存形式

在計算機中圖片是以矩陣的形式儲存在儲存介質中的。在OpenCV中三原色(RGB)的排列順序為BGR。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import cv2


img = np.mat(np.zeros((300, 300), dtype=np.uint8))
print(img.shape)

# cvtColor:Converts an image from one color space to another
# COLOR_GRAY2BGR: 色彩空間轉化的全域性變數
img = cv2.cvtColor(img, cv2.COLOR_GRAY2BGR)
print(img.shape)

# Displays an image in the specified window
cv2.imshow("test", img)
# Waits for a pressed key
cv2.waitKey(0)

2.2 影象的讀取與儲存

imread(filename, flags=None): Loads an image from a file.If the image cannot be read (because of missing file, improper permissions, unsupported or invalid format), the function . returns an empty matrix ( Mat::data==NULL )。該函式在讀取圖片的時候會刪除所有圖片Alpha通道資訊。

引數：

filename: 待讀取的檔名

flags: 讀取之後被自動處理我何種色彩空間。設定為cv2中的全域性變數。

imwrite(filename, img, params=None): Saves an image to a specified file. In general, only 8-bit . single-channel or 3-channel (with 'BGR' channel order) images . can be saved using this function. 要求輸出的圖片格式為BGR或者灰度圖。

引數：

filename: 待儲存圖片的名稱

img: 圖片所對應的矩陣

import numpy as np
import cv2


img = cv2.imread("maxin.jpg")
print(img.shape)  # (2000, 1360, 3)
img = cv2.imread("maxin.jpg", cv2.IMREAD_GRAYSCALE)
print(img.shape)  # (2000, 1360)
cv2.imwrite("maxin.png", img)

2.3 影象的轉換

在計算機中儲存的時候，任何一個圖片的儲存都佔有一定的空間，而為了減少圖片的儲存便於在有限的記憶體中更進一步的轉換，對於每個圖片來說，可以通過python自帶的bytearray()函式對其進行轉換。同樣，bytearray可通過矩陣重構的方式轉換為原本的圖片矩陣。

import numpy as np
import cv2
import os


imgByteArray = bytearray(os.urandom(90000))

imgBGR = np.array(imgByteArray).reshape(300, 300)
cv2.imshow("cool", imgBGR)
cv2.waitKey(0)

2.4 Numpy對影象的編輯

由於影象在記憶體中的儲存是通過矩陣的形式儲存的，因此，可直接通過numpy對某一位置進行修改。下部程式碼中，在讀取的圖片中畫了兩條白色的線。

import numpy as np
import cv2


img = cv2.imread("maxin.jpg", cv2.IMREAD_GRAYSCALE)
print(img)
print(img.shape)  # (2000, 1360)
img[:, 700] = 255
img[680, :] = 255
cv2.imshow(winname="img", mat=img)
cv2.waitKey(0)

3.OpenCV卷積處理

3.1 計算機視覺中常用的3中色彩空間

（1）灰度：僅保留黑白資訊的色彩空間稱為灰度空間。一般而言，灰度空間對人臉的處理特別有效。

（2）BGR: 在該空間中，每一個畫素都是由一個三維陣列表示的，分別代表藍、綠、紅三種顏色，且是OpenCV中的主要色彩空間。

（3）HSV: H是色調； S是飽和度; V是黑色度

3.2 卷積核與影象特徵提取

卷積核：

在OpenCV甚至是平常的影象處理中，卷積核是一種最常用的影象處理工具。其主要是通過確定的核塊來檢測影象的某個區域，後根據所檢測的畫素與其周圍存在的畫素的亮度差值來改變畫素明亮度的工具。

3.3 特徵提取方式一：多維卷積

convolve(input, weights, output=None, mode='reflect', cval=0.0, origin=0)：多維卷積

引數：

input: 輸入的圖片陣列(array_like)

weights: 卷積核

mode: 亮度調節的方式(constant, reflect, nearest)

cval: 輸入陣列外邊緣的填充值

import numpy as np
import cv2
# ndimage: Multi-dimensional image processing
from scipy import ndimage


kernel33 = np.array([[-1, -1, -1], [-1, 8, -1], [-1, -1, -1]])
kernel33_D = np.array([[1, 1, 1], [1, -8, 1], [1, 1, 1]])

# 讀取時直接轉換為灰度圖
img = cv2.imread("lena.jpg", cv2.IMREAD_GRAYSCALE)
lightImg = ndimage.convolve(img, kernel33_D, mode="reflect", cval=0)
print(lightImg)
cv2.imshow("img", img)
cv2.waitKey(0)

3.4 特徵提取方式二：高斯模糊

GaussianBlur(src, ksize, sigmaX, dst=None, sigmaY=None, borderType=None)： Blurs an image using a Gaussian filter

引數：

src: 圖片陣列，可為任何通道數

ksize: 高斯核的大小。(width, height) -> 長寬可以不同，但兩者必須為正的奇數

sigmaX: x方向的高斯核標準差

sigmaY: y方向的高斯核標準差。如果sigmaY為零，則將其設定為等於sigmaX，如果兩個sigma均為零，則分別從ksize.width和ksize.height計算（有關詳細資訊，請參閱#getGaussianKernel）; 為了完全控制結果，無論將來可能修改所有這些語義，建議指定所有ksize，sigmaX和sigmaY。

dst: output image of the same size and type as src

borderType: 畫素外推法

import numpy as np
import cv2
from scipy import ndimage


img = cv2.imread("lena.jpg", cv2.IMREAD_GRAYSCALE)
blurred = cv2.GaussianBlur(img, (11, 11), sigmaX=0)
gaussImg = img - blurred
cv2.imshow("GaussianBlur", gaussImg)
cv2.waitKey()

3.5 卷積的具體實現

import numpy as np
import cv2
from scipy import ndimage


def myConvolve(dataMat, kernel):
    """
    design my convolve function
    :param dataMat: img Mat  (256, 256)
    :param kernel: convolve  (3, 3)
    :return: Convolution kernel
    """
    m, n = dataMat.shape
    km, kn = kernel.shape
    newMat = np.ones((m-km+1, n-kn+1))

    tempMat = np.ones((km, kn))
    for row in range(m-km+1):
        for col in range(n-kn+1):
            for m_k in range(km):
                for n_k in range(kn):
                    tempMat[m_k, n_k] = dataMat[(row+m_k), (col+n_k)] * kernel[m_k, n_k]
            newMat[row, col] = np.sum(tempMat)

    return newMat


# (256, 256)
img = cv2.imread("lena.jpg", cv2.IMREAD_GRAYSCALE)
kernel33_D = np.array([[1, 1, 1], [1, -8, 1], [1, 1, 1]])
# (254, 254)
lightImg = myConvolve(img, kernel33_D)
# # 該函式實際上計算的是相關性，而並非卷積
# lightImg = cv2.filter2D(img, -1, kernel33_D)
# lightImg = ndimage.convolve(img, kernel33_D)
cv2.imshow("my_convolve", lightImg)
cv2.waitKey()

4.OpenCV影象的擴縮裁挖

【擴縮】：

cv.resize(src, dsize, dst=None, fx=None, fy=None, interpolation=None): 對影象進行擴縮

引數：

src: 待調整大小的圖片矩陣

dsize: 調整後圖片的大小(矩陣的x和y)。若dsize=0, 則為(round(fx*src.cols), round(fy*src.rows))。因此，dsize和fx\fy不能同時為0.

dst: 與src同類型的調整後的輸出矩陣

fx/fy: 比例因子，即調整後的圖片大小的x和y分別為src中x和y的多少倍。when fx/fy==0, fx = (dsize.width/src.cols), fy = (dsize.height/src.rows)

【挖掘】

即單純的陣列、矩陣操作

import tensorflow as tf
from scipy import ndimage
import cv2
import numpy as np


img = cv2.imread("leaf.png", cv2.IMREAD_GRAYSCALE)
# 放縮
imgBig = cv2.resize(img, (600, 600))
imgSml = cv2.resize(img, (100, 100))
cv2.imshow("Big", imgBig)
cv2.imshow("real", img)
cv2.imshow("Small", imgSml)

# 裁挖
part_of_imgBig = imgBig[200:, 25:575]
cv2.imshow("part", part_of_imgBig)
cv2.waitKey()

5.影象色調調整

cv2除了能夠對影象的區域進行設定、自由拉伸和裁剪已有的影象，同樣可以對圖片的色調(H:[0, 180])、飽和度(S: [0, 255])、明暗度(V: [0, 255])

5.1 色調調整

import cv2
import numpy as np


img = cv2.imread("leaf.png")
# cvtColor: Converts an image from one color space to another
# 將BGR轉換成HSV色彩空間
img_hsv = cv2.cvtColor(img, cv2.COLOR_BGR2HSV)

turn_green_hsv = img_hsv.copy()

# 每個畫素點減30個色調，即黃色被大範圍縮減(黃色被大範圍縮減)
turn_green_hsv[:, :, 0] = (turn_green_hsv[:, :, 0] - 1000) % 180

turn_green_img = cv2.cvtColor(turn_green_hsv, cv2.COLOR_HSV2BGR)
cv2.imshow("change_H", turn_green_img)
cv2.waitKey()

5.2 飽和度調整

import cv2
import numpy as np

img = cv2.imread("leaf.png")
# cvtColor: Converts an image from one color space to another
# 將BGR轉換成HSV色彩空間
img_hsv = cv2.cvtColor(img, cv2.COLOR_BGR2HSV)

less_color_hsv = img_hsv.copy()

# 降低圖片的飽和度,使得色調變灰
less_color_hsv[:, :, 1] = less_color_hsv[:, :, 1] * 0.1

less_color_img = cv2.cvtColor(less_color_hsv, cv2.COLOR_HSV2BGR)
cv2.imshow("change_H", less_color_img)
cv2.waitKey()

5.3 明暗度調整

import cv2
import numpy as np

img = cv2.imread("leaf.png")
# cvtColor: Converts an image from one color space to another
# 將BGR轉換成HSV色彩空間
img_hsv = cv2.cvtColor(img, cv2.COLOR_BGR2HSV)

less_light_hsv = img_hsv.copy()

# 降低圖片的亮度
less_light_hsv[:, :, 2] = less_light_hsv[:, :, 2] * 0.5

less_light_img = cv2.cvtColor(less_light_hsv, cv2.COLOR_HSV2BGR)
cv2.imshow("change_H", less_light_img)
cv2.waitKey()

5.4 增強圖片細節

Gamma變換主要是為了減少計算機視覺與人眼視覺的差異()而做的計算方式，但是在深度學習中，可作為噪聲修改的方式增大資料量。

gamma > 1, 影象變暗； gamma < 1, 影象變亮

import cv2
import numpy as np
import pandas as pd
from scipy import ndimage
import matplotlib.pyplot as plt


# plt.imread: Return value is a :class:`numpy.array`.  For grayscale images, the return array is MxN.
#             For RGB images, the return value is MxNx3. For RGBA images the return value is MxNx4.
img = cv2.imread("leaf.png")
gamma = 2

# 先歸一化，gamma作為指數，求出新畫素值再還原
# np.round: 將陣列舍入到給定的小數
gamma_change = [np.power(x/255, gamma) * 255 for x in range(256)]
gamma_img = np.round(np.array(gamma_change), 2).astype(np.uint8)

# cv2.LUT: 實現對映用的是Opencv的查表函式
img_corrected = cv2.LUT(src=img, lut=gamma_img)
plt.subplot(121)
plt.imshow(img)
plt.subplot(122)
plt.imshow(img_corrected)
plt.show()

6.影象的旋轉，平移和翻轉

該方法是深度學習對圖片處理的常用功能，可以極大的增加資料量。

cv2.wrapAffine(src, M, dsize, dst=None, flags=None, borderMode=None, borderValue=None)

引數：

src: 待處理的圖片原始矩陣

M: 仿射矩陣

dsize: 輸出圖片矩陣的大小

borderMode: 畫素外推法，實際上設定的是變換後的圖片怎樣顯示

import cv2
import numpy as np


img = cv2.imread("leaf.png")

# 仿射矩陣
# 第三列：原點座標
# 第二列：y軸座標
# 第一列：x軸座標
M_copy_img = np.array([[0, 0.8, -100],
                       [0.8, 0, -12]], dtype=np.float32)

# cv2.warpAffine：對影象應用仿射變換
# borderMode=cv2.BORDER_TRANSPARENT: 這意味著該功能不會修改與源影象中的“異常值”對應的目標影象中的畫素（即：修改後的圖
# 像直接列印在原始影象之上）
img_change = cv2.warpAffine(img, M_copy_img, (300, 300), borderMode=cv2.BORDER_TRANSPARENT)
# img_change = cv2.warpAffine(img, M_copy_img, (300, 300), borderMode=cv2.BORDER_CONSTANT)
# img_change = cv2.warpAffine(img, M_copy_img, (300, 300), borderMode=cv2.BORDER_DEFAULT)
# img_change = cv2.warpAffine(img, M_copy_img, (300, 300), borderMode=cv2.BORDER_REFLECT)
cv2.imshow("test", img_change)
cv2.waitKey()

7.OpenCV擴大影象資料庫

見本部落格文章

python3深度學習：計算機視覺OpenCV的安裝及使用(旋轉後圖像黑邊的去除未完成)

1.OpenCV庫的安裝與使用 OpenCV全稱為Open Source Computer Vision Library，是Intel公司支援開發的計算機視覺處理開源軟體庫，採用C或C++編寫，同樣提供了Python、MATLAB等語言的介面，可以自由的與醒來linux、Window

python3深度學習：計算機視覺OpenCV擴大影象資料庫

OpenCV擴大影象資料庫由於無論使用何種演算法和框架對神經網路進行訓練，圖片的資料量始終是一個決定訓練模型好壞的重要前提。資料擴充套件是訓練模型的一個常用手段，對於模型的魯棒性以及準確率都有非常重要的幫助。 1 影象的隨機裁剪圖片的隨機裁剪是一個常用的擴大

python3深度學習：計算機視覺仿射變換

1.模型變換的基本形式模型變換是指根據待匹配影象與背景影象之間幾何畸變的情況，所選擇的能最佳擬合兩幅影象之間變化的幾何變換模型。可採用的變換模型有如下幾種:剛性變換、仿射變換、透視變換和非線形變換等，如下圖： 2.仿射變換仿射變換（Affine Tr

python3深度學習：計算機視覺Gamma變換

【參考資料】https://blog.csdn.net/lichengyu/article/details/8457425 &n

從特徵描述子到深度學習：計算機視覺的20年曆程 From feature descriptors to deep learning: 20 years of computer vision

We all know that deep convolutional neural networks have produced some stellar results on object detection and recognition benchmarks in the past two year

深度學習與計算機視覺：搞懂反向傳播演算法的四個基本方程

BP演算法，在深度神經網路的發展中有著舉足輕重的地位，對於反向傳播演算法的推導過程，各種資料介紹可謂是多不勝數。但，由於深度神經網路的複雜性，要比較深刻的理解反向傳播演算法還是需要自己手動的推導一遍。本文以前篇深度學習與計算機視覺：深度學習必知基本概念以及鏈式求導介紹了神經網路的反向傳播中的鏈式求導法則

深度學習與計算機視覺：深度學習必知基本概念以及鏈式求導

深度學習與計算機視覺，開篇。深度學習的幾個基本概念反向傳播演算法中的鏈式求導法則。關於反向傳播四個基本方程的推導過程，放在下一篇。深度學習基礎深度學習的幾度沉浮的歷史就不多說了，這裡梳理下深度學習的一些基本概念，做個總結記錄，內容多來源於網路。神

學習計算機視覺：（三）深度學習在計算機視覺中的應用

1.影象分類：卷積神經網路CNN 影象分類概念首先，影象分類是解決是什麼的問題？如下圖，給定一幅圖片，網路能夠給出“最像”什麼的概率：影象分類使用的技術 •卷積神經網路CNN 它是

深度學習與計算機視覺[CS231N] 學習筆記（4.1）：反向傳播（Backpropagation）

在學習深度學習的過程中，我們常用的一種優化引數的方法就是梯度下降法，而一般情況下，我們搭建的神經網路的結構是：輸入→權重矩陣→損失函式。如下圖所示。而在給定輸入的情況下，為了使我們的損失函式值達到最小，我們就需要調節權重矩陣，使之滿足條件，於是，就有了本

【逐夢AI】深度學習與計算機視覺應用實戰課程（BAT工程師主講，無人汽車，機器人，神經網絡）

bat 神經網絡深度學習深度學習框架 0基礎 http 提取框架以及【逐夢AI】深度學習與計算機視覺應用實戰課程（BAT工程師主講，無人汽車，機器人，神經網絡）網盤地址：https://pan.baidu.com/s/1G0_WS-uHeSyVvvl_4bQnlA

分享《深度學習與計算機視覺演算法原理框架應用》《大資料架構詳解從資料獲取到深度學習》PDF資料集

下載：https://pan.baidu.com/s/12-s95JrHek82tLRk3UQO_w 更多資料分享：http://blog.51cto.com/3215120 《深度學習與計算機視覺演算法原理、框架應用》PDF，帶書籤，347頁。《大資料架構詳解：從資料獲取到深度學習》PDF，帶書籤，3

分享《深度學習與計算機視覺演算法原理框架應用》PDF《大資料架構詳解從資料獲取到深度學習》PDF +資料集

下載：https://pan.baidu.com/s/12-s95JrHek82tLRk3UQO_w 更多分享資料：https://www.cnblogs.com/javapythonstudy/ 《深度學習與計算機視覺演算法原理、框架應用》PDF，帶書籤，347頁。《大資料架構詳解：從資料獲取到深度學

分享《深度學習與計算機視覺算法原理框架應用》《大數據架構詳解從數據獲取到深度學習》PDF數據集

書簽部分 https log pdf 深入 -s 更多實用下載：https://pan.baidu.com/s/12-s95JrHek82tLRk3UQO_w 更多資料分享：http://blog.51cto.com/3215120 《深度學習與計算機視覺算法原理

人工智慧，深度學習，計算機視覺，自然語言處理，機器學習，百度網盤視訊教程

人工智慧，深度學習，計算機視覺，自然語言處理，機器學習視訊教程下載： 1. CS224D 2. NLP到Word2vec 3. Opencv3影象處理 4. Tensorflow 5. 機器學習 6. 人工智慧課程 7. 聊天機器人視訊教程 8. 自然語言處理獲取檔案下載連結

深度學習用於計算機視覺

密集連線層（精度97.8%）------>卷積神經網路（99.3%）兩者的區別在於：Dense層從特徵空間學到的是全域性模式，而卷積層學到時是區域性模式 1 卷積神經網路學到的模式具有平移不變性（視覺世界根本上來說就具有平移不變性），即在影象右下角學到某個模

深度學習與計算機視覺(PB-04)-rank-N準確度

在我們深入討論高階深度學習主題(如遷移學習)之前，先來了解下rank-1、rank-5和rank-N準確度的概念。當你在閱讀深度學習相關文獻時，尤其是關於計算機視覺和影象分類，你很可能會看到關於rank-N 準確度。例如，幾乎所有在ImageNet資料集上驗證的機器學習方法的論文都給出了ra

深度學習與計算機視覺(PB-03)-特徵提取

從這節開始，我們將討論關於遷移學習的內容，即用預先訓練好的模型（往往是在大型資料上訓練得到的）對新的資料進行學習. 首先，從傳統的機器學習場景出發，即考慮兩個分類任務：第一個任務是訓練一個卷積神經網路來識別影象中的狗和貓。第二個任務是訓練一個卷積神經網路識別三

深度學習與計算機視覺(PB-02)-資料增強

在深度學習實踐中，當訓練資料量少時，可能會出現過擬合問題。根據Goodfellow等人的觀點，我們對學習演算法的任何修改的目的都是為了減小泛化誤差，而不是訓練誤差。我們已經在sb[後續補充]中提到了不同型別的正則化手段來防止模型的過擬合，然而，這些都是針對引數的正則化形式，往往要求我們

深度學習與計算機視覺(PB-09)-使用HDF5儲存大資料集

到目前為止，我們使用的資料集都能夠全部載入到記憶體中。對於小資料集，我們可以載入全部影象資料到記憶體中，進行預處理，並進行前向傳播處理。然而，對於大規模資料集(比如ImageNet),我們需要建立資料生成器，每次只訪問一小部分資料集（比如mini-batch），然後對batch資料進行預處理

深度學習與計算機視覺(PB-08)-應用深度學習最佳途徑

在Starter Bundle第10章中，我們提到了訓練一個神經網路模型所需要的四個因素，即：資料集 loss函式神經網路結構優化演算法有了這四個因素，實際上我們是可以訓練任何深度學習模型，但是，我們如何訓練得到一個最優的深度學習模型？如果效果

python3__深度學習：計算機視覺__OpenCV的安裝及使用(旋轉後圖像黑邊的去除未完成)

1.OpenCV庫的安裝與使用

1.1 庫下載連結

1.2 庫安裝

2.OpenCV的基本圖片讀取

2.1 圖片儲存形式

2.2 影象的讀取與儲存

2.3 影象的轉換

2.4 Numpy對影象的編輯

3.OpenCV卷積處理

3.1 計算機視覺中常用的3中色彩空間

3.2 卷積核與影象特徵提取

3.3 特徵提取方式一：多維卷積

3.4 特徵提取方式二：高斯模糊

3.5 卷積的具體實現

4.OpenCV影象的擴縮裁挖

5.影象色調調整

5.1 色調調整

5.2 飽和度調整

5.3 明暗度調整

5.4 增強圖片細節

6.影象的旋轉，平移和翻轉

7.OpenCV擴大影象資料庫

相關推薦

python3深度學習：計算機視覺OpenCV的安裝及使用(旋轉後圖像黑邊的去除未完成)