OpenCV—python 影象矯正（基於傅立葉變換—基於透視變換）

阿新 • • 發佈：2019-01-19

影象校正執行環境 Anaconda| pycharm/jupyter notebook
你需要安裝如下庫

pip install numpy
pip install matplotlib
pip install opencv-python

一、基於傅立葉變換的影象矯正

1.1 傅立葉變換原理

2維影象的傅立葉變換可以用以下數學公式表達:
$F(k,l) = \displaystyle\sum\limits_{i=0}^{N-1}\sum\limits_{j=0}^{N-1} f(i,j)e^{-i2\pi(\frac{ki}{N}+\frac{lj}{N})}$

F (k, l) = i = 0 \sum N - 1 j = 0 \sum N - 1 f (i, j) e^{- i 2 π (N k i + N l j)}

$e^{ix} = \cos{x} + i\sin {x}$

式中 $f$ 是空間域(spatial domain)值， $F$ 則是頻域(frequency domain)值。

轉換之後的頻域值是複數，因此，顯示傅立葉變換之後的結果需要使用實數影象(real image) 加虛數影象(complex image), 或者幅度影象(magitude image)加相點陣圖像(phase image)。在實際的影象處理過程中，僅僅使用了幅度影象，因為幅度影象包含了原影象的幾乎所有我們需要的幾何資訊。然而，如果你想通過修改幅度影象或者相點陣圖像的方法來間接修改原空間影象，你需要使用逆傅立葉變換得到修改後的空間影象，這樣你就必須同時保留幅度影象和相點陣圖像了。

在此示例中，我將展示如何計算以及顯示傅立葉變換後的幅度影象。由於數字影象的離散性，畫素值的取值範圍也是有限的。比如在一張灰度影象中，畫素灰度值一般在0到255之間。因此，我們這裡討論的也僅僅是離散傅立葉變換(DFT)。如果你需要得到影象中的幾何結構資訊，那你就要用到它了。

在頻域裡面，對於一幅影象，高頻部分代表了影象的細節、紋理資訊；低頻部分代表了影象的輪廓資訊。如果對一幅精細的影象使用低通濾波器，那麼濾波後的結果就剩下了輪廓了。這與訊號處理的基本思想是相通的。如果影象受到的噪聲恰好位於某個特定的“頻率”範圍內，則可以通過濾波器來恢復原來的影象。傅立葉變換在影象處理中可以做到：影象增強與影象去噪，影象分割之邊緣檢測，影象特徵提取，影象壓縮等等。

1.2 傅立葉變換過程一系列函式

1 . 將影象延展到最佳尺寸（提高執行速度）

getOptimalDFTSize():返回給定尺寸的傅立葉最優尺寸大小，提高執行速度（需要擴充影象，填充多少由此函式計算得到：被計算的數字序列長度vecsize為2的n次冪或者能夠分解成2,3,5的乘積）
copyMakeBorder() 邊界擴充函式

2 . 為傅立葉變換的結果(實部和虛部)分配儲存空間. 傅立葉變換的結果是複數，這就是說對於每個原影象值，結果是兩個影象值。此外，頻域值範圍遠遠超過空間值範圍，因此至少要將頻域儲存在 float 格式中。結果我們將輸入影象轉換成浮點型別，並多加一個額外通道來儲存複數部分
3 . 進行離散傅立葉變換. 支援影象原地計算 (輸入輸出為同一影象):

dtf() ：對一維或者二維浮點數陣列進行正向或反向傅立葉變換

4 . 將複數轉換為幅度複數包含實數部分(Re)和複數部分 (imaginary - Im)。離散傅立葉變換的結果是複數，對應的幅度可以表示為:
$M = \sqrt[2]{ {Re(DFT(I))}^2 + {Im(DFT(I))}^2}$

magnitude() 計算二維向量的幅值

5 . 對數尺度(logarithmic scale)縮放. 傅立葉變換的幅度值範圍大到不適合在螢幕上顯示。高值在螢幕上顯示為白點，而低值為黑點，高低值的變化無法有效分辨。為了在螢幕上凸顯出高低變化的連續性，我們可以用對數尺度來替換線性尺度:
$M_1 = \log{(1 + M)}$

log() 自然對數函式

6 . 剪下和重分佈幅度圖象限.將新新增的畫素剔除。為了方便顯示，我們也可以重新分佈幅度圖象限位置(注：將第五步得到的幅度圖從中間劃開得到四張1/4子影象，將每張子影象看成幅度圖的一個象限，重新分佈即將四個角點重疊到圖片中心)。這樣的話原點(0,0)就位移到影象中心。

7 . 歸一化. 將畫素值歸一到 float(0,1) 再乘以 255用於顯示。

normalize() 矩陣歸一化函式

cv2.getOptimalDFTSize(vecsize)
# vecsize： 傳入：image.shape[0]/image.shape[1]

cv2.copyMakeBorder(src,top,bottom,left,right,borderType,dst=None)
"""
	src：  影象
	top,bottom,left,right：  上/下/左/右邊擴充畫素（int）
	borderType： 邊界型別：
		BORDER_CONSTANT:   常量，增加的變數通通為value
		BORDER_REFLICATE:  直接用邊界的顏色填充,比如 : aaaaaa | abcdefgh | hhhhhhh
		BORDER_REFLECT:    映象：比如 : fedcba | abcdefgh | hgfedcb
		BORDER_REFLECT_101:倒映，和上面類似，但在倒映時，會把邊界空開：比如 : gfedcb | abcdefgh  |gfedcba
		BORDER_WRAP:       沒有規律的，比如: cdefgh | abcdefgh | abcdefg
"""
cv2.magnitude(InputArray x, InputArray y, OutPutArray magnitude)
"""
計算輸入矩陣x和y對應該的每個畫素平方求和後開根號儲存在輸出矩陣magnitude中。
"""

1.3 影象矯正處理流程

獲取影象的傅立葉變換圖
二值化
Hough直線檢測
計算傾斜角度
旋轉校正

import cv2
import numpy as np
import math

def fourier_demo():
    #1、灰度化讀取檔案，
    img = cv2.imread('english_rotation.jpg',0)

    #2、影象延擴
    h, w = img.shape[:2]
    new_h = cv2.getOptimalDFTSize(h)
    new_w = cv2.getOptimalDFTSize(w)
    right = new_w - w
    bottom = new_h - h
    nimg = cv2.copyMakeBorder(img, 0, bottom, 0, right, borderType=cv2.BORDER_CONSTANT, value=0)
    cv2.imshow('new image', nimg)

    #3、執行傅立葉變換，並過得頻域影象
    f = np.fft.fft2(nimg)
    fshift = np.fft.fftshift(f)
    magnitude = np.log(np.abs(fshift))


    #二值化
    magnitude_uint = magnitude.astype(np.uint8)
    ret, thresh = cv2.threshold(magnitude_uint, 11, 255, cv2.THRESH_BINARY)
    print(ret)

    cv2.imshow('thresh', thresh)
    print(thresh.dtype)
    #霍夫直線變換
    lines = cv2.HoughLinesP(thresh, 2, np.pi/180, 30, minLineLength=40, maxLineGap=100)
    print(len(lines))

    #建立一個新影象，標註直線
    lineimg = np.ones(nimg.shape,dtype=np.uint8)
    lineimg = lineimg * 255

    piThresh = np.pi/180
    pi2 = np.pi/2
    print(piThresh)

    for line in lines:
        x1, y1, x2, y2 = line[0]
        cv2.line(lineimg, (x1, y1), (x2, y2), (0, 255, 0), 2)
        if x2 - x1 == 0:
            continue
        else:
            theta = (y2 - y1) / (x2 - x1)
        if abs(theta) < piThresh or abs(theta - pi2) < piThresh:
            continue
        else:
            print(theta)

    angle = math.atan(theta)
    print(angle)
    angle = angle * (180 / np.pi)
    print(angle)
    angle = (angle - 90)/(w/h)
    print(angle)

    center = (w//2, h//2)
    M = cv2.getRotationMatrix2D(center, angle, 1.0)
    rotated = cv2.warpAffine(img, M, (w, h), flags=cv2.INTER_CUBIC, borderMode=cv2.BORDER_REPLICATE)
    cv2.imshow('line image', lineimg)
    cv2.imshow('rotated', rotated)

fourier_demo()
cv2.waitKey(0)
cv2.destroyAllWindows()

在這裡插入圖片描述

二、旋轉影象矯正

影象旋轉校正思路如下

讀入,灰度化
高斯模糊
二值化影象
閉開運算
獲取影象頂點
旋轉矯正

import cv2
import numpy as np

def Img_Outline(input_dir):
    original_img = cv2.imread(input_dir)
    gray_img = cv2.cvtColor(original_img, cv2.COLOR_BGR2GRAY)
    blurred = cv2.GaussianBlur(gray_img, (9, 9), 0)                     # 高斯模糊去噪（設定卷積核大小影響效果）
    _, RedThresh = cv2.threshold(blurred, 165, 255, cv2.THRESH_BINARY)  # 設定閾值165（閾值影響開閉運算效果）
    kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (5, 5))          # 定義矩形結構元素
    closed = cv2.morphologyEx(RedThresh, cv2.MORPH_CLOSE, kernel)       # 閉運算（連結塊）
    opened = cv2.morphologyEx(closed, cv2.MORPH_OPEN, kernel)           # 開運算（去噪點）
    return original_img, gray_img, RedThresh, closed, opened


def findContours_img(original_img, opened):
    image, contours, hierarchy = cv2.findContours(opened, cv2.RETR_LIST, cv2.CHAIN_APPROX_SIMPLE)
    c = sorted(contours, key=cv2.contourArea, reverse=True)[1]          # 計算最大輪廓的旋轉包圍盒
    rect = cv2.minAreaRect(c)
    angle = rect[2]
    print("angle",angle)
    box = np.int0(cv2.boxPoints(rect))
    draw_img = cv2.drawContours(original_img.copy(), [box], -1, (0, 0, 255), 3)
    rows, cols = original_img.shape[:2]
    M = cv2.getRotationMatrix2D((cols / 2, rows / 2), angle, 1)
    result_img = cv2.warpAffine(original_img, M, (cols, rows))
    return result_img,draw_img


if __name__ == "__main__":
    input_dir = "gongjiaoka.png"
    original_img, gray_img, RedThresh, closed, opened = Img_Outline(input_dir)
    result_img,draw_img = findContours_img(original_img,opened)

    cv2.imshow("original_img", original_img)
    cv2.imshow("gray_img", gray_img)
    cv2.imshow("RedThresh", RedThresh)
    cv2.imshow("Close", closed)
    cv2.imshow("Open", opened)
    cv2.imshow("draw_img", draw_img)
    cv2.imshow("result_img", result_img)
    cv2.waitKey(0)
    cv2.destroyAllWindows()

在這裡插入圖片描述

三、基於透視的影象矯正

3.1 直接變換

獲取影象四個頂點
形成變換矩陣
透視變換

import cv2
import numpy as np
import matplotlib.pyplot as plt
img = cv2.imread('original_img.jpg')
H_rows, W_cols= img.shape[:2]
print(H_rows, W_cols)

# 原圖中書本的四個角點(左上、右上、左下、右下),與變換後矩陣位置
pts1 = np.float32([[161, 80], [449, 12], [1, 430], [480, 394]])
pts2 = np.float32([[0, 0],[W_cols,0],[0, H_rows],[H_rows,W_cols],])

# 生成透視變換矩陣；進行透視變換
M = cv2.getPerspectiveTransform(pts1, pts2)
dst = cv2.warpPerspective(img, M, (500,470))

"""
註釋程式碼同效
# img[:, :, ::-1]是將BGR轉化為RGB
# plt.subplot(121), plt.imshow(img[:, :, ::-1]), plt.title('input')
# plt.subplot(122), plt.imshow(dst[:, :, ::-1]), plt.title('output')
# plt.show
"""

cv2.imshow("original_img",img)
cv2.imshow("result",dst)
cv2.waitKey(0)
cv2.destroyAllWindows()

在這裡插入圖片描述

3.2 自動獲取影象頂點變換

以灰度圖讀入
腐蝕膨脹，閉合等操作
二值化影象
獲取影象頂點
透視矯正

直接獲取影象輪廓矯正

該方法不具有普適性，只針對比較乾淨對比度高的影象，只提供一種思路

from imutils.perspective import four_point_transform
import imutils
import cv2

def Get_Outline(input_dir):
    image = cv2.imread(input_dir)
    gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
    blurred = cv2.GaussianBlur(gray, (5,5),0)
    edged = cv2.Canny(blurred,75,200)
    return image,gray,edged

def Get_cnt(edged):
    cnts = cv2.findContours(edged.copy(), cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)
    cnts = cnts[0] if  imutils.is_cv2()  else   cnts[1]
    docCnt =None

    if len(cnts) > 0:
        cnts =sorted(cnts,key=cv2.contourArea,reverse=True)
        for c in cnts:
            peri = cv2.arcLength(c,True)                   # 輪廓按大小降序排序
            approx = cv2.approxPolyDP(c,0.02 * peri,True)  # 獲取近似的輪廓
            if len(approx) ==4:                            # 近似輪廓有四個頂點
                docCnt = approx
                break
    return docCnt

if __name__=="__main__":
    input_dir = "gongjiaoka.png"
    image,gray,edged = Get_Outline(input_dir)
    docCnt = Get_cnt(edged)
    result_img = four_point_transform(image, docCnt.reshape(4,2)) # 對原始影象進行四點透視變換
    cv2.imshow("original", image)
    cv2.imshow("gray", gray)
    cv2.imshow("edged", edged)
    cv2.imshow("result_img", result_img)

    cv2.waitKey(0)
    cv2.destroyAllWindows()

在這裡插入圖片描述

獲取影象輪廓頂點矯正

import cv2
import math
import numpy as np

def Img_Outline(input_dir):
    original_img = cv2.imread(input_dir)
    gray_img = cv2.cvtColor(original_img, cv2.COLOR_BGR2GRAY)
    blurred = cv2.GaussianBlur(gray_img, (9, 9), 0)                     # 高斯模糊去噪（設定卷積核大小影響效果）
    _, RedThresh = cv2.threshold(blurred, 165, 255, cv2.THRESH_BINARY)  # 設定閾值165（閾值影響開閉運算效果）
    kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (5, 5))          # 定義矩形結構元素
    closed = cv2.morphologyEx(RedThresh, cv2.MORPH_CLOSE, kernel)       # 閉運算（連結塊）
    opened = cv2.morphologyEx(closed, cv2.MORPH_OPEN, kernel)           # 開運算（去噪點）
    return original_img, gray_img, RedThresh, closed, opened


def findContours_img(original_img, opened):
    image, contours, hierarchy = cv2.findContours(opened, cv2.RETR_LIST, cv2.CHAIN_APPROX_SIMPLE)
    c = sorted(contours, key=cv2.contourArea, reverse=True)[1]   # 計算最大輪廓的旋轉包圍盒
    rect = cv2.minAreaRect(c)                                    # 獲取包圍盒（中心點，寬高，旋轉角度）
    box = np.int0(cv2.boxPoints(rect))                           # box
    draw_img = cv2.drawContours(original_img.copy(), [box], -1, (0, 0, 255), 3)

    print("box[0]:", box[0])
    print("box[1]:", box[1])
    print("box[2]:", box[2])
    print("box[3]:", box[3])
    return box,draw_img

d

 
 
              
           
              
              
            
            相關推薦
			   
            
            
            
 

    

    
    OpenCV—python 影象矯正（基於傅立葉變換—基於透視變換）
      
							
							
							
影象校正執行環境 Anaconda| pycharm/jupyter notebook
你需要安裝如下庫
pip install numpy
pip install matplotlib
pip install opencv-python

一、基於傅立葉變換 

  
 

    

    
    0022-在OpenCV環境下做影象或矩陣的傅立葉變換
       
 
 傅立葉變換的概念在《高等數學》、《訊號與系統》、《數字訊號處理》中都有詳細的原理說明，網上也有一大堆文章解釋其原理。這裡我就不多說了，總之它是把訊號變換到三角函式系裡，實際上是域的變換，至於變換有什麼好處，其實就是從另一個角度觀察同一個訊號。對影象的傅立葉變換實際上是一個二維傅立葉變換。OpenCV 

  
 

    

    
    OpenCV—python 影象修復（去除水印）
       
 
  
  
 基於OpenCV的兩種去水印方案(不具有普適性) 可以使用深度學習方法來去修復影象 
 一、基於 inpaint 方法（網上的方法，處理質量較低） 
 演算法理論：基於Telea在2004年提出的基於快速行進的修復演算法（FMM演算法），先處理待修復區域邊緣上的畫素點，然後層層向內推進， 

  
 

    

    
    OpenCV—python影象標註（批量檔案重新命名）
      
								
								            
							
							
							
"""
批量修改檔名：我這裡用於對圖片資料集標註
注意：輸入目錄與輸出目錄相同才行
"""
import os


input_dir = "../SandBox/label_pictures"
ou 

  
 

    

    
    Python中二維快速傅立葉變換----基於numpy庫
      
                
二維傅立葉變換在影象處理中經常用到，為了更好理解python中的fft2。這裡我們生成了二維正弦條紋，然後進行快速傅立葉變換。

#Python版本：Python3.5
#用到的庫：numpy，matploylib
#作者：James_Ray_Murphy
# -*- co 

  
 

    

    
    OpenCV基於傅立葉變換以及霍夫直線檢測的旋轉文字校正
      
                
最近剛好結束了霍夫三部曲以及離散傅立葉變換的總結，剛好了解到它們兩個的結合可以實現一個很有意思的功能
旋轉文字影象的校正，於是參考了幾篇部落格，記錄下來。

主要參考部落格：
標準霍夫直線檢測 以及影象的傅立葉變換

關於傅立葉變換的原理請看我的上一篇部落格，也是為這篇文章 

  
 

    

    
    OpenCV-Python 影象處理（二）：影象的讀取、顯示與儲存
      
							
							
							說明：


本系列主要是學習OpenCV-Python文件的個人筆記。
很少有理論的敘述，都是函式名、引數描述、作用、應用場景、程式碼、效果圖。簡單明瞭，即學即用。




目標


學會讀取、顯示、儲存單張影象
對應的函式分佈為：cv2.imread() ,  

  
 

    

    
    FFT（快速傅立葉變換）
      - 概念引入 
 　　- 點值表示 　　　　對於一個$n - 1$次多項式$A(x)$，可以通過確定$n$個點與值（即$x$和$y$）來表示這唯一的$A(x)$ 
 　　- 複數 　　　　對於一元二次方程 　　　　$$x^2 + 1 = 0$$ 　　　　在實數範圍內無解，那麼我們將實數範圍擴充，就得到了複數， 

  
 

    

    
    數字影象處理：11.傅立葉變換
      
                

Fourier變換

對於二維訊號，二維Fourier變換定義為：



二維離散傅立葉變換為：





圖象的傅立葉變換與一維訊號的傅立葉變換變換一樣，有快速演算法，具體參見教材。有關傅立葉變換的快速演算法的程式不難找到。實際上，現在有實現傅立葉變換的晶片，可以實時實 

  
 

    

    
    如何用matlab計算影象的二維傅立葉變換
      
							
							
							關於二維DFT的原理的話，可以參考清華出版的《影象工程 上冊》，所以此處贅述二維DFT的原理，如果不懂的話，那效果影象也不會理解為什麼。 
所以我在程式碼中直接呼叫庫fft2(X);

% by keyhero
% img_fft.m
clear;
lena=i 

  
 

    

    
    基於傅立葉變換和PyQt4開發一個簡單的頻率計數器
      
小學期的《訊號與系統》課，要求寫一個頻率計數器，下面是我個人理解的頻率計數
傅立葉變換的程式碼：
# coding=utf-8
import numpy as np
from scipy.io import wavfile
import matplotlib.mlab as mlab
import matp 

  
 

    

    
    影象處理中的傅立葉變換
      
								
								            
						
                






傅立葉變換在影象處理中有非常重要的作用。因為不僅傅立葉分析涉及影象處理很多方面，傅立 葉改進演算法，比如離散餘弦變換，gabor與小波在影象處理中也有重要的分量。傅立葉變換在 

  
 

    

    
    理解離散傅立葉變換（一. 傅立葉變換的由來）
      
                理解離散傅立葉變換（一）
                     ------傅立葉變換的由來
關於傅立葉變換，無論是書本還是在網上可以很容易找到關於傅立葉變換的描述，但是大都是些故弄玄虛的文章，太過抽象，盡是一些讓人看了就望而生畏的公式的羅列，讓人很難能夠從感性上得到理解 

  
 

    

    
    DFT（離散傅立葉變換）和DCT（離散餘弦變換）有何區別和聯絡
      
								
								            
						
                首先，在理解這3個變數之前，你要知道DTFT：
DTFT是離散時間傅立葉變換，用來表達連續的訊號的頻譜。
然後理解DFT：
DFT是離散傅立葉變換，針對的是離散的訊號和頻譜。DFT是DTFT變化而來，其 

  
 

    

    
    opencv從零開始——4. 離散傅立葉變換的體驗
      
                
opencv的強大之處，從這裡開始，越來越能和訊號處理接軌了，贊一個。

程式碼:
#include <opencv2/core/core.hpp>
#include <opencv2/imgproc/imgproc.hpp>
#include &l 

  
 

    

    
    Python下opencv使用筆記（十）（影象頻域濾波與傅立葉變換）
      
							
							
							前面曾經介紹過空間域濾波，空間域濾波就是用各種模板直接與影象進行卷積運算，實現對影象的處理，這種方法直接對影象空間操作，操作簡單，所以也是空間域濾波。

頻域濾波說到底最終可能是和空間域濾波實現相同的功能，比如實現影象的輪廓提取，在空間域濾波中我們使用一個拉普拉 

  
 

    

    
    Python下opencv使用筆記（影象頻域濾波與傅立葉變換）
      
                本文轉載自  https://blog.csdn.net/on2way/article/details/46981825首先謝謝原創博主了，這篇文章對我幫助很大，記錄下方便再次閱讀。前面曾經介紹過空間域濾波，空間域濾波就是用各種模板直接與影象進行卷積運算，實現對影象的處理，這 

  
 

    

    
    基於python的快速傅立葉變換FFT（二）
      基於python的快速傅立葉變換FFT（二）本文在上一篇部落格的基礎上進一步探究正弦函式及其FFT變換。 
知識點  FFT變換，其實就是快速離散傅立葉變換，傅立葉變換是數字訊號處理領域一種很重要的演算法。要知道傅立葉變換演算法的意義，首先要了解傅立葉原理的意義。傅立葉原理表明：任何連續測量的時序或訊號，都可 

  
 

    

    
    OpenCV影象的傅立葉變換-（補番）
      
								
								            
						
                
前兩天剛剛寫完OpenCV中關於影象的離散傅立葉變換的程式碼，旨在解釋了程式碼中出現的諸多困難。而忽視了傅立葉本身的原理部分
實在是罪過。

關於傅立葉變換，網上有一個大名鼎鼎的看了還不懂就來掐死我的 

  
 

    

    
    opencv學習（十五）之影象傅立葉變換dft
      
							
							
							在學習訊號與系統或通訊原理等課程裡面可能對傅立葉變換有了一定的瞭解。我們知道傅立葉變換是把一個訊號從時域變換到其對應的頻域進行分析。如果有小夥伴還對傅立葉變換處於很迷糊的狀態，請戳這裡，非常通俗易懂。而在影象處理中也有傅立葉分析的概念，我這裡給出在其官方指導檔案