1. 程式人生 > 程式設計 >python 實現從高分辨影象上摳取影象塊

python 實現從高分辨影象上摳取影象塊

我就廢話不多說了,直接上程式碼吧!

#coding=utf-8
import cv2
import numpy as np
import os
# 程式實現功能:
# 根據patch在高解析度影象上的索引值,crop出對應區域的影象
# 並驗證程式的正確性
'''
對於當前輸入的3328*3328的高解析度特徵圖,首先resize到640*640
然後根據當前的patch檔名(包含了patch在高解析度影象上的行索引和列索引)
這個索引值是將高解析度影象劃分成多個沒有overlap的256*256的影象塊之後的行索引和列索引
行索引range(1,11),列索引range(0,12)
3328=13*256
'''

index='IDRiD_03_3_12.jpg'
raw_img_path='F:\\2\\eye_seg_con\\eye_seg\\joint_data\\raw_image\\train'
patches_path='F:\\2\\eye_seg_con\\eye_seg\\joint_data\\patches\\train'
true_patches=cv2.imread(os.path.join(patches_path,index))[:,:,::-1]

print(os.path.join(raw_img_path,index.split('_')[0]+index.split('_')[1]+'.jpg'))

hr_img=cv2.imread(os.path.join(raw_img_path,index.split('_')[0]+'_'+index.split('_')[1]+'.jpg'))[:,::-1]
hr_img=cv2.resize(hr_img,(640,640))# hr_img RGB

'''
640/13=49.23076923076923 記作unit
將640*640的區域平均劃分成13*13份,每一份的畫素點大小是unit*unit
然後將對應位置(取整)的影象塊摳出來,resize成256*256大小
'''
unit=640/13
patch_row_num = int(index[:-4].split('_')[2])
patch_col_num = int(index[:-4].split('_')[3])

row_start=round(patch_row_num*unit)
row_end=round((patch_row_num+1)*unit)
col_start=round(patch_col_num*unit)
col_end=round((patch_col_num+1)*unit)

my_patch=hr_img[row_start:row_end,col_start:col_end,:]
my_patch=cv2.resize(my_patch,(256,256))
my_patch=np.array(my_patch,dtype=np.uint8)

cv2.imshow('true_patches',true_patches[:,::-1])
cv2.waitKey(0)

cv2.imshow('my_patch',my_patch[:,::-1])
cv2.waitKey(0)

# # hr_img RGB
#
# # cv2.imshow('1',hr_img[:,::-1])
# # cv2.waitKey(0)
#
# hr_img2=cv2.imread(os.path.join(raw_img_path,index.split('_')[0]+'_'+index.split('_')[1]+'.jpg'))
# hr_img2=cv2.resize(hr_img2,640))[:,::-1]# hr_img2 RGB
# # cv2.imshow('2',hr_img2[:,::-1])
# # cv2.waitKey(0)
#
# print(np.sum(hr_img2-hr_img))# 0

# 結論:
# 對於cv2.resize函式而言,無論是先進行BGR的通道轉換,再resize,還是先進行resize,再進行BGR通道轉換
# 所得到的影象是相同的,即resize和通道維度的變換可交換順序
# 實際上resize只發生在spatial dimension,而通道變換髮生在channels dimension,所以空間維度上的插值變換
# 是在每個通道維度上獨立進行的。
# 另外,對於計算機而言,所讀取到的彩色影象就是H*W*3的矩陣而已,它本身是沒有辦法區分究竟是BGR格式還是RGB格式的

以上這篇python 實現從高分辨影象上摳取影象塊就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支援我們。