Image Processing 必備(一)： Imgaug之匯入和增強影象

阿新 • • 發佈：2020-09-17

Date： 2020-08-27

官方教程：https://nbviewer.jupyter.org/github/aleju/imgaug-doc/blob/master/notebooks/A01%20-%20Load%20and%20Augment%20an%20Image.ipynb

在機器視覺領域，想將深度學習應用於實際工程專案，並最終落地，會遇到很多問題：光照、遮擋等。而採集到的資料通常難以滿足各種現實環境，需要進行資料增強操作。 imgaug是一個基於OpenCV的更高階的API，包含很多整合好的影象增強的方法。

安裝方式：

conda config --add channels conda-forge
conda install imgaug

匯入和增強影象

輸入的影象需要符合以下兩種規格之一：

可以是4D的numpy陣列，形狀需要滿足“NHWC”原則，即(N, height, width, channels)
也可以是一個由3D numpy陣列組成的列表list，3D numpy陣列的形狀需要滿足(height, width, channels) 對於灰度影象，其形狀必須滿足(height, width, 1)

並且所有的影象必須是numpy陣列的uint8格式，數值需要是在0-255之間。

uint8是所有API測試最徹底的資料型別，其餘的格式例如float32，需要檢視imgaug API的文件是否支援。

影象匯入函式

imgaug只是進行影象增強的庫函式，其中並沒有相關影象的讀取和輸出的函式。因此，需要使用其他的庫進行影象的匯入：

imageio
cv2.imread()

另外，值得注意的是，cv2.imread()函式返回的影象顏色空間是BGR，而不是RGB，因此，需要手動改變其通道組成： cv2.imread(path)[:, :, ::-1]

因此，提倡使用imageio進行影象的匯入。

匯入並增強一張圖片

imagio.imread("/path/to/the/file.jpg")

windows: imagio.imread("C:\path\to\the\file.jpg") 返回的是一個uint8格式的numpy陣列，形狀為HWC--RGB空間。

1 import imageio
2 import imgaug as ia
3 %matplotlib inline    
4 
5 image = imageio.imread("./pick1.jpg")   # Image格式
6 
7 print("Original")
8 ia.imshow(image)

Original

imgaug沒有讀影象的語句，但是有顯示影象的語句。

 1 # 增強
 2 from imgaug import augmenters as iaa
 3 
 4 ia.seed(4)
 5 
 6 rotate = iaa.Affine(rotate=(-25, 25))  # 旋轉
 7 image_aug = rotate(image=image)   # 處理後是numpy陣列格式
 8 
 9 print("Augmented:")
10 ia.imshow(image_aug)

Augmented:

可以看出，影象發生了[-25, 25]之間角度的旋轉。

在使用imgaug中包含的資料增強功能時，需要先通過傳參生成某種資料增強的例項，再通過例項對影象進行處理。

嘗試一下ia.seed(4),觀察是否可以讓旋轉的角度相同。

1 ia.seed(4)
2 image_aug = rotate(image=image)
3 
4 print("Re-Augmented:")
5 ia.imshow(image_aug)

Re-Augmented:

彷彿每次的結果都是一樣的。

再試試更改一下數值。

1 ia.seed(5)
2 image_aug = rotate(image=image)
3 
4 print("Augmented:")
5 ia.imshow(image_aug)

Augmented:

結果發生了隨機性的變化。

增強一個batch數量的影象

實際使用中，我們通常需要處理更多份的影象資料，而不是一張。此時，可以將圖形資料按照NHWC的形式或者由列表組成的HWC的形式對批量的影象進行處理。

如下述程式碼，將一份影象儲存多次形成一個batch數量的影象。經過處理後，使用np.hstack()對處理後的影象進行顯示。

1 import numpy as np
2 
3 images = [image, image, image, image, image]
4 images_aug = rotate(images=images)
5 
6 print("Augmented batch：")
7 ia.imshow(np.hstack(images_aug))

Augmented batch：

同時使用多種增強技術

之前使用的方法僅僅在一張影象或者多張影象上使用了一種Affine的增強技術，在實際深度學習模型訓練中，往往需要同時使用多種影象增強技術，從而讓模型適應變化的外界條件。

在使用多種影象增強技術時，可以使用imgaug中類似keras和Pytorch中Sequential方法，將多種增強技術拼接在一起。如下所示：

1 seq = iaa.Sequential([iaa.Affine(rotate=(-25, 25)), 
2                      iaa.AdditiveGaussianNoise(scale=(10, 60)),
3                      iaa.Crop(percent=(0, 0.2))
4                      ])
5 
6 images_aug = seq(images=images)
7 
8 print("Augmented:")
9 ia.imshow(np.hstack(images_aug))

Augmented:

Crop()預設會保持輸入影象的尺寸，如果將keep_size=False,輸入輸出的尺寸將可能會發生變化。即該引數表示是否保持影象尺寸一致。

下述程式碼在Sequential中設定了random_order=True，並使用單張圖片重複8次得到的結果。該引數表示是否啟用隨機順序增強。

1 seq = iaa.Sequential([iaa.Affine(rotate=(-25, 25)),
2                      iaa.AdditiveGaussianNoise(scale=(30, 90)),
3                      iaa.Crop(percent=(0, 0.4))], random_order=True)
4 
5 images_aug = [seq(image=image) for _ in range(8)]
6 
7 print("Augmented:")
8 ia.imshow(ia.draw_grid(images_aug, cols=4, rows=2))

Augmented:

增強影象（不同尺寸）

在收集訓練集時，訓練集的尺寸往往難以做到統一尺寸。之前的示例中也總是使用的相同尺寸的影象。下述程式碼介紹了不同尺寸影象的處理和展示。

對於不同尺寸的影象，肯定不能使用numpy陣列組成NHWC的形式，只能將不同尺寸的影象儲存於列表中。

 1 seq = iaa.Sequential([
 2     iaa.CropAndPad(percent=(-0.2, 0.2), pad_mode="edge"),  # crop and pad images
 3     iaa.AddToHueAndSaturation((-60, 60)),  # change their color
 4     iaa.ElasticTransformation(alpha=90, sigma=9),  # water-like effect
 5     iaa.Cutout()  # replace one squared area within the image by a constant intensity value
 6 ], random_order=True)
 7 
 8 # load images with different sizes
 9 images_different_sizes = [
10     imageio.imread("./pick1.jpg"),
11     imageio.imread("./flower.jpg"),
12     imageio.imread("./samoye.jpg")
13 ]
14 
15 # augment them as one batch
16 images_aug = seq(images=images_different_sizes)
17 
18 # visualize the results
19 print("Image 0 (input shape: %s, output shape: %s)" % (images_different_sizes[0].shape, images_aug[0].shape))
20 ia.imshow(np.hstack([images_different_sizes[0], images_aug[0]]))
21 
22 print("Image 1 (input shape: %s, output shape: %s)" % (images_different_sizes[1].shape, images_aug[1].shape))
23 ia.imshow(np.hstack([images_different_sizes[1], images_aug[1]]))
24 
25 print("Image 2 (input shape: %s, output shape: %s)" % (images_different_sizes[2].shape, images_aug[2].shape))
26 ia.imshow(np.hstack([images_different_sizes[2], images_aug[2]]))

Image 0 (input shape: (313, 500, 3), output shape: (313, 500, 3))

Image 1 (input shape: (621, 500, 3), output shape: (621, 500, 3))

Image 2 (input shape: (406, 500, 3), output shape: (406, 500, 3))

整理總結

本節教程主要包含以下幾個方面的內容：

在利用imgaug影象增強的方法中，如何讀取和顯示影象； imageio.imread() imgaug.imshow() 不推薦使用opencv，因為其讀入影象預設為BGR模式；
單/多張影象如何利用一/多種影象增強方法；
如何將不同尺寸的影象組合在一起進行影象增強。

本節教程中包含的影象增強的方法：

iaa.Affine(rotate=(-25, 25))
- 實現仿射變換，本節僅利用了其中的旋轉操作；
iaa.AdditiveGaussianNoise(scale=(10, 60))
- 新增高斯白噪聲
iaa.Crop(percent=(0, 0.2))
- 實現裁剪，引數為裁剪比例
iaa.CropAndPad(percent=(-0.2, 0.2), pad_mode="edge")
- 實現裁剪和邊緣補充
iaa.AddToHueAndSaturation((-60, 60))
- Hue空間調整飽和度
iaa.ElasticTransformation(alpha=90, sigma=9)
- 隨機彈性變換（仿射變換的一種）
iaa.Cutout()
- 影象增強之 cutout 生成遮擋塊

* CropAndPad使用效果：*

 1 import imageio
 2 import imgaug as ia
 3 from imgaug import augmenters as iaa
 4 import numpy as np
 5 %matplotlib inline    
 6 
 7 image = imageio.imread("./pick1.jpg")
 8 
 9 crop = iaa.CropAndPad(percent=(-0.2, 0.2), pad_mode="edge")
10 img_aug = crop(image=image)
11 
12 print("Original")
13 ia.imshow(np.hstack([image, img_aug]))
14 #ia.imshow(image) 
15 #ia.imshow(img_aug)

Original

* AddToHueAndSaturation使用效果 *

 1 import imageio
 2 import imgaug as ia
 3 from imgaug import augmenters as iaa
 4 %matplotlib inline    
 5 
 6 image = imageio.imread("./pick1.jpg")
 7 
 8 hue = iaa.AddToHueAndSaturation((-60, 60))
 9 img_aug = hue(image=image)
10 
11 print("Original")
12 ia.imshow(np.hstack([image, img_aug]))
13 #ia.imshow(image) 
14 #ia.imshow(img_aug)

Original

* ElasticTransformation使用效果 *

 1 import imageio
 2 import imgaug as ia
 3 from imgaug import augmenters as iaa
 4 %matplotlib inline    
 5 
 6 image = imageio.imread("./pick1.jpg")
 7 
 8 trans = iaa.ElasticTransformation(alpha=90, sigma=9)
 9 img_aug = trans(image=image)
10 
11 print("Original")
12 ia.imshow(np.hstack([image, img_aug]))
13 #ia.imshow(image) 
14 #ia.imshow(img_aug)

Original

Image Processing 必備(一)： Imgaug之匯入和增強影象

Date： 2020-08-27 官方教程：https://nbviewer.jupyter.org/github/aleju/imgaug-doc/blob/master/notebooks/A01%20-%20Load%20and%20Augment%20an%20Image.ipynb

Image Processing 必備(三)：Imgaug 之呼叫多核CPU

Date： 2020-09-02 官方教程：https://nbviewer.jupyter.org/github/aleju/imgaug-doc/blob/master/notebooks/A03%20-%20Multicore%20Augmentation.ipynb

Restframework從入門到精通(一)：Restframework之入門

官方檔案（英文）： www.django-rest-framework.org/ 官方檔案（翻譯）： www.sinodocs.cn/

Quartz.Net系列（九）：Trigger之CronScheduleBuilder和Cron表示式詳解

1.使用 var scheduler =await StdSchedulerFactory.GetDefaultScheduler(); await scheduler.Start(); var job = JobBuilder.Create<FirstJob>().Build();

Python筆記：Numpy之索引和切片

一維陣列 arr = np.arange(10) #獲取陣列的第5個元素，從0開始 arr[5] #獲取陣列的第5個至第8個（不包含第8個元素）元素

十一、Kubernetes之ConfigMap和Secret

一、容器化應用配置應用程式是可執行程式檔案，它含有指令列表，CPU通過執行這些指令完成程式碼執行。例如，Linux工程師最常用的命令之一cat對應於/usr/bin/cat程式檔案，該檔案含有按特定目的組織的機器指令列表，

Dynamics CRM 2015/2016新特性之二十一：使用Web API查詢記錄

關注本人微信和易信公眾號：微軟動態CRM專家羅勇，回覆204或者20160310可方便獲取本文，同時可以在第一間得到我釋出的最新的博文資訊，follow me！

drf之序列化元件(一)：Serializer

序列化元件：Serializer、ModelSerializer、ListModelSerializer Serializer 偏底層ModelSerializer 重點ListModelSerializer 輔助群改

Alink漫談(十一) ：線性迴歸之 L-BFGS優化

Alink漫談(十一) ：線性迴歸之 L-BFGS優化目錄 Alink漫談(十一) ：線性迴歸之 L-BFGS優化

4_面向物件-上之面向物件的特徵一：封裝性

面向物件的特徵一：封裝與隱藏1.為什麼要引入封裝性？我們程式設計追求“高內聚，低耦合”。高內聚：類的內部資料操作細節自己完成，不允許外部干涉；低耦合：僅對外暴露少量的方法用於使用。

面向物件-上之面向物件的特徵一：封裝性

大資料實戰（八十七）：電商數倉（七十一）安全之Sentry許可權管理

1 Sentry概述 cdh版本的hadoop在對資料安全上的處理通常採用Kerberos+Sentry的結構。

《SeleniumBasic 3.141.0.0 - 在VBA中操作瀏覽器》系列文章之十一：視窗控制代碼與視窗切換

一個瀏覽器可能開啟多個網頁視窗。Selenium中每個視窗都有一個控制代碼，控制代碼是一個文字字串。Selenium在任何時刻只能操作和讀寫1個視窗，要操作其他視窗必須用SwitchTo切換進去。

Nintendo Switch和《塞爾達傳說：曠野之息》絕對是一種樂趣

I bought a Nintendo Switch last week with my allowance and I\'m utterly smitten. It\'s brilliant. It\'s absolutely brilliant.

Go 語言設計哲學之十一：深入理解切片(slice)

slice是 Go 語言在陣列之上提供的一個重要的抽象資料型別。在絕大多數需要使用陣列的場合，切片都實現了完美替代。並且和陣列相比，切片提供了更通用、功能更強大且便捷的資料序列訪問介面。

Node.js實踐一：node.js安裝及環境配置之Windows篇

Node.js實踐一：node.js安裝及環境配置之Windows篇一、Node.js簡介簡單的說 Node.js 就是執行在服務端的 JavaScript。

vue一：vue基礎之vue初體驗

一、Vue介紹Vue是一套用於構建使用者介面的漸進式框架。與其它大型框架不同的是，Vue 被設計為可以自底向上逐層應用。Vue 的核心庫只關注檢視層，不僅易於上手，還便於與第三方庫或既有專案整合。另一方面，當與現代

selenium自動化測試之十一：Selenium Grid介紹

技術標籤：軟體測試軟體測試本篇簡單介紹selenium家族的另外一個成員---Selnium Grid。它的主要作用是用於自動化測試的分散式執行。

藍橋杯練習題(一)：Python組之入門訓練題

技術標籤：藍橋杯python演算法文章目錄一:實現Fibonacci數列二:圓的面積三:序列求和四:A+B問題

一加智慧手錶設計圖專利曝光：分標準版和運動版，採用圓形錶盤 - IT之家

2月18日訊息外媒 techniknews 報道，在拖延了多年之後，OnePlus（一加科技）終於洩露了它將在 2021 年初推出首款智慧手錶的訊息，雖然該公司並沒有分享智慧手錶具體上市時間的任何細節，但有傳言稱 OnePlus Watch 將

Image Processing 必備(一)： Imgaug之匯入和增強影象

匯入和增強影象

影象匯入函式

匯入並增強一張圖片

增強一個batch數量的影象

同時使用多種增強技術

增強影象（不同尺寸）

整理總結

相關推薦