tensorflow資料增強

阿新 • • 發佈：2019-02-08

相信大家都聽說過資料增強（Data Augmentation）,這是在做神經網路時非常極其重要的trick, 因為資料是寶貴的，稀有的，通過資料增強我們能讓我們的資料量迅速增大，並且能使訓練的模型具有一定抗噪能力。這篇文章主要探討一下 tensorflow 關於資料增強的API.

先讀取圖片資料, 並輸出我們的圖片資訊

import numpy as np
from PIL import Image

# #***************案例1*numpy讀取圖片資料**********************#
img = Image.open("5.jpg", 'r')
img.show()
a = np.asarray(img,  
dtype=float)
print(img.mode)
# output RGB (1601, 1002)

沒錯，就是一個漂亮的小姐姐，hh

再先來個題外話，叫做圖片資料的編碼， tensorflow能支援的格式不多， jpg，ｐｎｇ，ｇｉｆ，ｂｍｐ這些常用格式倒是可以的，如果你的圖片格式是很特殊的格式的話，　恐怕你就需要用其他處理方式先進行預處理了，　比如常用的醫學影象　．ｎｉｉ格式　你就需要用ｎｉｂａｂｌｅ，　一些ｔｉｆｆ，ＤＩＣＯＭ，等你可能可以用　ＰＩＬ，ｃｖ２，ｏｐｅｎｓｌｉｄｅ　，　ｌｉｂｖｉｐｓ等等。

# ***# 讀取圖片，進行圖片解碼
# 讀取影象的原始資料 返回值： 
<class 'bytes'>
# 也就是讀取圖片，將其轉換成一串二進位制串
image_raw_data = tf.gfile.FastGFile("5.jpg", 'rb').read()

with tf.Session() as sess:
    # img_data--> <class 'tensorflow.python.framework.ops.Tensor'>
img_data = tf.image.decode_jpeg(image_raw_data)

    print(img_data.eval())  # RGB模式輸出一個三維陣列
 
# 用py_plot展示圖片
plt.imshow(img_data.eval())
    plt.show()
    # 將資料型別轉化為uint8
img_data = tf.image.convert_image_dtype(img_data, dtype=tf.uint8)

# ***# 讀取資料，進行圖片編碼
encoded_image = tf.image.encode_png(img_data)
    with tf.gfile.GFile("6.png", 'wb') as f:
        f.write(encoded_image.eval())

接下來我們就一個個來看看，首先讀取圖片資料，並轉化成ｆｌｏａｔ３２

image_raw_data = tf.gfile.FastGFile("5.jpg", 'rb').read()  # 500x500
with tf.Session() as sess:
    # img_data--> <class 'tensorflow.python.framework.ops.Tensor'>
img_data = tf.image.decode_jpeg(image_raw_data)
    img_data = tf.image.convert_image_dtype(img_data, dtype=tf.float32)

print(type(img_data)　＃　class 'tensorflow.python.framework.ops.Tensor'>

（一）調整圖片大小ｒｅｓｉｚｅ

一般來說網路上的影象大小不確定，但是神經網路的輸入節點的個數是固定的。所以與處理是需要統一圖片大小

    調整大小方法有以下幾個：
    # 1、雙線性插值法
    # 2、最近鄰居法
    # 3、雙三次插值法
    # 4、面積插值法

resize_img = tf.image.resize_images(img_data, [300, 300], method=0)  # 一共提供了四種方法
＃　<class 'tensorflow.python.framework.ops.Tensor'>
plt.imshow(resize_img.eval())
plt.show()

＃　０代表ResizeMethod.BILINEAR，依次類推

輸出結果：

（二）圖片剪下填充

# 放大圖片就自動周圍填充黑色；縮小圖片就自動從圖片中間剪下
resize_img = tf.image.resize_image_with_crop_or_pad(img_data, 600, 600)
plt.imshow(resize_img.eval())
plt.show()

輸出結果：

（三）圖片按比例大小縮小圖片（也是一種剪下，類似上一種方式）

central_cropped = tf.image.central_crop(img_data, 0.5)　　
plt.imshow(central_cropped.eval())
plt.show()

輸出結果：

（四）方框剪下

# # bounding_box_crop
# # similar func:tf.image.pad_to_bounding_box
# 圖片（0， 0）位置在左上角， （50,50）指height，width在圖片左上角的偏移量
resize_img = tf.image.crop_to_bounding_box(img_data, 50, 50, 300, 300)

（五）翻轉以及隨機翻轉

# #影象翻轉# 資料增強
# 上下翻轉、左右翻轉、對角線翻轉
# tf.image.transpose_image(img_data)
    # tf.image.flip_left_right(img_data)
flip_img = tf.image.flip_up_down(img_data)
    plt.imshow(flip_img.eval())
    plt.show()
    # 隨機翻轉 推薦應用這個方法
# 隨機上下左右、亮度、對比度、色相、飽和度
# tf.image.random_flip_up_down(img_data)
    # tf.image.random_brightness()
    # tf.image.random_contrast()
    # tf.image.random_hue()
    # tf.image.random_saturation()
rand_flip_img = tf.image.random_flip_left_right(img_data, seed=1)
    plt.imshow(rand_flip_img.eval())
    plt.show()

（六）影象色彩調整（五　中包含了一些色彩調整函式，不過是隨機的就直接列在上面了，方便大家總結理解）

# 調整圖片亮度、對比度、gamma、色相、飽和度
# tf.image.adjust_contrast()
# tf.image.adjust_gamma()
# tf.image.adjust_hue()
# tf.image.adjust_saturation()
adjust_img = tf.image.adjust_brightness(img_data, -0.5)
# 將圖片亮度變為均值為0，方差為1
adjust_img = tf.image.per_image_standardization(img_data)
print(img_data.eval())

(七)影象標註

# # tf.image.draw_bounding_boxes函式的輸入是一個batch的資料，也就是
#   多張影象組成的四維矩陣
#   第一個輸入引數img_data中資料型別應該是實數,前面最初已經轉換成了tf.float32
batched = tf.expand_dims(img_data, 0)
#  [0.2, 0.3, 0.5, 0.8]給出的是影象中的相對位置 [y_min, x_min, y_max, x_max]
boxes = tf.constant([[[0.2, 0.3, 0.48, 0.65]]])
res = tf.image.draw_bounding_boxes(batched, boxes, name='bounding_box')
plt.subplot(121), plt.imshow(img_data.eval()), plt.title('original')
plt.subplot(122), plt.imshow(np.asarray(res.eval())[0]), plt.title('result')
# plt.imsave(fname="save.jpg", arr=np.asarray(res.eval())[0])  # 儲存圖片
plt.show()

上面圖片做標註不是很明顯，換張女神圖片來碼程式碼~

（八）擷取標記部分

# 隨機擷取影象上有資訊含量的部分，也可以提高模型健壯性
# 此函式為影象生成單個隨機變形的邊界框。函式輸出的是可用於裁剪原始影象的單個邊框。
# 返回值為3個張量：begin，size和 bboxes。前2個張量用於 tf.slice 剪裁影象。
# 後者可以用於 tf.image.draw_bounding_boxes 函式來畫出邊界框。
boxes = tf.constant([[[0.2, 0.3, 0.48, 0.65]]])
print(np.asarray(img_data).shape)
begin, size, bbox_for_draw = tf.image.sample_distorted_bounding_box(tf.shape(img_data),
bounding_boxes=boxes,
min_object_covered=0.1)
# batched = tf.expand_dims(tf.image.convert_image_dtype(img_data, tf.float32), 0)
# image_with_box = tf.image.draw_bounding_boxes(batched, bbox_for_draw)
distorted_image = tf.slice(img_data, begin, size)
plt.imshow(distorted_image.eval())
plt.show()

tensorflow 資料增強處理基本上就這些啦~用起來，訓練神經網路才是關鍵。

tensorflow資料增強

相信大家都聽說過資料增強（Data Augmentation）,這是在做神經網路時非常極其重要的trick, 因為資料是寶貴的，稀有的，通過資料增強我們能讓我們的資料量迅速增大，並且能使訓練的模型具有一定抗噪能力。這篇文章主要探討一下 tensorflow 關於資料增

tensorflow實現inception Net資料增強

在CNN中，為了增大資料量避免模型的過擬合，通常都會對訓練資料做資料增強處理，這篇文章主要介紹在Inception Net中是如何做資料增強的，tensorflow官方通過slim已經實現了VGG、Inception、LeNet網路的資料增強的，官網連結如下：https://github.com

tensorflow實現資料增強(隨機裁剪、翻轉、對比度設定、亮度設定)

資料增強(Data Augmentation)：是指對圖片進行隨機的旋轉、翻轉、裁剪、隨機設定圖片的亮度和對比度以及對資料進行標準化(資料的均值為0，方差為1)。通過這些操作，我們可以獲得更多的圖片樣本，原來的一張圖片可以變為多張圖片，擴大了樣本容量，對於提高模型的準確率和提

Tensorflow 中資料增強

影象# Randomly crop a [height, width] section of the image. distorted_image = tf.random_crop(reshaped_image, [height, width, 3])# Randomly f

深度學習之資料增強庫imgaug使用方法

在上一篇文章中，介紹了常用的資料增強的方法，並提到了實現這些方法的一個庫imgaug，這篇文章就對該庫的使用方法進行一個總結。 1 介紹 imgaug是一個用於機器學習實驗中影象增強的python庫，支援python2.7和3.4以上的版本。它支援多種增強技術，允許輕鬆組合這些技術，具

深度學習之影象的資料增強方法彙總

參考：https://www.jianshu.com/p/99450dbdadcf 在深度學習專案中，尋找資料花費了相當多的時間。但在很多實際的專案中，我們難以找到充足的資料來完成任務。為了要保證完美地完成專案，有兩件事情需要做好：1、尋找更多的資料；2、資料增強。本篇主要描述資料增強。有

深度學習之批量圖片資料增強

在之前的文章中，分別對資料增強的方法以及庫函式進行了介紹，本文將結合實際應用進行批量圖片的資料增強。背景：專案採集的是灰度圖，原資料只有不到20張圖片，因此，選擇資料增強的方法，通過不同變換方法的組合，實現資料增加的百張以上，這樣才可以放入深度學習模型進行訓練（利用遷移學習）。話不多

影象資料增強實戰

by 小韓 (翻譯自：https://towardsdatascience.com/image-augmentation-examples-in-python-d552c26f2873) 我目前正在做影象資料增強的深度和有效性的研究。這項研究的目的是學習怎樣增加只有有限或少

深度學習之影象的資料增強

本文轉載自：http://www.cnblogs.com/gongxijun/p/6117588.html 在影象的深度學習中，為了豐富影象訓練集，更好的提取影象特徵，泛化模型（防止模型過擬合），一般都會對資料影象進行資料增強，資料增強，常用的方式，就是：旋轉影象，剪下影象，改變影象色差,扭

影象資料增強的若干方法

影象分類的資料集非常大。儘管如此，依然需要資料增強來提高模型泛化能力。資料增強一般包括重新縮放影象的隨機裁剪、隨機水平翻轉、隨機 RGB 顏色與亮度變換等技術。此外，也存在不同的縮放、裁剪等技術（即單尺度訓練 vs 多尺度訓練）。在測試階段進行多裁剪評估也是經常使用的途徑，不過該方案的計

tensorflow資料結構- SaverDef

計算圖結構 MetaGraphDef（計算圖） MetaInfoDef（運算方法） OpList（運算方法集合） OpDef（運算方法） ArgD

tensorflow資料結構-GraphDef

計算圖結構 MetaGraphDef（計算圖） MetaInfoDef（運算方法） OpList（運算方法集合） OpDef（運算方法） ArgD

tensorflow資料結構-MetaInfoDef

計算圖結構 MetaGraphDef（計算圖） MetaInfoDef（運算方法） OpList（運算方法集合） OpDef（運算方法） ArgD

tensorflow資料結構-MetaGraphDef

tensorflow資料結構 https://github.com/tensorflow/tensorflow/blob/r1.11/tensorflow/core/protobuf/meta_graph.proto 《Tensorflow實戰深度學習框架》

TensorFlow資料彙總在 Mac OS X 上安裝 TensorFlow

1、使用 virtualenv 安裝TensorFlow 按照以下步驟安裝 TensorFlow：開啟終端（一個 shell），你將在這個終端中執行隨後的步驟通過以下命令安裝 pip 和 virtualenv： $ sudo easy_install pip $ sudo pip in

data augmentation 資料增強方法總結

1、問題描述收集資料準備微調深度學習模型時，經常會遇到某些分類資料嚴重不足的情況，另外資料集過小容易造成模型的過擬合。本文參考一些網友對於資料增強方法的一些tips，後續會附上自己實現的C++程式碼； 2、data augmentation常用方法

python中使用PIL模組中的ImageEnhance進行圖片資料增強

使用此方法將圖片進行資料增強，具體增強圖片的形式是如下幾種： """ 1、對比度：白色畫面(最亮時)下的亮度除以黑色畫面(最暗時)下的亮度； 2、色彩飽和度：：彩度除以明度，指色彩的鮮豔程度，也稱色彩的純度； 3、色調：向負方向調節會顯現紅色，正方向調節則增加黃色。適合對膚色物件進行微調； 4、

AugGAN：基於GAN的影象資料增強

資料增強方法無疑是需要重點研究的基本任務之一，因為我們的主流深度學習演算法還是一個有監督過程。臺灣國立清華大學在ECCV2018發表了一篇AugGAN開始把GAN用在資料增強方面了，當然，這並不是這個領域的第一篇。不過很具有參考意義，也很能解決實際問題。所以特地寫一個blog研究一番。讀本文需

CVPR2018行人重識別系列：用GAN進行資料增強

1.前言近年CVPR2018錄用了很多person re-id相關論文，本著學習和總結的原則，來對目前行人重識別上最新的方法進行一個總結，由於本人水平有限，對於文章的理解可能存在不全面的地方，我儘可能的對方法進行的歸類，在每個類別下面對相關文章進行簡單介紹，也便於以後自己查閱。本文主要

使用imgaug--python影象資料增強庫進行Bounding Boxes影像增強

使用imgaug影象資料增強庫進行Bounding Boxes影像增強簡介 imgaug安裝 Bounding Boxes實現讀取原影像bounding boxes座標生成變換後的bounding boxe座標檔案

tensorflow資料增強

先讀取圖片資料, 並輸出我們的圖片資訊

沒錯，就是一個漂亮的小姐姐，hh

相關推薦