使用TensorFlow進行常用的影象處理-影象轉為矩陣以及影象大小調整

阿新 • • 發佈：2019-01-24

影象編碼處理
將影象轉為一個三維矩陣，並使用三維矩陣形成一個影象：

import tensorflow as tf
import matplotlib.pyplot as plt

# 讀取原始影象資料
image_raw_data = tf.gfile.FastGFile("/tensorflow_google/cat.jpg", 'rb').read()

with tf.Session() as sess:
    # 將jpg影象轉化為三維矩陣，若為png格式，可使用tf.image.decode_png
    img_data = tf.image.decode_jpeg(image_raw_data)
    # 輸出解碼之後的三維矩陣 

    # print(img_data.eval())
    # 使用plt顯示影象
    # plt.imshow(img_data.eval())
    # plt.show()

    # 將資料的型別轉化為實處方便處理
    img_data = tf.image.convert_image_dtype(img_data, dtype=tf.uint8)

    # 將表示一張影象的三維矩陣重新按照jpeg格式編碼並存入檔案
    encoded_image = tf.image.encode_jpeg(img_data)
    with tf.gfile.GFile("/tensorflow_google/encoded.jpeg" 
, 'wb') as f:
        f.write(encoded_image.eval())

影象大小調整
將影象的大小統一，TensorFlow使用了四種不同的方法，並將它們封裝到tf.image.resize_images函式中：
1）method = 0，使用雙線性插值法
2）method = 1，使用最近鄰法
3）method = 2，使用雙三次插值法
4）method = 3，使用面積插值法
以下為使用程式碼：

import tensorflow as tf

# 讀取原始影象資料
image_raw_data = tf.gfile.FastGFile("/tensorflow_google/cat.jpg" 
, 'rb').read()

with tf.Session() as sess:
    # 將jpg影象轉化為三維矩陣，若為png格式，可使用tf.image.decode_png
    img_data = tf.image.decode_jpeg(image_raw_data)
    img_data = tf.image.convert_image_dtype(img_data, dtype=tf.float32)
    # 通過tf.image.resize_images調整影象大小，size中為調整後的格式，method為調整影象大小的演算法
    resized = tf.image.resize_images(img_data, size=[300, 300], method=0)

    # 輸出調整後圖像的大小，深度沒有設定，所以是？
    print(resized.get_shape())

>>(300, 300, ?)

注意：若出現以下錯誤
TypeError: resize_images() got multiple values for argument ‘method’
則是因為使用了舊版resize_images函式，如下：

resized = tf.image.resize_images(img_data, 300, 300, method=0)

新版resize_images函式改為：

resized = tf.image.resize_images(img_data, size=[300, 300], method=0)

使用TensorFlow進行常用的影象處理-影象轉為矩陣以及影象大小調整1

影象編碼處理將影象轉為一個三維矩陣，並使用三維矩陣形成一個影象： import tensorflow as tf import matplotlib.pyplot as plt # 讀取原始影象資料 image_raw_data = tf.gfile.FastGFi

使用TensorFlow進行常用的影象處理-影象轉為矩陣以及影象大小調整

影象編碼處理將影象轉為一個三維矩陣，並使用三維矩陣形成一個影象： import tensorflow as tf import matplotlib.pyplot as plt # 讀取

影象處理（1）——對比度和亮度調整

1.內容設計一個Sigmoid函式，實現對影象的對比度調整；使用opencv視窗系統的slider控制元件，互動改變Sigmoid函式的引數，實現不同程度的對比度調整； 2.方法一次函式方法想要調整圖片的對比度，就要對圖片中的畫素進行操作，改變畫素的值來

java數字影象處理基礎使用imageio寫影象檔案示例（轉載）

一個BufferedImage的畫素資料儲存在Raster中，ColorModel裡面儲存顏色空間，型別等資訊，當前Java只支援一下三種影象格式- JPG,PNG,GIF,如何向讓Java支援其它格式，首先要完成Java中的影象讀寫介面，然後打成jar，加上啟動引數- Xbootclasspat

影象處理（十一）影象分割(3)泛函能量LevelSet、snake分割

一、level set相關理論基於水平集的影象分割演算法是一種進化版的Snake演算法，也是需要給定初始的輪廓曲線，然後根據泛函能量最小化，進行曲線演化。水平集的方法，用的是一種隱式函式的方法，這個演算法比較難理解，我一年前開始搞這個演算法的時候，雖然知道程式碼怎麼寫，但是它的原理推

《數字影象處理》第二章——數字影象基礎

雖然寫這個部落格主要目的是為了給我自己做一個思路記憶錄，但是如果你恰好點了進來，那麼先對你說一聲歡迎。我並不是什麼大觸，只是一個菜菜的學生，如果您發現了什麼錯誤或者您對於某些地方有更好的意見，非常歡迎您的斧正！目錄回顧第一章： 2.1節——視覺感知要素 2.1.

python數字影象處理（2）：影象的讀取、顯示與儲存

skimage提供了io模組，顧名思義，這個模組是用來圖片輸入輸出操作的。為了方便練習，也提供一個data模組，裡面嵌套了一些示例圖片，我們可以直接使用。引入skimage模組可用： 1 from skimage import io

python數字影象處理（3）：影象畫素的訪問與裁剪

圖片讀入程式中後，是以numpy陣列存在的。因此對numpy陣列的一切功能，對圖片也適用。對陣列元素的訪問，實際上就是對圖片畫素點的訪問。彩色圖片訪問方式為： img[i,j,c] i表示圖片的行數，j表示圖片的列數，c表示圖片的通道數（RGB三通道分別對應0，1

影象處理與分析（數字影象處理第二版）學習筆記（5.1）

第五章，影象復原 1，什麼是影象復原？影象復原是利用某種先驗知識來重建或者復原被退化的影象。一般來講，影象復原就是將退化模型化，並且採用相反的過程進行處理，以便復原出原影象。 2，影象退化模型表達形式？退化過程模型化之後為一個退化函式和一個加性噪聲項。 g(x,y)=h(

影象處理與分析（數字影象處理第二版）學習筆記（4.2）

第四章頻率域增強 1，頻率域中濾波基礎？頻率域濾波基礎根據傅立葉變換的平移性質：當u0=M/2,v0=N/2根據尤拉公式可化為：. 第一步，將輸入的原影象乘以（-1）^(x+y)進行中心變換；第二步，計算變換後圖像的DFT（離散傅立葉變換）；第三步，用濾波函式H(u

影象處理與分析（數字影象處理第二版）學習筆記（4.1）

第四章，頻率域影象增強 1，連續和離散傅立葉變換和反變換表示式？一維連續：二維連續： &n

Python3+OpenCV3影象處理（十一）—— 影象金字塔

簡介：影象金字塔是影象中多尺度表達的一種，最主要用於影象的分割，是一種以多解析度來解釋影象的有效但概念簡單的結構。簡單來說，影象金字塔就是用來進行影象縮放的。進行影象縮放可以用影象金字塔，也可以使用resize函式進行縮放，後者效果更好。這裡只是對影象金字塔做一些簡單瞭解

影象處理與分析（數字影象處理岡薩雷斯第二版）學習筆記2

第二章，數字影象基礎 1，人眼視覺原理？眼球適當聚焦，眼睛外部的光在視網膜上成像。視網膜表面的光接收器：錐狀體和桿狀體。每隻眼睛的錐狀體數目在600萬到700萬之間，主要位於視網膜中間部分，被稱為中央凹（大概1.5mm凹坑相當於1.5*1.5的方形感測器陣列），對顏色敏

影象處理與分析（數字影象處理第二版）學習筆記4.1

第四章，頻率域影象增強 1，連續和離散傅立葉變換和反變換表示式？一維連續：二維連續：一維離散：二維離散： 2，二維影象離散

影象處理與分析（數字影象處理第二版）學習筆記5.1

第五章，影象復原 1，什麼是影象復原？影象復原是利用某種先驗知識來重建或者復原被退化的影象。一般來講，影象復原就是將退化模型化，並且採用相反的過程進行處理，以便復原出原影象。 2，影象退化模型表達形式？退化過程模型化之後為一個退化函式和一個加性噪聲項。 g(x,

【影象處理】VTK二維影象標記bug修正

遊戲或者CAD軟體中，我們常常在目標旁邊顯示一個始終面向使用者的二維影象，來表示某些特定標識。VTK使用vtkFollower 來實現這個功能，然而VTK7.1及以下版本發生bug，表現為使用vtkFollower之後，二維影象無法渲染，只顯示一個純白色的矩形框

使用 matlab 數字影象處理（三）—— 實現影象的旋轉（不使用 imrotate）

影象的旋轉是不改變影象的灰度值的，這是將原始位置對映到新的位置。 [x1y11]=[x0y01]⋅⎡⎣⎢cosθ−sinθ0sinθcosθ0001⎤⎦⎥ Image = imread(

python數字影象處理（5）：影象的繪製

實際上前面我們就已經用到了影象的繪製，如： io.imshow(img) 這一行程式碼的實質是利用matplotlib包對圖片進行繪製，繪製成功後，返回一個matplotlib型別的資料。因此，我們也可以這樣寫： import matplotlib.pyplot as plt plt.imsh

C/C++ 影象處理（13）------雙目影象の深度圖生成

雙目影象可用於生成具有深度的三維影象，其是通過模仿動物雙眼的工作機制而來。關於其相關的演算法，現如今研究的人很多，但仍離動物雙眼的視覺效果千里之遙，只能用在非常有限的範圍之內。近來由於專案所需，要用到雙目影象生成深度圖，因此做了些研究，然並未深入理解其原理，

python數字影象處理（11）：影象自動閾值分割

影象閾值分割是一種廣泛應用的分割技術，利用影象中要提取的目標區域與其背景在灰度特性上的差異，把影象看作具有不同灰度級的兩類區域(目標區域和背景區域)的組合，選取一個比較合理的閾值，以確定影象中每個畫素點應該屬於目標區域還是背景區域，從而產生相應的二值影象。在skimage庫中，閾值分割的功能是放在fi

使用TensorFlow進行常用的影象處理-影象轉為矩陣以及影象大小調整

相關推薦