Caffe：如何fine tune一個現有的網路（VGG16）——將資料預處理並儲存為h5格式

阿新 • • 發佈：2019-01-04

在訓練神經網路的過程中，常常需要fine tune一個現有的網路，首先是需要對輸入資料進行預處理，包括有：

對尺寸大小進行處理
將正負例和測試的data&label儲存為h5檔案
將h5檔案中data&label對應的書序打亂

實現程式碼如下：

1. 導包以及VGG網路初始化

import numpy as np
import matplotlib.pyplot as plt
import skimage
import skimage.io
import skimage.transform
import os
import h5py
%matplotlib inline

plt.rcParams['figure.figsize' 
]=(10,10)
plt.rcParams['image.interpolation']='nearest'
plt.rcParams['image.cmap']='gray'
VGG_MEAN = [103.939, 116.779, 123.68]

2.處理圖片RGB三通道

def preprocess(img):
  out = np.copy(img) * 255
  out = out[:, :, [2,1,0]] # swap channel from RGB to BGR
  # sub mean
  out[:,:,0] -= VGG_MEAN[0]
  out[:,:,1] -= VGG_MEAN[1 
]
  out[:,:,2] -= VGG_MEAN[2]
  out = out.transpose((2,0,1)) # h, w, c -> c, h, w
  return out

3.畫素歸一化

def deprocess(img):
  out = np.copy(img)
  out = out.transpose((1,2,0)) # c, h, w -> h, w, c

  out[:,:,0] += VGG_MEAN[0]
  out[:,:,1] += VGG_MEAN[1]
  out[:,:,2] += VGG_MEAN[2]
  out = out[:, :, [2 
,1,0]]
  out /= 255
  return out

4.尺寸處理

# returns image of shape [224, 224, 3]
# [height, width, depth]
def load_image(path):
  # load image
  img = skimage.io.imread(path)
  img = img / 255.0
  assert (0 <= img).all() and (img <= 1.0).all()
  #print "Original Image Shape: ", img.shape
  # we crop image from center
  short_edge = min(img.shape[:2])
  yy = int((img.shape[0] - short_edge) / 2)
  xx = int((img.shape[1] - short_edge) / 2)
  crop_img = img[yy : yy + short_edge, xx : xx + short_edge]
  # resize to 224, 224
  resized_img = skimage.transform.resize(crop_img, (224, 224))
  return resized_img

5.迴圈遍歷檔案儲存資料以及label
關鍵程式碼：

儲存count值方便後續使用以及檢查：

imgData_count = 0
imgTest_count = 0
FilePrefixlist = []  #存取檔案字首名的列表

#分別將list中出現的image名字和label儲存在不同的矩陣
PositiveList = np.loadtxt(r'plane.txt',dtype=np.int)

#獲取檔案的字首名，字首名為string型別
with open(r'plane.txt', 'r') as f:
    while True:
        line = f.readline()   #逐行讀取
        if not line:
            break
        linesplit = line.split(' ')            
        FilePrefixlist.append(linesplit[0])   #只取得第一列的資料即檔案的字首名
    labelPositiveList = PositiveList[:,1]

#統計正例中儲存為訓練集的個數
labelPositiveCount=np.sum(labelPositiveList==1)
labelNegativeCount=np.sum(labelPositiveList==-1)

#初始化訓練集和測試集的data和label
imgData = np.zeros([labelPositiveCount+190,3,224,224],dtype= np.float32)
label = []

imgTest = np.zeros([labelNegativeCount+95,3,224,224],dtype= np.float32)
labelTest =[]

接下里開始正式讀資料和label，以其中某一個檔案資料為例：

#通過讀正類指令碼檔案將正類中train和test的儲存到對應data中   
for index in range(len(FilePrefixlist)):
    line=FilePrefixlist[index]
     #如果label=1，那麼是訓練集
    if labelPositiveList[index]==1 : 
        imgData[imgData_count,:,:,:]=preprocess(load_image(path+'/'+line+'.jpg'))
 label.append(1)
 imgData_count = imgData_count+1 
 #否則label就是-1，代表這是一個測試集的資料，放在測試集中
    else:       
        imgTest[imgTest_count,:,:,:]=preprocess(load_image(path+'/'+line+'.jpg'))   

    labelTest.append(1)
    imgTest_count = imgTest_count+1

上述過程將所有data存在numpy數組裡面，label存在list中用append（）方式追加，於是需要將list轉變為numpy陣列：

#將label列表變為numpy
label = np.array(label)
labelTest = np.array(labelTest)

使用shuffle打亂順序：

#打亂h5檔案訓練集正負例順序
index = [i for i in range(len(imgData))]
np.random.shuffle(index)
imgData = imgData[index]
label = label[index]

建立h5檔案，放入data和label：

f = h5py.File('aeroplane_train.h5','w')#相對路徑，絕對路徑會報錯
f['data']=imgData
f['label']=label   
f.close()

#HDF5的讀取：  
f = h5py.File('aeroplane_train.h5','r')   #開啟h5檔案  
f.keys()                            #可以檢視所有的主鍵  
a = f['data'][:]                    #取出主鍵為data的所有的鍵值  
f.close()

資料預處理以及儲存過程關鍵程式碼如上所示。

在編碼中遇到一些小坑：
1、win與linux在寫路徑是正反斜槓”/”“\”的問題，win下複製的路徑與自己新增的完整路徑的斜槓方向不同。。。

2、在loadtxt的時候，由於\t或者\n會識別為轉義字元，於是需要在路徑前加上r，否則會報錯，例如：

PositiveList = np.loadtxt(r'C:\Users\Administrator\plane.txt',dtype=np.int)

Caffe：如何fine tune一個現有的網路（VGG16）——將資料預處理並儲存為h5格式

在訓練神經網路的過程中，常常需要fine tune一個現有的網路，首先是需要對輸入資料進行預處理，包括有：對尺寸大小進行處理將正負例和測試的data&label儲存為h5檔案將h5檔案中data&label對應的書序打亂實現程式碼

文字內容分析和智慧反饋（2）－資料預處理和按緯度統計

書接上文，考慮4個核心功能的實現，先考慮：資料預處理和按緯度統計。 1、資料預處理 1.1、基本原則首先，考慮資料的格式。業務資料是儲存在關係型資料庫中的。資料分析的部分，我們將使用Weka，雖然Weka習慣ARFF格式，為了實現資料分析和提取的

opencv學習筆記（九）捕獲攝像頭的視訊並儲存成avi格式

這個程式引用自下面的部落格，但是執行之後我發現視訊儲存之後，要利用前面提到的opencv播放視訊程式播放，不能用普通播放器播放——而且用前面的opencv程式播放時，影象是倒置的，需要我們在程式裡面改一下。在while(1)裡面加上一句 cvFlip

網路程式設計基礎【day10】：我是一個執行緒（四）

本節內容 1、第一回初生牛犢 2、第二回漸入佳境 3、第三回虎口脫險 4、第四回江湖再見第一回初生牛犢我是一個執行緒，我一出生就被編了個號：0x3704，然後被領到一個昏暗的屋子裡，在這裡我發現了很多和我一模一樣的同伴。我身邊的同伴0x6900 待的時間比較長，他帶著滄桑的口氣對

tensorflow 學習專欄（六）：使用卷積神經網路（CNN）在mnist資料集上實現分類

卷積神經網路（Convolutional Neural Network, CNN）是一種前饋神經網路，它的人工神經元可以響應一部分覆蓋範圍內的周圍單元，對於大型影象處理有出色表現。卷積神經網路CNN的結構一般包含這幾個層：輸入層：用於資料的輸入卷積層：使用卷積核進行特徵提取和

Deep Learning模型之：CNN卷積神經網路（一）深度解析CNN

http://m.blog.csdn.net/blog/wu010555688/24487301 本文整理了網上幾位大牛的部落格，詳細地講解了CNN的基礎結構與核心思想，歡迎交流。 1. 概述卷積神經網路是一種特殊的深層的神經網路模型，它的特殊性體現在兩個方面，一方面它的神經元

用pytorch實現一個神經網路（一）

對於影象資料的resize問題： pytorch裡有幾種resize資料的方法： 1.torchvision.transforms.Resize：這個我始終沒用成，好像是伺服器上安裝的anacond

卷積神經網路入門一種全卷積神經網路（LeNet），從左至右依次為卷積→子取樣→卷積→子取樣→全連線→全連線→高斯連線測試最後，為了檢驗 CNN 能否工作，我們準備不同的另一組圖片與標記集（不能在訓練

轉載來自：http://blog.csdn.net/maweifei/article/details/52443995 第一層——數學部分 CNN 的第一層通常是卷積層（Convolutional Layer）。輸入內容為一個 32 x 32 x 3 的畫素值陣列。現在

計算機網路（七）--使用者資料報協議UDP和傳輸控制協議TCP概述

使用者資料報協議UDP只在IP的資料報服務之上增加了很少一點的功能：複用、分用、差錯檢測。（1）UDP是無連線的，即傳送資料之前不需要建立連線（當然，傳送資料結束時也沒有連線可釋放），因此減少了開銷和傳送資料之前的時延。（2）UDP使用盡最大努力交付，即不保證可靠交付，

Python爬蟲學習6：scrapy入門（一）爬取汽車評論並儲存到csv檔案

一、scrapy 安裝：可直接使用Anaconda Navigator安裝，也可使用pip install scrapy安裝二、建立scrapy 爬蟲專案：語句格式為 scrapy startproject project_name生成的爬蟲專案目錄如下，其中spiders

（二）數據預處理

info 偏差填充 ima 平滑回歸 img 全局常量 AR 數據清洗數值缺失 1.略去該組數據 2.數值填充：1)隨機數;2)統一的全局常量，如:UNKNOWN;3)均值、中值;4）按類別的中值、均值;5）回歸、決策樹等得到的預測值; 噪聲數據的平滑：隨機噪聲

sklearn學習筆記（一）——數據預處理 sklearn.preprocessing

如果 param .org 解決 prompt 很多部分 detail test https://blog.csdn.net/zhangyang10d/article/details/53418227 數據預處理 sklearn.preprocessing 標準化（S

Android開發雜記（1）---截圖某個View並儲存到系統圖庫

View view = new View（context） view.setDrawingCacheEnabled(true); view.buildDrawingCache(); Bitmap bitmap = Bitmap.createBitmap(mExa

關係網路圖表視覺化_Python資料預處理

本章內容：用Python預處理豆瓣電影資料，並使用Gephi做關係網路圖表視覺化。 Python資料預處理將資料中導演與演員的關係整理出來，得到導演與演員的關係資料，並統計合作次數。 import pandas as pd import warnings w

react-native-android-unity（二）建立unity專案，並匯出為android程式碼包，嵌入android專案中

1.建立unity專案給Main Camera新增指令碼Android，使用C#開發，指令碼內容如下： using System.Collections; using System.Colle

CS231n 卷積神經網路與計算機視覺 6 資料預處理權重初始化規則化損失函式等常用方法總結

1 資料處理首先註明我們要處理的資料是矩陣X，其shape為[N x D] (N =number of data, D =dimensionality). 1.1 Mean subtraction 去均值去均值是一種常用的資料處理方式.它是將各個特徵值減去其均

java編碼ABC（一）將cmd視窗報錯改為英文

windows的命令列cmd編譯java檔案報錯是中文，如何切換為英文。當然目的是訓練閱讀英文報錯的能力。因為中文報錯的柺杖絕對會妨礙以後的發展。解決辦法1：在命令列下，進入當前環境的jdk安裝目錄的bin目錄下輸入命令： javac -J-Duser.langua

python3 爬蟲日記（二）將資料存到Mongodb

python版本：3.6.1 開發工具：PyCharm社群版，Anaconda3 資料庫：MongoDB 視覺化MongoDB工具：MongoVUE 1.開啟資料庫後，開啟MongoVUE使MongoDB視覺化。 2.用PyCharm編寫程式碼，爬取資料並儲存到資料庫中。

大資料實時計算Spark學習筆記（7）—— RDD 資料傾斜處理

1 處理資料傾斜在 reduceByKey 之前先進行隨機分割槽 package com.bigdataSpark.cn import org.apache.spark.{SparkConf, SparkContext} import scala.util.Ran

ExamApp總結（四）將資料從資料庫中進行存取

CrimeLab.java private static ContentValues getContentValues(Crime crime){ ContentValues values=new ContentValues(); va

Caffe：如何fine tune一個現有的網路（VGG16）——將資料預處理並儲存為h5格式

相關推薦