caffe中將某個目錄下的jpg影象轉換為hdf5型別

阿新 • • 發佈：2019-01-19

網上相關資料很少，今天做了將資料夾下的所有.jpg格式的圖片轉換成hdf5格式，中途踩了很多坑，最後在老師的指導下寫出來了，特此記錄。
二話不說，直接上程式碼，很好理解。我的圖片命名是x1_y1_x2_y2.jpg的形式，用CNN做迴歸，找到2個座標的x,y值。建議用python做文字處理，非常快，很容易上手。
主要看data和label具體怎麼寫，怎麼定義，怎麼轉換，這個是關鍵。所有的圖片都讀取完，一次性create_dataset，不然會出錯。

import numpy as np
import h5py
import cv2
import os
import random
import 
 code
import string

def store_hdf5(filename, mapping):
    """Function to store data mapping to a hdf5 file

    Args:
        filename (str): The output filename
        mapping (dic): A dictionary containing mapping from name to numpy data The complete mapping will be stored as single datasets in the h5py file.
    print("Storing hdf5 file %s" % filename)
    with h5py.File(filename, 'w') as hf:
        for label, data in mapping.items():
            print("  adding dataset %s with shape %s" % (label, data.shape))
            hf.create_dataset(label, data=data)

    print("  finished")

if __name__=="__main__":

    src_dir = "/usr/MyProject/chineseWordsRecognition/meta/desdir2"
    des_dir = "/usr/caffe_20150410/examples/licensefile/train_desdir"
    des_txt = "/usr/caffe_20150410/examples/licensefile/train_destxt.txt"

    flist = os.listdir(src_dir)

    if not os.path.exists(des_dir):
        os.mkdir(des_dir)

    print "num of files: " + str(len(flist))

    random.shuffle(flist)

    des_txt_file = open(des_txt,'w')

    #max_num=1000000 #56GB
    max_num=32000 #one split contains 32000 images
    W = 210
    H = 30

    TOT_MAX=1000000

    data = np.zeros((max_num,3, H, W),dtype=np.float32)
    labels = np.full((max_num, 4), -1, dtype=np.float32)

    CNT=0; 


    TOT = len(flist)

    TOT_CNT = 0
    BATCH_CNT=0

    for fname in flist:
        if fname[0]=="." or fname[0]=="_":
            continue
        src_path = src_dir + "/" + fname

        res = cv2.imread(src_path, cv2.IMREAD_COLOR).astype(np.float32)
    tmpimg = cv2.resize(res,(W,H)) 

    h,w,ch = tmpimg.shape
        if 
 h==0 or w==0:
            continue


        img = np.zeros((3,H,W),dtype=np.float32)
        img[0,:,:] = tmpimg[:,:,0]-104 #圖片歸一化，除以每個通道的均值
        img[1,:,:] = tmpimg[:,:,1]-117
        img[2,:,:] = tmpimg[:,:,2]-123

        annot = fname.split(".")[0].split("_")[0:4] #取圖片命名的四個座標

        if len(annot)!=4:
            continue

        resh,resw,resch = res.shape     
        l = string.atof(annot[0])/resw
        labels[CNT,0] = l
    l = string.atof(annot[1])/resh   #座標一定要歸一化，切記切記
    labels[CNT,1] = l
    l = string.atof(annot[2])/resw
    labels[CNT,2] = l
    l = string.atof(annot[3])/resh
    labels[CNT,3] = l

    data[CNT,:,:,:] = img

        CNT+=1
        TOT_CNT+=1
        if TOT_CNT == 10000:   #hdf5檔案的大小有限制，如果太大的話，一定要分批寫
        break

        if TOT_CNT%1000==0:
            print "TOT=" + str(TOT) + ", TOT_CNT=" + str(TOT_CNT)
            print code

        if CNT>=max_num:
            des_path = des_dir + "/" + str(BATCH_CNT) + ".h5"
            des_txt_file.write(des_path + "\n")
            CNT=0
            BATCH_CNT+=1
            store_hdf5(des_path, {"data" : data, "labels" : labels})
            data = np.zeros((max_num,3, H, W),dtype=np.float32)
            labels = np.full((max_num, 4), -1, dtype=np.float32)

        if TOT_CNT>=TOT_MAX-1:
            break

    if CNT>0:
        data = data[0:CNT, :, :, :]

        labels = labels[0:CNT, :]


        des_path = des_dir + "/" + str(BATCH_CNT) + ".h5"
        des_txt_file.write(des_path + "\n") 
        store_hdf5(des_path, {"data" : data, "labels" : labels})
    des_txt_file.close()

caffe中將某個目錄下的jpg影象轉換為hdf5型別

caffe中將某個目錄下的jpg影象轉換為hdf5型別

Unicode字符集下，CString 轉換為char型別

Java如何解析某個目錄下xml檔案，將XML檔案轉換為報表資料來源？

linux下刪除某個目錄下大量文件辦法

java利用WatchService實時監控某個目錄下的文件變化並按行解析（註：附源代碼）

將某個目錄下的所有文件進行壓縮

用shell腳本遞歸遍歷某個目錄下的所有文件並移動到某個指定的目錄中

Python 讀取某個目錄下所有的檔案 -- untested

windows 2008下將新增磁盤掛載到某個目錄下

通過 Java 去監測某個目錄下的檔案變動（commons.io方式）

通過 Java 去監測某個目錄下的檔案變動（File Watch Service方式）

Centos中查詢並替換某個目錄下所有檔案中的某個字串

java:File類(練習)--獲取某個目錄下的所有某種型別的檔案

Caffe下將圖片轉換為lmdb格式

python 某個目錄下的所有檔案列表

Python for Windows——監控Windows某個目錄下檔案的變化

輸出某個目錄下的所有檔案和資料夾，包括子資料夾中的內容

在Linux如何使用C語言列出某個目錄下的檔案

將jpg影象轉換成yuv420p格式

刪除某個目錄下的全部文件

caffe中將某個目錄下的jpg影象轉換為hdf5型別

相關推薦