影象分割 | FCN資料集製作的全流程（影象標註）

阿新 • • 發佈：2018-12-30

一全卷積神經網路

文章所有程式碼已上傳至github，覺得好用就給個star吧，謝謝

深度學習影象分割（FCN）訓練自己的模型大致可以以下三步：

1.為自己的資料製作label；

2.將自己的資料分為train,val和test集；

3.仿照voc_lyaers.py編寫自己的輸入資料層。

其中主要是如何製作自己的資料label困擾著大家。

補充：由於影象大小的限制，這裡給幾個影象Resize的指令碼：

（1）單張圖片的resize

# coding = utf-8  
import Image  

def  convert(width,height):
    im = Image.open("C:\\xxx\\test.jpg" 
)
    out = im.resize((width, height),Image.ANTIALIAS)
    out.save("C:\\xxx\\test.jpg")
if __name__ == '__main__':
    convert(256,256)

（2）resize整個資料夾裡的圖片

# coding = utf-8
import Image
import os

def convert(dir,width,height):
    file_list = os.listdir(dir)
    print(file_list)
    for filename in 
 file_list:
        path = ''
        path = dir+filename
        im = Image.open(path)
        out = im.resize((256,256),Image.ANTIALIAS)
        print "%s has been resized!"%filename
        out.save(path)

if __name__ == '__main__':
   dir = raw_input('please input the operate dir:')
   convert(dir,256 
,256)

(3)按比例resize

# coding = utf-8  
import Image  

def  convert(width,height):
    im = Image.open("C:\\workspace\\PythonLearn1\\test_1.jpg")
    (x, y)= im.size
    x_s = width
    y_s = y * x_s / x
    out = im.resize((x_s, y_s), Image.ANTIALIAS)
    out.save("C:\\workspace\\PythonLearn1\\test_1_out.jpg")
if __name__ == '__main__':
    convert(256,256)

二影象標籤製作

第一步：使用github開源軟體進行標註

第二步：為標註出來的label.png進行著色

首先需要對照VOC分割的顏色進行著色，一定要保證顏色的準確性。Matlab程式碼:

function cmap = labelcolormap(N)

if nargin==0
    N=256
end
cmap = zeros(N,3);
for i=1:N
    id = i-1; r=0;g=0;b=0;
    for j=0:7
        r = bitor(r, bitshift(bitget(id,1),7 - j));
        g = bitor(g, bitshift(bitget(id,2),7 - j));
        b = bitor(b, bitshift(bitget(id,3),7 - j));
        id = bitshift(id,-3);
    end
    cmap(i,1)=r; cmap(i,2)=g; cmap(i,3)=b;
end
cmap = cmap / 255;

對應的顏色類別：

類別名稱 R G B 
background 0 0 0 背景 
aeroplane 128 0 0 飛機 
bicycle 0 128 0 
bird 128 128 0 
boat 0 0 128 
bottle 128 0 128 瓶子 
bus 0 128 128 大巴 
car 128 128 128 
cat 64 0 0 貓 
chair 192 0 0 
cow 64 128 0 
diningtable 192 128 0 餐桌 
dog 64 0 128 
horse 192 0 128 
motorbike 64 128 128 
person 192 128 128 
pottedplant 0 64 0 盆栽 
sheep 128 64 0 
sofa 0 192 0 
train 128 192 0 
tvmonitor 0 64 128 顯示器

然後使用python 的skimage庫進行顏色填充，具體函式是skimage.color.label2rgb()，這部分程式碼以及顏色調整我已經完成了，由於程式碼太長就不貼出來了，有需要的可以私信我。

#!usr/bin/python
# -*- coding:utf-8 -*-
import PIL.Image
import numpy as np
from skimage import io,data,color
import matplotlib.pyplot as plt

img = PIL.Image.open('xxx.png')
img = np.array(img)
dst = color.label2rgb(img, bg_label=0, bg_color=(0, 0, 0))
io.imsave('xxx.png', dst)

其中skimage.color.label2rgb()的路徑在：x:\Anaconda2\Lib\site-packages\skimage\color，修改如下兩處，注意使用COLORS1。

DEFAULT_COLORS1 = ('maroon', 'lime', 'olive', 'navy', 'purple', 'teal',
                  'gray', 'fcncat', 'fcnchair', 'fcncow', 'fcndining',
                  'fcndog', 'fcnhorse', 'fcnmotor', 'fcnperson', 'fcnpotte',
                  'fcnsheep', 'fcnsofa', 'fcntrain', 'fcntv')

　　　　　　　　　　　　　　　　這裡寫圖片描述

第三步：最關鍵的一步

需要注意的是，label檔案要是gray格式，不然會出錯：scores層輸出與label的資料尺寸不一致，通道問題導致的，看下面的輸出是否與VOC輸出一致。

In [23]: img = PIL.Image.open('F:/DL/000001_json/test/dstfcn.png')
In [24]: np.unique(img)
Out[24]: array([0, 1, 2], dtype=uint8)

其中涉及到如何把24位png圖轉換為8位png圖，直接上程式碼：

dirs=dir('F:/xxx/*.png');
for n=1:numel(dirs)
     strname=strcat('F:/xxx/',dirs(n).name);
     img=imread(strname);
     [x,map]=rgb2ind(img,256);
     newname=strcat('F:/xxx/',dirs(n).name);
     imwrite(x,map,newname,'png');
end

三 FCN模型訓練

四測試圖片結果上色

from PIL import Image
import numpy as np
from datasets import CONFIG

# The arr is a predicted result
arr = np.load('arr.npy')

print 'The shape of the image is:', arr.shape
print 'The classes in the image are:', np.unique(arr)

# Define the palette
palette = []
for i in range(256):
    palette.extend((i, i, i))

# define the color of the 21 classes(PASACAL VOC)
palette[:3*21] = CONFIG['voc12']['palette'].flatten()

assert len(palette) == 768

im = Image.fromarray(arr)
im.show()
im.putpalette(palette)
im.show()

im.save('out.png')

影象分割 | FCN資料集製作的全流程（影象標註）

一全卷積神經網路文章所有程式碼已上傳至github，覺得好用就給個star吧，謝謝深度學習影象分割（FCN）訓練自己的模型大致可以以下三步： 1.為自己的資料製作label； 2.將自己的資料分為train,val和test集； 3.仿照voc_lyaers.py編寫自己的輸入資料層。

caffe fcn資料集製作 -標籤

caffe下fcn資料集的製作：看過我上篇部落格的人，想必已經跑通了作者的fcn資料集，現在就是製作自己的資料集並進行訓練。其實不難，首先我們分析一下作者的資料集。根據他的資料集，模仿一個即可。首先我們看作者訓練時需要的兩個資料集voc和dataset(這裡我的voc，我自己改了名字叫做voc2016)：

windows下使用自己製作的資料集訓練faster-rcnn（tensorflow版）用於目標檢測

步驟一步驟二步驟三用你的Annotations，ImagesSets和JPEGImages替換…\Faster-RCNN-TensorFlow-Python3.5\data\VOCdevkit2007\VOC2007中對應資料夾

11月26日雲棲精選夜讀 | 機器學習高質量資料集大合輯（附連結）

在機器學習中，尋找資料集也是非常重要的一步。質量高或者相關性高的資料集對模型的訓練是非常有幫助的。那麼用於機器學習的開放資料集有哪些呢？我們給大家推薦一份高質量的資料集，這些資料集或者涵蓋範圍廣泛（比如 Kaggle），或者非常細化（比如自動駕駛汽車的資料）。熱點熱議資源 | 機器學習高質量資料

機器學習高質量資料集大合輯（附連結）

在機器學習中，尋找資料集也是非常重要的一步。質量高或者相關性高的資料集對模型的訓練是非常有幫助的。那麼用於機器學習的開放資料集有哪些呢? 我們給大家推薦一份高質量的資料集，這些資料集或者涵蓋範圍廣泛(比如 Kaggle)，或者非常細化(比如自動駕駛汽車的資料)。首先，在搜尋資料集時，

MS COCO資料集目標檢測評估（Detection Evaluation）（來自官網）

目標檢測評估 1. Detection Evaluation 本頁介紹了COCO使用的檢測評估指標。此處提供的評估程式碼可用於在公開可用的COCO驗證集上獲得結果。它計算下面描述的多個指標。為了在COCO測試集上獲得結果，其中隱藏了實際真值註釋，必須將生成的結果上傳到評

練習題︱影象分割與識別——UNet網路練習案例（兩則）

U-Net是Kaggle比賽非常青睞的模型，簡單、高效、易懂，容易定製，可以從相對較小的訓練集中學習。來看幾個變形：（1）Supervise.ly 公司。在用 Faster-RCNN（基於 NasNet）定位 + UNet-like 架構的分

2017最新在swift3.0下整合iOS內購全流程（附程式碼）

最新寫的專案需要iOS內購功能所以就整理了這篇記錄，以便自己翻閱或者希望對讀者有所幫助。因為之前一直沒做過內購這個模組，所以有所不足，請多多指教，謝謝啦~下面進入正題：然後就沒然後了。。。下面進行詳細步驟，請仔細看圖片註釋： 1. 第一步

影象資料集製作

影象資料集的製作分為以下2個步驟：1.將影象資訊資料化 2.給每一幅影象貼上對應的標籤 .使用PIL中的Image模組將圖片的資訊資料化，整個處理過程都已經封裝好了的，需要修改的地方就是資料夾的路徑和資料夾的名字classes,直接上程式碼： import

[資料集]遙感影象建築/道路資料集

在看論文時發現了這個資料集，記錄在這裡，希望可以幫助到廣大的胖友們傳送門 : https://www.cs.toronto.edu/~vmnih/data/ 爬的了一下建築的資料（道路部分的資料，由於資料太大，無法上傳到百度雲上），我放在了網盤連結：https://pan.ba

資料集製作之xml檔案轉化為csv

# -*- coding: utf-8 -*- """ 將資料夾內所有XML檔案的資訊記錄到CSV檔案中 """ import os import glob import pandas as pd import xml.etree.ElementTree as ET os.chdir('

資料集製作之txt轉xml

問題描述：現有images圖片，txt檔案包含四種類別bounding box 座標，需要將txt中兩種類別座標提取出來並轉化成xml檔案。 images資料夾中有18184張圖片，txt資料夾中只有16907個txt檔案（即有一千多張圖片是沒有標註的，需要將這些圖片刪除

論文Multi-Perspective Sentence Similarity Modeling with Convolution Neural Networks實現之資料集製作

1.資料集本文采用的是STS資料集，如下圖所示，包括所有的2012-2016年的資料，而all資料夾包含2012-2015的所有資料。每一個檔案的具體資料如下所示，每一行為一個三元組：<相似性得分，句子1，句子2>. 在實現時將all資料夾中的所有資料當作

影象分割程式碼合集【轉】

原文：http://www.360doc.com/content/12/0201/11/8703626_183332994.shtml Computer Vision Resources Maintained by Jia-Bin Huang Submit resource l

VOC格式資料集製作

rename %% %圖片儲存路徑為： %E:\image\car %E:\image\person %car和person是儲存車和行人的資料夾 %這些資料夾還可以有多個， %放在image資料夾裡就行 %該程式碼的作用是將圖片名字改成000123.jp

VOC2007格式資料集製作

<div class="article-copyright"> 版權宣告：本文為博主原創文章，轉載需宣告出處。 http

關於資料集製作過程中對圖片的一些操作

#給圖片建立資料名稱列表: ls > list.txt 給當目錄下的圖片在當前目錄下一個名為list.txt的圖片名稱列表文字檔案 #在已建立圖片名稱列表文字檔案的前提下，給圖片增添型別號在圖片所在的資料夾下開啟終端，執行下列命令： sed -i “1

maskrcnn標記自己的資料集最全攻略

NVIDIA顯示卡驅動+CUDA+CUDNN GPU平臺搭建。（備註：cuda cudnn的版本一定要對應正確）在github https://github.com/matterport/Mask_RCNN上下載maskrcnn原始碼。要求：python3以上，keras， tens

（單/雙目）影象標定全流程（C++/Opencv實現）---原理篇

最近在做影象標定工作，現對標定相關工作做個總結，以便後續檢視。相關程式碼參考：想要學習目標標定，首先要了解，相機模型中的四個平面座標系，以及他們之間的轉化關係。理論如下： (1)影象畫素座標系(u, v) 以畫素為單位，是以影象的左上方為原點的影象座標系； (2)影象物理座標系（也叫像

MXNET資料集製作，生成rec檔案

https://github.com/apache/incubator-mxnet/blob/master/tools/im2rec.py （一）製作rec資料集（1）下載im2rec.py 檔案（2）python im2rec.py train 檔案地址（內部按類別分成不同的資料夾）

影象分割 | FCN資料集製作的全流程（影象標註）

一 全卷積神經網路

二 影象標籤製作

三 FCN模型訓練

四 測試圖片結果上色

相關推薦

一全卷積神經網路

二影象標籤製作

四測試圖片結果上色