COCO資料集轉mask

阿新 • • 發佈：2020-07-02

書接上文，先馬克一下，之後再改

# -*- coding: utf-8 -*-
"""
Created on Wed Jul  1 14:45:07 2020

@author: mhshao
"""
from pycocotools.coco import COCO
import os
import shutil
from tqdm import tqdm
import matplotlib.pyplot as plt
import cv2
from PIL import Image, ImageDraw
import skimage.io as io
import json
import numpy as np
 
'''
路徑引數
'''
#原coco資料集的路徑
dataDir= 'newdata/'
#用於儲存新生成的mask資料的路徑
savepath = "newdata/"

'''
資料集引數
'''
#coco有80類，這裡寫要進行二值化的類的名字
#其他沒寫的會被當做背景變成黑色
#如我只需要car、bus、truck這三類資料
classes_names = ['car','bus','truck']  
#要處理的資料集，比如val2017、train2017等
#不建議多個數據集在一個list中
#一次提取一個數據集安全點_(:3」∠❀)_
datasets_list = ['val2017 
']

#生成儲存路徑，函式抄的(›´ω`‹ )
#if the dir is not exists,make it,else delete it
def mkr(path):
    if os.path.exists(path):
        shutil.rmtree(path)
        os.mkdir(path)
    else:
        os.mkdir(path)
        
#生成mask圖
def mask_generator(coco,width,height,anns_list):
    mask_pic  
= np.zeros((height, width))
    #生成mask
    for single in anns_list:
            mask_single = coco.annToMask(single)
            mask_pic += mask_single
    #轉化為255
    for row in range(height):
            for col in range(width):
                if (mask_pic[row][col] > 0):
                    mask_pic[row][col] = 255
    mask_pic = mask_pic.astype(int)
    '''
    #轉為三通道
    imgs = np.zeros(shape=(height, width, 3), dtype=np.float32)
    imgs[:, :, 0] = mask_pic[:, :]
    imgs[:, :, 1] = mask_pic[:, :]
    imgs[:, :, 2] = mask_pic[:, :]
    imgs = imgs.astype(int)
    '''    
    return mask_pic
    
#處理json資料並儲存二值mask
def get_mask_data(annFile,mask_to_save):
    #獲取COCO_json的資料
    coco = COCO(annFile)
    #拿到所有需要的圖片資料的id
    classes_ids = coco.getCatIds(catNms = classes_names)
    #取所有類別的並集的所有圖片id
    #如果想要交集，不需要迴圈，直接把所有類別作為引數輸入，即可得到所有類別都包含的圖片
    imgIds_list = []
    for idx in classes_ids:
        imgidx = coco.getImgIds(catIds=idx)
        imgIds_list += imgidx
    #去除重複的圖片
    imgIds_list = list(set(imgIds_list))
    
    #一次性獲取所有影象的資訊
    image_info_list = coco.loadImgs(imgIds_list)
    
    #對每張圖片生成一個mask
    for imageinfo in image_info_list:
        #獲取對應類別的分割資訊
        annIds = coco.getAnnIds(imgIds = imageinfo['id'], catIds = classes_ids, iscrowd=None)
        anns_list = coco.loadAnns(annIds)
        #生成二值mask圖
        mask_image = mask_generator(coco,imageinfo['width'],imageinfo['height'],anns_list)
        #儲存圖片
        file_name = mask_to_save + '/' +imageinfo['file_name'][:-4]+'.png'
        plt.imsave(file_name , mask_image)
#儲存資料到json
def save_json_data(json_file,classes_list,image_info_list,anns_list):
    coco_sub = dict()
    coco_sub['info'] = dict()
    coco_sub['licenses'] = []
    coco_sub['images'] = []
    coco_sub['type'] = 'instances'
    coco_sub['annotations'] = []
    coco_sub['categories'] = []
    #以下非必須,為coco資料集的字首資訊
    coco_sub['info']['description'] = 'COCO 2017 sub Dataset'
    coco_sub['info']['url'] = 'https://www.cnblogs.com/lhdb/'
    coco_sub['info']['version'] = '1.0'
    coco_sub['info']['year'] = 2020
    coco_sub['info']['contributor'] = 'smh'
    coco_sub['info']['date_created'] = '2020-7-1 10:06'
    sub_license = dict()
    sub_license['url'] =  'https://www.cnblogs.com/lhdb/'
    sub_license['id'] = 1
    sub_license['name'] = 'Attribution-NonCommercial-ShareAlike License'
    coco_sub['licenses'].append(sub_license)
    #以下為必須插入資訊,包括image、annotations、categories三個欄位
    #插入image資訊
    coco_sub['images'].extend(image_info_list)
    #插入annotation資訊
    coco_sub['annotations'].extend(anns_list)
    #插入categories資訊
    coco_sub['categories'].extend(classes_list)
    #自此所有該插入的資料就已經插入完畢啦٩(๑╹ꇴ╹)۶
    #最後一步，儲存資料
    json.dump(coco_sub, open(json_file, 'w'))
    
    
if __name__ == '__main__':
    #按單個數據集進行處理
    for dataset in datasets_list:
        #用來儲存最後生成的mask影象目錄
        mask_to_save = savepath + 'masks/' + dataset
        mkr(savepath + 'masks/')
        #生成路徑
        mkr(mask_to_save)

        #獲取要處理的json檔案路徑
        #我這裡用了之前自己生成的部分類別json
        #具體方法見我前一篇部落格
        annFile='{}/annotations/instances_{}_sub.json'.format(dataDir,dataset)
        #處理資料
        get_mask_data(annFile,mask_to_save)
        print('Got all the masks of {} from {} ٩( ๑╹ ꇴ ╹)۶'.format(classes_names,dataset))

000000001532.png

000000097924.png

000000121242.png

COCO資料集轉mask

書接上文，先馬克一下，之後再改 # -*- coding: utf-8 -*- \"\"\" Created on Wed Jul1 14:45:07 2020

COCO資料集提取自己需要的類轉VOC

github:https://github.com/zcc720/COCO2VOC.git 原文地址：http://www.manongjc.com/article/28607.html

labelme轉coco資料集

檔案目錄如下： |-- images ---1.jpg ---1.json ---2.jpg ---2.json ---....... |-- labelme2coco.py

Lab-COCO資料集json格式轉txt格式

COCO資料集: JSON轉txt JSON檔案示例程式碼 #COCO 格式的資料集轉化為 YOLO 格式的資料集

將labelme格式資料轉化為標準的coco資料集格式方式

labelme標註影象生成的json格式： { \"version\": \"3.11.2\",\"flags\": {},\"shapes\": [# 每個物件的形狀

VOC、COCO資料集類別

技術標籤：CV資料處理VOCcoco類別標籤label 目錄 VOC（20類）： COCO（全90類）： COCO（檢測、分割所用80類）：

將json格式資料集轉化為record格式

技術標籤：程式碼pythontensorflow深度學習將json格式資料集轉化為record格式在進行tensorflow訓練時需要record格式的資料，本教程講解如何將常用的json檔案格式轉化成record格式的檔案。

VOC資料集與COCO資料集

技術標籤：深度學習深度學習說明：以下程式碼全部為完整的，但是其中路徑不是一個專案，可根據自己情況修改，僅供參考！個人筆記，一起學習！！ VOC2007：中包含9963張標註過的圖片，由train/val/test三部分組

VOC資料集和COCO資料集直接的相互轉換

VOC資料集（xml格式）和COCO資料集（json格式）的相互轉換我們先來看看voc和coco資料集的目錄結構：以VOC2012資料集為例，下載下來有如下五個資料夾：Annotations資料夾是存放圖片對應的xml檔案，比如“2007_0000

將 KITTI資料集的點雲和影象轉成Bag格式

這裡需要注意的是隻能轉同步標定後的資料，也就是資料集裡面的[synced+rectified data]這個選項，同時記得把後面的標定檔案下載下來，[calibration]。

目標檢測 – 解析VOC和COCO格式並製作自己的資料集

http://www.xyu.ink/3612.html xhy2020年10月9日無評論　　相對其他計算機視覺任務，目標檢測演算法的資料格式更為複雜。為了對資料進行統一的處理，目標檢測資料一般都會做成VOC或者COCO的格式。　　VOC和COCO都

[轉]開源語音資料集

ASR 測試集本文為CSDN博主「chenghaoy」的原創文章, 原文連結：https://blog.csdn.net/chenghaoy/article/details/82842151

201971010229-劉轉弟實驗三軟體工程結對專案-《D{0-1}KP問題例項資料集演算法實驗平臺》

專案內容課程班級部落格連結 2019級卓越工程師班這個作業要求連結作業要求我的課程學習目標

voc資料集（xml）轉yolov5資料格式（txt）訓練自己的資料集

#為方便自己檢視，比較囉嗦。。。。。 1、資料集劃分（程式碼來自別人的分享專案中的一個檔案，在專案中能跑通，單獨檔案能否跑通，還沒試）：

Spark 系列（三）—— 彈性式資料集RDDs

彈性式資料集RDDs 一、RDD簡介 RDD 全稱為 Resilient Distributed Datasets，是 Spark 最基本的資料抽象，它是隻讀的、分割槽記錄的集合，支援並行操作，可以由外部資料集或其他 RDD 轉換而來，它具有以下特性：

SQLserver中cube：多維資料集例項詳解

1、cube:生成多維資料集，包含各維度可能組合的交叉表格，使用with 關鍵字連線 with cube

Pytorch 神經網路—自定義資料集上實現教程

第一步、匯入需要的包 import os import scipy.io as sio import numpy as np import torch import torch.nn as nn

pytorch 批次遍歷資料集列印資料的例子

我就廢話不多說了，直接上程式碼吧！ from os import listdir import os from time import time

python KNN演算法實現鳶尾花資料集分類

一、knn演算法描述 1.基本概述 knn演算法，又叫k-近鄰演算法。屬於一個分類演算法，主要思想如下：

使用 PyTorch 實現 MLP 並在 MNIST 資料集上驗證方式

簡介這是深度學習課程的第一個實驗，主要目的就是熟悉 Pytorch 框架。MLP 是多層感知器，我這次實現的是四層感知器，程式碼和思路參考了網上的很多文章。個人認為，感知器的程式碼大同小異，尤其是用 Pytorch 實現，

COCO資料集轉mask

相關推薦