1. 程式人生 > >Cityscapes資料集介紹

Cityscapes資料集介紹

下載連結是百度雲下載:https://pan.baidu.com/s/1w3W_dQBUiHcwkLOtbSJ1Tg     提取碼:1bln

該資料集的其他講解可以參考https://github.com/mcordts/cityscapesScripts

上面講解的中文版可以參考:https://blog.csdn.net/chishuideyu/article/details/79963072

提取的資料集檔案分佈形式可以看文章最後的那張圖

該資料集包含如下:images_base和annotations_base分別對應這資料夾leftImg8bit(5,030 items, totalling 11.6 GB,factually 5000 items)和gtFine(30,030 items, totalling 1.1 GB)。裡面都包含三個資料夾:train、val、test。

在leftImg8bit/train下有18個子資料夾對應德國的16個城市,法國一個城市和瑞士一個城市:

亞琛 (aachen)(174 items, totalling 379.4 MB)、波鴻(bochum)(96 items, totalling 239.2 MB)、不萊梅(bremen)(316 items, totalling 734.0 MB)、科隆(cologne)(154 items, totalling 355.0 MB)、達姆施塔特(darmstadt)(85 items, totalling 196.4 MB)、杜塞爾多夫(dusseldorf)(221 items, totalling 480.3 MB

埃爾福特(erfurt)(109 items, totalling 234.5 MB)、漢堡(hamburg)(248 items, totalling 617.4 MB)、漢諾威(hannover)(196 items, totalling 466.8 MB)、耶拿(jena)(119 items, totalling 270.3 MB)、克雷費爾德(krefeld)(99 items, totalling 227.0 MB)、門興格拉德巴赫(monchengladbach)(94 items, totalling 214.9 MB)、斯特拉斯堡strasbourg(法國)(365 items, totalling 866.5 MB)、斯圖加特(stuttgart)(
196 items, totalling 457.8 MB圖賓根 (tübingen)(144 items, totalling 359.8 MB)、烏爾姆(ulm)(95 items, totalling 216.7 MB)、魏瑪(weimar)(142 items, totalling 338.7 MB)、蘇黎世(zurich)(瑞士)(122 items, totalling 291.4 MB

裡面圖片的命名規則是:用_將名字分割成四部分,其中第一部分的設定是該資料夾的名字,第四部分都是leftImg8bit.png,第二部分和第三部分都是六位數字。

aachen:aachen_000000_000019_leftImg8bit.png,第二部分從000000到000173對應174張圖片,第三部分固定是000019

bochum:bochum_000000_000313_leftImg8bit.png,第二部分固定000000,第三部分不固定沒有規則的六位數

bremen:bremen_000000_000019_leftImg8bit.png,第二部分從000000到000315對應316張圖片,第三部分固定000019

cologne:cologne_000000_000019_leftImg8bit.png,第二部分從000000到000153對應154張圖片,第三部分固定000019

darmstadt:darmstadt_000000_000019_leftImg8bit.png,第二部分從000000到000084對應85張圖片,第三部分固定000019

dusseldorf:dusseldorf_000000_000019_leftImg8bit.png,第二部分從000000到000221對應222張圖片,第三部分固定000019

erfurt:erfurt_000000_000019_leftImg8bit.png,第二部分從000000到000108對應109張圖片,第三部分固定000019

hamburg:hamburg_000000_000042_leftImg8bit.png,第二部分固定000000,第三部分不固定

hannover:hannover_000000_000164_leftImg8bit.png,第二部分固定000000,第三部分不固定

jena:jena_000000_000019_leftImg8bit.png,第二部分從000000到000118對應119張圖片,第三部分固定000019

krefeld:krefeld_000000_000108_leftImg8bit.png,第二部分固定000000,第三部分不固定

monchengladbach:monchengladbach_000000_000076_leftImg8bit.png,第二部分固定000000(86張)和000001(8張),第二部分不固定

strasbourg:strasbourg_000000_000065_leftImg8bit.png,第二部分固定000000(144張)和000001(221張),第二部分不固定

stuttgart:stuttgart_000000_000019_leftImg8bit.png,第二部分從000000到000195對應196張圖片,第三部分固定000019

tübingen:tübingen_000000_000019_leftImg8bit.png,第二部分從000000到000143對應144張圖片,第三部分固定000019

ulm:ulm_000000_000019_leftImg8bit.png,第二部分從000000到000094對應95張圖片,第三部分固定000019

weimar:weima_000000_000019_leftImg8bit.png,第二部分從000000到0000141對應142張圖片,第三部分固定000019

zurich:zurich_000000_000019_leftImg8bit.png,第二部分從000000到0000121對應122張圖片,第三部分固定000019

train集總共有2975張png格式的大小為2048 x 1024的0-255的RGB圖片

在leftImg8bit/val下有3個子資料夾對應德國的3個城市:

法蘭克福frankfurt)(267 items, totalling 644.2 MB)、林道(lindau)(59 items, totalling 139.5 MB)、明斯特(munster)(174 items, totalling 397.7 MB

裡面圖片的命名規則是:用_將名字分割成四部分,其中第一部分的設定是該資料夾的名字,第四部分都是leftImg8bit.png,第二部分和第三部分都是六位數字。

frankfurt:frankfurt_000000_000294_leftImg8bit.png,第二部分固定000000(51張)和000001(216張),第二部分不固定

 lindau:lindau_000000_000019_leftImg8bit.png,第二部分從000000到0000058對應59張圖片,第三部分固定000019

munster:munster_000000_000019_leftImg8bit.png,第二部分從000000到0000173對應174張圖片,第三部分固定000019

val集總共有500張png格式的大小為2048 x 1024的0-255的RGB圖片

在leftImg8bit/test下有6個子資料夾對應德國的6個城市:

柏林berlin)(544 items, totalling 1.2 GB)、比勒費爾德(bielefeld)(181 items, totalling 414.1 MB)、波恩(bonn)(46 items, totalling 102.9 MB)、勒沃庫森(leverkusen)(58 items, totalling 136.9 MB)、美因茨(mainz)(298 items, totalling 679.2 MB)、慕尼黑(münchen)(398 items, totalling 927.4 MB)

裡面圖片的命名規則是:用_將名字分割成四部分,其中第一部分的設定是該資料夾的名字,第四部分都是leftImg8bit.png,第二部分和第三部分都是六位數字。

berlin:berlin_000000_000019_leftImg8bit.png,第二部分從000000到000543對應544張圖片,第三部分固定000019

bielefeld:bielefeld_000000_000108_leftImg8bit.png,第二部分固定000000,第三部分不固定

 bonn:bonn_000000_000019_leftImg8bit.png,第二部分從000000到000045對應46張圖片,第三部分固定000019

leverkusen:leverkusen_000000_000019_leftImg8bit.png,第二部分從000000到000057對應58張圖片,第三部分固定000019

mainz:mainz_000000_000093_leftImg8bit.png,第二部分固定000000(72張)、000001(165張)、000002(7張)和000003(54張),第二部分不固定

münchen:münchen_000000_000019_leftImg8bit.png,第二部分從000000到000397對應398張圖片,第三部分固定000019

test集總共有1525張png格式的大小為2048 x 1024的0-255的RGB圖片

在gtFine/train下有18個子資料夾對應leftImg8bit/train裡面的資料夾,但是不一樣的leftImg8bit裡面的一張原圖,對應著gtFine裡面有6個檔案分別是color.png、instanceIds.png、instanceTrainIds.png、labelIds.png、labelTrainIds.png、polygons.json

檔案的命名方式:資料夾名字_六位數字_六位數字_gtFine_上面的檔案型別;若將檔名字用_分成5部分,其中前面的三部分都和leftImg8bit對應檔案的名字一模一樣只需參考前面的敘述,第四部分固定gtFine,第五部分依次對應上面的檔案型別。和上面命名相比就是這裡有5個部分而不是上面的4個部分。

aachen:

aachen_000000_000019_gtFine_color.png     shape=(1024,2048,4)是彩色的,0-255的畫素值,mode=‘RGBA'

aachen_000000_000019_gtFine_instanceIds.png     shape=(1024,2048)是灰白的 ,0-255的畫素值, mode='I'

aachen_000000_000019_gtFine_instanceTrainIds.png     shape=(1024,2048)是灰白的,0-255的畫素值, mode='I

aachen_000000_000019_gtFine_labelIds.png     shape=(1024,2048)是灰白的,mode='L'  ,0-255的畫素值,用影象的classid為畫素的值, 總共的類別有classes = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, -1]最後的那個-1表示其他

aachen_000000_000019_gtFine_labelTrainIds.png     shape=(1024,2048)是灰白的,0-255的畫素值, mode='L'

aachen_000000_000019_gtFine_polygons.json 

但是從官網下載到的資料集卻是4個檔案:color.png、instanceIds.png、labelIds.png、polygons.json,其他和上面的一樣。

 

下面這張圖片是cityscapes的目錄