Cityscapes資料集介紹
下載連結是百度雲下載:https://pan.baidu.com/s/1w3W_dQBUiHcwkLOtbSJ1Tg 提取碼:1bln
該資料集的其他講解可以參考https://github.com/mcordts/cityscapesScripts
上面講解的中文版可以參考:https://blog.csdn.net/chishuideyu/article/details/79963072
提取的資料集檔案分佈形式可以看文章最後的那張圖
該資料集包含如下:images_base和annotations_base分別對應這資料夾leftImg8bit(5,030 items, totalling 11.6 GB,factually 5000 items)和gtFine(30,030 items, totalling 1.1 GB)。裡面都包含三個資料夾:train、val、test。
在leftImg8bit/train下有18個子資料夾對應德國的16個城市,法國一個城市和瑞士一個城市:
亞琛 (aachen)(174 items, totalling 379.4 MB)、波鴻(bochum)(96 items, totalling 239.2 MB)、不萊梅(bremen)(316 items, totalling 734.0 MB)、科隆(cologne)(154 items, totalling 355.0 MB)、達姆施塔特(darmstadt)(85 items, totalling 196.4 MB)、杜塞爾多夫(dusseldorf)(221 items, totalling 480.3 MB)
裡面圖片的命名規則是:用_將名字分割成四部分,其中第一部分的設定是該資料夾的名字,第四部分都是leftImg8bit.png,第二部分和第三部分都是六位數字。
aachen:aachen_000000_000019_leftImg8bit.png,第二部分從000000到000173對應174張圖片,第三部分固定是000019
bochum:bochum_000000_000313_leftImg8bit.png,第二部分固定000000,第三部分不固定沒有規則的六位數
bremen:bremen_000000_000019_leftImg8bit.png,第二部分從000000到000315對應316張圖片,第三部分固定000019
cologne:cologne_000000_000019_leftImg8bit.png,第二部分從000000到000153對應154張圖片,第三部分固定000019
darmstadt:darmstadt_000000_000019_leftImg8bit.png,第二部分從000000到000084對應85張圖片,第三部分固定000019
dusseldorf:dusseldorf_000000_000019_leftImg8bit.png,第二部分從000000到000221對應222張圖片,第三部分固定000019
erfurt:erfurt_000000_000019_leftImg8bit.png,第二部分從000000到000108對應109張圖片,第三部分固定000019
hamburg:hamburg_000000_000042_leftImg8bit.png,第二部分固定000000,第三部分不固定
hannover:hannover_000000_000164_leftImg8bit.png,第二部分固定000000,第三部分不固定
jena:jena_000000_000019_leftImg8bit.png,第二部分從000000到000118對應119張圖片,第三部分固定000019
krefeld:krefeld_000000_000108_leftImg8bit.png,第二部分固定000000,第三部分不固定
monchengladbach:monchengladbach_000000_000076_leftImg8bit.png,第二部分固定000000(86張)和000001(8張),第二部分不固定
strasbourg:strasbourg_000000_000065_leftImg8bit.png,第二部分固定000000(144張)和000001(221張),第二部分不固定
stuttgart:stuttgart_000000_000019_leftImg8bit.png,第二部分從000000到000195對應196張圖片,第三部分固定000019
tübingen:tübingen_000000_000019_leftImg8bit.png,第二部分從000000到000143對應144張圖片,第三部分固定000019
ulm:ulm_000000_000019_leftImg8bit.png,第二部分從000000到000094對應95張圖片,第三部分固定000019
weimar:weima_000000_000019_leftImg8bit.png,第二部分從000000到0000141對應142張圖片,第三部分固定000019
zurich:zurich_000000_000019_leftImg8bit.png,第二部分從000000到0000121對應122張圖片,第三部分固定000019
train集總共有2975張png格式的大小為2048 x 1024的0-255的RGB圖片
在leftImg8bit/val下有3個子資料夾對應德國的3個城市:
法蘭克福(frankfurt)(267 items, totalling 644.2 MB)、林道(lindau)(59 items, totalling 139.5 MB)、明斯特(munster)(174 items, totalling 397.7 MB)
裡面圖片的命名規則是:用_將名字分割成四部分,其中第一部分的設定是該資料夾的名字,第四部分都是leftImg8bit.png,第二部分和第三部分都是六位數字。
frankfurt:frankfurt_000000_000294_leftImg8bit.png,第二部分固定000000(51張)和000001(216張),第二部分不固定
lindau:lindau_000000_000019_leftImg8bit.png,第二部分從000000到0000058對應59張圖片,第三部分固定000019
munster:munster_000000_000019_leftImg8bit.png,第二部分從000000到0000173對應174張圖片,第三部分固定000019
val集總共有500張png格式的大小為2048 x 1024的0-255的RGB圖片
在leftImg8bit/test下有6個子資料夾對應德國的6個城市:
柏林(berlin)(544 items, totalling 1.2 GB)、比勒費爾德(bielefeld)(181 items, totalling 414.1 MB)、波恩(bonn)(46 items, totalling 102.9 MB)、勒沃庫森(leverkusen)(58 items, totalling 136.9 MB)、美因茨(mainz)(298 items, totalling 679.2 MB)、慕尼黑(münchen)(398 items, totalling 927.4 MB)
裡面圖片的命名規則是:用_將名字分割成四部分,其中第一部分的設定是該資料夾的名字,第四部分都是leftImg8bit.png,第二部分和第三部分都是六位數字。
berlin:berlin_000000_000019_leftImg8bit.png,第二部分從000000到000543對應544張圖片,第三部分固定000019
bielefeld:bielefeld_000000_000108_leftImg8bit.png,第二部分固定000000,第三部分不固定
bonn:bonn_000000_000019_leftImg8bit.png,第二部分從000000到000045對應46張圖片,第三部分固定000019
leverkusen:leverkusen_000000_000019_leftImg8bit.png,第二部分從000000到000057對應58張圖片,第三部分固定000019
mainz:mainz_000000_000093_leftImg8bit.png,第二部分固定000000(72張)、000001(165張)、000002(7張)和000003(54張),第二部分不固定
münchen:münchen_000000_000019_leftImg8bit.png,第二部分從000000到000397對應398張圖片,第三部分固定000019
test集總共有1525張png格式的大小為2048 x 1024的0-255的RGB圖片
在gtFine/train下有18個子資料夾對應leftImg8bit/train裡面的資料夾,但是不一樣的leftImg8bit裡面的一張原圖,對應著gtFine裡面有6個檔案分別是color.png、instanceIds.png、instanceTrainIds.png、labelIds.png、labelTrainIds.png、polygons.json
檔案的命名方式:資料夾名字_六位數字_六位數字_gtFine_上面的檔案型別;若將檔名字用_分成5部分,其中前面的三部分都和leftImg8bit對應檔案的名字一模一樣只需參考前面的敘述,第四部分固定gtFine,第五部分依次對應上面的檔案型別。和上面命名相比就是這裡有5個部分而不是上面的4個部分。
aachen:
aachen_000000_000019_gtFine_color.png shape=(1024,2048,4)是彩色的,0-255的畫素值,mode=‘RGBA'
aachen_000000_000019_gtFine_instanceIds.png shape=(1024,2048)是灰白的 ,0-255的畫素值, mode='I'
aachen_000000_000019_gtFine_instanceTrainIds.png shape=(1024,2048)是灰白的,0-255的畫素值, mode='I
aachen_000000_000019_gtFine_labelIds.png shape=(1024,2048)是灰白的,mode='L' ,0-255的畫素值,用影象的classid為畫素的值, 總共的類別有classes = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, -1]最後的那個-1表示其他
aachen_000000_000019_gtFine_labelTrainIds.png shape=(1024,2048)是灰白的,0-255的畫素值, mode='L'
aachen_000000_000019_gtFine_polygons.json
但是從官網下載到的資料集卻是4個檔案:color.png、instanceIds.png、labelIds.png、polygons.json,其他和上面的一樣。
下面這張圖片是cityscapes的目錄