無人駕駛之測試資料集
目前,全球主流的自動駕駛測試資料集包括Cityscapes、Imagenet(ILSVRC)、COCO、PASCAL VOC、CIFAR、MNIST、KITTI、LFW等。
1.Cityscapes
Cityscapes是由賓士於2015年推出的,提供無人駕駛環境下的影象分割資料集。用於評估視覺演算法在城區場景語義理解方面的效能。
Cityscapes包含50個城市不同場景、不同背景、不同季節的街景,提供5000張精細標註的影象、20000張粗略標註的影象、30類標註物體。用PASCAL VOC標準的 intersection-over-union(IoU)得分來對演算法效能進行評價。
Cityscapes是目前公認的自動駕駛領域內最具權威性和專業性的影象語義分割評測集之一,其關注真實場景下的城區道路環境理解,任務難度更高且更貼近於自動駕駛等熱門需求。
2.KITTI
KITTI是由德國卡爾斯魯厄理工學院和豐田芝加哥技術研究院於2012年聯合創辦,是目前國際上最大的自動駕駛場景下的計算機視覺演算法評測資料集。KITTI用於評測3D目標(機動車、非機動車、行人等)檢測、3D 目標跟蹤、道路分割等計算機視覺技術在車載環境下的效能。KITTI包含市區、鄉村和高速公路等場景採集的真實影象資料,每張影象中多達15輛車和30個行人,還有各種程度的遮擋。
3.ILSVRC
ILSVRC也就是通常所說的Imagenet資料集,是美國斯坦福的電腦科學家李飛飛模擬人類的識別系統建立的。
它是目前深度學習影象領域應用較多的一個數據集,關於影象分類、定位、檢測等研究工作大多基於此資料集展開。Imagenet資料集有1400多萬幅圖片,涵蓋2萬多個類別;其中有超過百萬的圖片有明確的類別標註和影象中物體位置的標註。
4.COCO
COCO(common objects Dataset)資料集,它由微軟贊助,除了基本的影象的標註資訊外,還有對影象的語義文字描述,COCO資料集的特點是開源,這使得它在近三來在影象分割語義理解領域取得了巨大的進展,Google的開源show and tell生成模型就是在此資料集上測試的。
5.PASCAL VOC
PASCAL VOC是視覺物件的分類識別和檢測的一個基準測試,提供了檢測演算法和學習效能的標準影象註釋資料集和標準的評估系統。雖然它在2012年後便不再舉辦,但其資料集影象質量好,標註完備,非常適合用來測試演算法效能。
6.CIFAR
CIFAR(Canada Institude For Advanced Research)包括CIFAR 10和CIFAR 100兩個資料集,它們被標記為8000萬個微型影象資料集的子集。
這些資料集是由Vinod Nair、Alex Krizhevsky和Geoffrey Hinton收集的。CIFAR對於影象分類演算法測試來說是一個非常不錯的中小規模資料集。
7.MNIST
MNIST(THE MNIST DATABASE of handwritten digits)號稱深度學習領域的“Hello World!”,是一個手寫的 數字資料集。當前主流深度學習框架幾乎無一例外將MNIST資料集的處理作為介紹及入門第一教程。
8.nuScenes
NuTonomy編輯了1000多個場景,其中包含140萬幅影象、40萬次鐳射雷達掃描(判斷物體之間距離)和110萬個三維邊界框(用RGB相機、雷達和鐳射雷達組合檢測的物體)。
註冊登入下載免費資料集