1. 程式人生 > >計算機視覺相關資料集和比賽

計算機視覺相關資料集和比賽

Imagenet資料集是目前深度學習影象領域應用得非常多的一個數據集,關於影象分類、定位、檢測等研究工作大多基於此資料集展開。Imagenet資料集有1400多萬幅圖片,涵蓋2萬多個類別;其中有超過百萬的圖片有明確的類別標註和影象中物體位置的標註。Imagenet資料集文件詳細,有專門的團隊維護,使用非常方便,在計算機視覺領域研究論文中應用非常廣,幾乎成為了目前深度學習影象領域演算法效能檢驗的“標準”資料集。
這裡寫圖片描述
與Imagenet資料集對應的有一個享譽全球的“ImageNet國際計算機視覺挑戰賽(ILSVRC)”,目前包含的比賽專案有:
1.目標定位(Object localization)
給定一幅影象,演算法需要生成5個帶有置信度的類別標籤及其分別對應的目標物邊框資訊。演算法準確率的評估是基於與標註的類別標籤最匹配的預測標籤圖片中可能存在多個物體及其對應的標註資訊

和與標註的邊框資訊重疊的預測邊框圖片中可能存在多個同類物體。為什麼這樣做呢?因為這樣就允許演算法識別影象中的多個目標物,並且當其中一個目標物確實存在於影象中但沒有被標註出來時演算法不會受到懲罰。可能說的有不清楚或不正確的地方,大家可以看下官方的評估規則
2.目標檢測(Object detection)
給定一幅影象,演算法需要生成多組(ci,si,bi)形式的預測資訊,其中ci為類別標籤、si為置信度、bi為邊框資訊。需要注意的是,演算法必須檢測出影象中出現的每一個訓練過的目標物,漏檢和重複檢測都會受到懲罰。
3.視訊序列的目標檢測(Object detection from video)
這一項和上一專案標檢測類似。
4.場景分類(Scene classification)
這個比賽使用了
Places2 dataset
,比賽規則是對於給定影象,允許演算法產生5個場景分類,並挑選匹配度最高的作為評估結果,詳看他們的評估規則吧。為什麼這麼做呢?因為同一幅圖片可以包含有多個場景類別,事實上同一幅圖片本來就是用多個類別標註的。
5.場景分析(Scene parsing)
這個比賽的目標是將影象分割成與語義類別相關聯的不同影象區域,如天空,道路,人和床。具體規則見官網咖。

COCO資料集由微軟贊助,其對於影象的標註資訊不僅有類別、位置資訊,還有對影象的語義文字描述,COCO資料集的開源使得近兩三年來影象分割語義理解取得了巨大的進展,也幾乎成為了影象語義理解演算法效能評價的“標準”資料集。Google的開源show and tell生成模型就是在此資料集上測試的。
目前包含的比賽專案有:
1.目標檢測(COCO Detection Challenge),包含兩項比賽:

  • 輸出目標物的邊框即可(using bounding box output),也就是我們常說的目標檢測(object detection)了
  • 要求把目標物從影象中分割出來(object segmentation output),即我們所說的影象語義分割(Semantic image segmentation)

這裡寫圖片描述
2.影象標註(COCO Captioning Challenge)
具體說來就是一句話準確描述圖片上的資訊(producing image captions that are informative and accurate)。那這個怎麼評分呢?目前是靠人工評分。
這裡寫圖片描述
3.人體關鍵點檢測(COCO Keypoint Challenge)
比賽要求是找到人在哪,然後定位到人體的一些關鍵點位置(The keypoint challenge involves simultaneously detecting people and localizing their keypoints)。
這裡寫圖片描述

PASCAL VOC挑戰賽是視覺物件的分類識別和檢測的一個基準測試,提供了檢測演算法和學習效能的標準影象註釋資料集和標準的評估系統。PASCAL VOC圖片集包括20個目錄:人類;動物(鳥、貓、牛、狗、馬、羊);交通工具(飛機、自行車、船、公共汽車、小轎車、摩托車、火車);室內(瓶子、椅子、餐桌、盆栽植物、沙發、電視)。PASCAL VOC挑戰賽在2012年後便不再舉辦,但其資料集影象質量好,標註完備,非常適合用來測試演算法效能。
這裡寫圖片描述

四.CIFAR

CIFAR-10包含10個類別,50,000個訓練影象,彩色影象大小:32x32,10,000個測試影象。CIFAR-100與CIFAR-10類似,包含100個類,每類有600張圖片,其中500張用於訓練,100張用於測試;這100個類分組成20個超類。影象類別均有明確標註。CIFAR對於影象分類演算法測試來說是一個非常不錯的中小規模資料集。
這裡寫圖片描述

深度學習領域的“Hello World!”!MNIST是一個手寫數字資料集,它有60000個訓練樣本集和10000個測試樣本集,每個樣本影象的寬高為28*28。需要注意的是,此資料集是以二進位制儲存的,不能直接以影象格式檢視。
最早的深度卷積網路LeNet便是針對此資料集的,當前主流深度學習框架幾乎無一例外將MNIST資料集的處理作為介紹及入門第一教程。
這裡寫圖片描述

六.KITTI

KITTI由德國卡爾斯魯厄理工學院(Karlsruhe Institute of Technology)和豐田芝加哥技術研究院(Toyota Technological Institute at Chicago)於2012年聯合創辦,是目前國際上最大的自動駕駛場景下的計算機視覺演算法評測資料集。用於評測3D 目標(機動車、非機動車、行人等)檢測、3D 目標跟蹤、道路分割等計算機視覺技術在車載環境下的效能。KITTI包含市區、鄉村和高速公路等場景採集的真實影象資料,每張影象中多達15輛車和30個行人,還有各種程度的遮擋。
這裡寫圖片描述

Cityscapes也是自動駕駛相關方面的資料集,重點關注於畫素級的場景分割和例項標註
這裡寫圖片描述

在這個資料集上,基於深度學習的系統DeepID2可以達到99.47%的識別率。
這裡寫圖片描述

相關推薦

計算機視覺相關資料比賽

Imagenet資料集是目前深度學習影象領域應用得非常多的一個數據集,關於影象分類、定位、檢測等研究工作大多基於此資料集展開。Imagenet資料集有1400多萬幅圖片,涵蓋2萬多個類別;其中有超過百萬的圖片有明確的類別標註和影象中物體位置的標註。Image

計算機視覺(影象分類、檢測、分割)資料比賽

1 ImageNet資料集和ILSVRC Imagenet資料集是目前深度學習影象領域應用得非常多的一個數據集,關於影象分類、定位、檢測等研究工作大多基於此資料集展開。Imagenet資料集有1400多萬幅圖片,涵蓋2萬多個類別;其中有超過百萬的圖片有明確的類

計算機視覺著名資料CV Datasets

This dataset consists of a set of actions collected from various sports which are typically featured on broadcast television channels such as the BBC and E

CVonline: Image Databases 計算機視覺影象資料

Index by Topic Another helpful site is the YACVID page. Action Databases Biological/Medical 2008 MICCAI MS Lesion Segmentation Challe

計算機視覺標準資料整理—PASCAL VOC資料

資料集下載 PASCAL VOC為影象識別和分類提供了一整套標準化的優秀的資料集,從2005年到2012年每年都會舉行一場影象識別challenge。此資料集可以用於影象分類、目標檢測、影象分割。 資料集下載映象地址如下(包括VOC2007和VOC2012):

計算機視覺標準資料整理—CIFAR-100資料

CIFAR-100資料集(用作100類的影象分類) 這個資料集和CIFAR-10相比,它具有100個類,大約600張/類,每類500張訓練,500張測試; 這100類又可以grouped成20

計算機視覺標準資料整理—COCO資料

COCO資料集由微軟贊助,其對於影象的標註資訊不僅有類別、位置資訊,還有對影象的語義文字描述,COCO資料集的開源使得近兩三年來影象分割語義理解取得了巨大的進展,也幾乎成為了影象語義理解演算法效能評價的“標準”資料集。Google的開源show and tell生成模型就是在此資料集上測試的。  這個資料

機器學習計算機視覺相關的數學

感覺數學似乎總是不夠的。這些日子為了解決research中的一些問題,又在圖書館捧起了數學的教科書。從大學到現在,課堂上學的和自學的數學其實不算少了,可是在研究的過程中總是發現需要補充新的數學知識。Learning和Vision都是很多種數學的交匯場。看著不同的理論體系的交匯,對於一個researcher

【Computer Vision】計算機視覺相關課程書籍

Table of Contents Books Computer Vision OpenCV Programming OpenCV Essentials - Oscar Deniz Suarez, Mª del Milagr

機器學習計算機視覺相關的數學(from LinDahua)

感覺數學似乎總是不夠的。這些日子為了解決research中的一些問題,又在圖書館捧起了數學的教科書。從大學到現在,課堂上學的和自學的數學其實不算少了,可是在研究的過程中總是發現需要補充新的數學知識。Learning和Vision都是很多種數學的交匯場。看著不同的理論體系的交匯,對於一個researcher

機器視覺中常用開源資料免費標註工具

科技巨頭如Google,微軟,亞馬遜等都紛紛宣佈在AI領域佈局,AI的影響隨著深度學習的應用日益深入。機器視覺作為一個熱門子領域,無論是在傳統金融行業還是最新自動駕駛領域都掀起了一股學習應用的浪潮。這是多麼棒的一件事啊!但是我們應該如何簡單的開始研究機器視覺?以下是幾個主要的

深度學習及計算機視覺相關資源(不斷更新)

LSTM:  http://colah.github.io/posts/2015-08-Understanding-LSTMs/ 深度學習領域PyTorch專案-git原始碼整理 https://blog.csdn.net/u012969412/article/details/774792

神經網路中訓練資料、驗證資料測試資料的區別

whats the difference between train, validation and test set, in neural networks? Answer: The training and validation sets are used during t

計算機視覺相關專業的JCR一區期刊

前提 目前國內很多人才計劃都是根據jcr1區的論文數量來評判不同的人才計劃的等級,目前大部分省市採用的還是wos的分割槽,而不是中科院分割槽。 資料來源 https://www.scimagojr.com/index.php 期刊 computer vi

計算機視覺技術資料留存

2018年11月 《機器學習100天》 深度學習影象識別的未來:機遇與挑戰並存 英偉達的“千人摩擦計劃” 預訓練模型遷移學習 2018年10月 為中共中央政治局講授新一代人工智慧課程 高文院士:從大資料時代來到人工智慧時代,我們走了多遠了? 高文院士:國家新一

11.何時需要改變資料衡量指標 翻譯自 吳恩達新書-Machine Learning Yearning

當開始一個新的專案時,我會快速的選擇開發和測試資料集,這樣可以給團隊定出明確的目標。 我一般會要求我的團隊在一週內,提出初始的開發/測試資料集和初始的衡量指標。一開始的想法不完美並沒關係,但是要快,千萬不能過度思考。但是這一做法不適合成熟的機器學習應用,比如反

Power BI 資料資料重新整理

PowerBI報表是基於資料分析的引擎,資料真正的來源(Data Source)是資料庫,檔案等資料儲存媒介,PowerBI支援的資料來源型別多種多樣。PowerBI Service(雲端)有時不直接訪問Data Source,而是直接從PowerBI Service建立的資

計算機視覺 | 計算機視覺相關演算法及工具

博主github:https://github.com/MichaelBeechan    博主CSDN:https://blog.csdn.net/u011344545    計算機視覺資料集:https://github.com/Michael

CS231n 卷積神經網路與計算機視覺 6 資料預處理 權重初始化 規則化 損失函式 等常用方法總結

1 資料處理 首先註明我們要處理的資料是矩陣X,其shape為[N x D] (N =number of data, D =dimensionality). 1.1 Mean subtraction 去均值 去均值是一種常用的資料處理方式.它是將各個特徵值減去其均

計算機視覺相關材料

距離變換和線性濾波器,形態學變換處於平等位置,是影象處理的一種方法,通過使用兩遍掃描光柵演算法可以快速計算到曲線或點集的距離。 應用: 水平集 快速斜切匹配 影象拼接 影象混合的羽化 臨近點配準 方法: 首先對影象進行二值化處理,然後給每個畫素賦值為離它最近的背景畫素點與其距離(Manhattan距離o