1. 程式人生 > 其它 >機器學習常用資料集

機器學習常用資料集

人臉檢測演算法

其中,包含了英偉達去年12月開源的人臉資料集FFHQ(Flickr-Faces-HQ),內含7萬張1024×1024解析度的高清人臉大圖。

騰訊開源的Tencent ML-Images專案,其多標籤影象資料集ML-Images包含了1800萬影象和1.1萬多種常見物體類別,比谷歌開源的Open Images資料集還豐富不少。

nlp:

斯坦福大學NLP組的SQuAD 2.0你得了解一下,和一代相比,2.0版在增加對抗性問題的同時,也新增了一項“判斷一個問題能否根據提供的閱讀文字作答”的任務。

CoQA資料集也是斯坦福開發的對話資料集,包含來自8k組對話的127k個帶有答案的問題。這些對話涉及 7 個不同領域,每組對話的平均長度為15輪,每一輪對話都由問題和回答組成。

此外,DeepMind的Q&A問答資料集、微軟的MS MARCO機器閱讀理解資料集、三名中國學生推出的HotpotQA新型問答資料集等,都可以在這份清單中一鍵直達。

audio:

谷歌的大規模音訊資料集AudioSet,包含632類的音訊類別以及2084320 條人工標記的每段10秒的聲音剪輯片段,覆蓋大範圍人類與動物、樂器與音樂流派、日常環境聲音。

谷歌NSynth資料集,收錄了從1000種樂器中採集的大量註釋的音符,包括不同的音高和速率,比同類的公共資料集大了一個數量級。

初創公司Mozilla公佈的Common Voice資料集,內含2萬名英語志願者500小時、40萬份錄音,語料庫也在不斷擴充中。

還有LibriSpeech ASR corpus語音資料集,包括1000小時的英文發音和對應文字,資料來自LibriVox專案的有聲讀物,是一個大型的語料資料庫。

資料集網站

https://www.datasetlist.com/

other:

MegaFace 是由華盛頓大學(University of Washington)電腦科學與工程實驗室於2015年針對名為 ”MegaFace Challenge” 的挑戰而釋出並維 護的公開人臉資料集,是

DAVIS(Densely-Annotated VIdeo Segmentation)資料集是視訊目標分割(VOS)任務中最重要的資料集

之一。從2017年開始,DAVIS官方團隊每年都會舉辦“DAVIS Challeng.

近日崑山杜克大學與AISHELL共同推出了一個基於遠場文字相關的說話人認證資料庫﹣HI-MIA釋出在語音資料開源平臺openslr上(http://www.openslr.org/85/)。