[轉貼]太有用了,留存!Kaggle資料下載
注:轉帖自知乎
各領域公開資料集下載
趙熙 謙謙君子,卑以自牧整理了一些網上的免費資料集,分類下載地址如下,希望能節約大家找資料的時間。歡迎資料達人加入QQ群 674283733 交流。
金融
滬深股票除權除息、配股增發全量資料,截止 2016.12.31
上證主機板日線資料,截止 2017.05.05,原始價、前復權價、後復權價,1260支股票
深證主機板日線資料,截止 2017.05.05,原始價、前復權價、後復權價,466支股票
深證中小板日線資料,截止 2017.05.05,原始價、前復權價、後復權價,852支股票
深證創業板日線資料,截止 2017.05.05,原始價、前復權價、後復權價,636支股票
上證A股日線資料,1999.12.09至 2016.06.08,前復權,1095支股票
深證A股日線資料,1999.12.09至 2016.06.08,前復權,1766支股票
深證創業板日線資料,1999.12.09 至2016.06.08,前復權,510支股票
Zillow 網站房地產價值預測競賽資料【Kaggle競賽】
Sberbank 俄羅斯房地產價值預測競賽資料【Kaggle競賽】
交通
運用衛星資料跟蹤亞馬遜熱帶雨林中的人類軌跡競賽【Kaggle競賽】
紐約出租車管理委員會官方的乘車資料(2009年-2016年)
商業
Bosch 生產流水線降低次品率競賽資料【Kaggle競賽】
Airbnb 新使用者的民宿預定預測競賽資料【Kaggle競賽】
Grupo Bimbo 麵包店庫存和銷量預測競賽【Kaggle競賽】
推薦系統
Book CrossingLarge MovieReview
醫療健康
美國國家健康與服務部-國家癌症研究所發起的癌症資料倉庫介紹【僅有介紹】
Data ScienceBowl 2017 肺癌識別競賽資料【資料太大僅有介紹】
SPIE-AAPM-NCIPROSTATEx競賽第1部分資料(MRI核磁共振影像識別前列腺癌程度資料)SPIE-AAPM-NCIPROSTATEx競賽第2部分資料(MRI核磁共振影像識別前列腺癌程度資料)RIDER Breast 乳腺癌 MRI影像資料
從 CT 影像中對肺部影像進行分割並識別肺部容積【Kaggle競賽】
通過Egg腦電影象預測患者癲癇病發作競賽【Kaggle競賽】
影象資料
綜合影象
ILSVRC 2014 訓練資料(ImageNet的一部分)
PASCAL VisualObject Classes 2012 影象資料
PASCAL VisualObject Classes 2011 影象資料
PASCAL VisualObject Classes 2010 影象資料
80 Million TinyImage 影象資料【資料太大僅有介紹】
場景影象
Web標籤影象
人形輪廓影象
視覺文字識別影象
Street ViewHouse Number 門牌號影象資料
NIST HandprintedForms and Characters 手寫英文字元資料
NIST StructuredForms Reference Set of Binary Images (SFRS) 影象資料
NIST StructuredForms Reference Set of Binary Images (SFRS) II 影象資料
特定一類事物影象
Labeled Fishesin the Wild 魚類影象
NatureConservancy Fisheries Monitoring 過度捕撈監控影象資料【Kaggle資料】
材質紋理影象
物體分類影象
人臉影象
Extended YaleFace Database B 人臉資料
FDDB_FaceDetection Data Set and Benchmark
NIST MugshotIdentification DatabaseFaces in theWild 人臉資料
姿勢動作影象
HMDB_a largehuman motion database
Human Actionsand Scenes Dataset
Human PoseEvaluator 人體輪廓識別影象資料
VGG Human PoseEstimation 姿勢影象標註資料
指紋識別
NISTSupplemental Fingerprint Card Data (SFCD) 指紋識別資料
NIST Plain andRolled Images from Paired Fingerprint Cards in 500 pixels per inch 指紋識別資料
NIST Plain andRolled Images from Paired Fingerprint Cards 1000 pixels per inch 指紋識別資料
其它影象資料
Visual QuestionAnswering V1.0 影象資料
Visual QuestionAnswering V2.0 影象資料
視訊資料
綜合視訊
DAVIS_DenselyAnnotated Video Segmentation 資料
人類動作視訊
MicrosoftResearch Action 人類動作視訊資料
UCF50 Action Recognition動作識別資料
UCF101 ActionRecognition 動作識別資料
Recognition ofhuman actions 動作視訊資料
SBU KinectInteraction 肢體動作視訊資料
目標檢測視訊
密集人群視訊
Tracking in HighDensity Crowds 高密度人群視訊
其它視訊
音訊資料
綜合音訊
Google Audioset 音訊資料【資料太大僅有介紹】
語音識別
Room ImpulseResponse and Noise 語音資料
自然語言處理
First QuoraRelease Question Pairs 問答資料
Yale YoutubeVedio Text斯坦福問答資料【Kaggle資料】
NIPS會議文章資訊資料(1987-2016)【Kaggle資料】
EuropeanParliament Proceedings Parallel Corpus 機器翻譯資料
StanfordSentiment Treebank 詞彙資料
社會資料
世界大學排名芝加哥犯罪資料(2001-2017)【Kaagle資料】
世界範圍顯著地震資料(1965-2016)【Kaagle資料】
希拉里 vs 特朗普競選期間 Twitter 資料【Kaggle競賽】
處理後的科研和競賽資料
Social ComputingData Repository 社交網路資料
根據手機應用軟體使用行為預測使用者性別年齡競賽資料【Kaggle競賽】
釋出於 2017-02-08