1. 程式人生 > >下載kaggle資料集

下載kaggle資料集

下載kaggle資料集

在kaggle上下載資料集需要使用kaggle給定的API,在shell中進行命令操作即可下載

首先,需要安裝pip

然後,安裝kaggle,使用如下命令:

pip install kaggle

之後,註冊並登陸kaggle網站,在my account中,下載對應需要的kaggle.json檔案,如下圖:

登入後找到對應的my account

在這裡插入圖片描述

找到下載檔案對應的地方

2

下載檔案完成。

在linux中,需要將對應的kaggle.json 檔案放置在~.kaggle目錄下,之後便可以執行命令下載需要的檔案了,執行的命令如下,我要下載的是kdd2012的資料集,命令在對應頁面會提供:

在這裡插入圖片描述

使用命令即可下載檔案,但是國內下載一般巨慢!!!

核心-使用伺服器加速

本人有一個搬瓦工伺服器,節點在洛杉磯,由於在本地的速度基本為0,不得已使用伺服器下載至伺服器,再通過FTP服務下載到本地。

實驗證明:境外節點下載資料超級快,回傳本地相對來講,也是很不錯的!