python | 對時間點的處理
阿新 • • 發佈:2019-01-27
做分析時遇到精確到小時的時間點,需要對月、天、時間來單獨分析。
以我遇到的一個問題作為例子來說明。
2011-01-01 06:00:00
2011-01-01 07:00:00
2011-01-01 08:00:00
。
。
。
等,需要抽出月、天、小時這樣的資料單獨分析,如何做呢?
幸好,pandas可以提供這樣的函式。
import pandas as pd
#讀資料
df_train = pd.read_csv('kaggle_bike_competition_train.csv',header = 0)
#列名
df_train.dtypes
# 把月、日、和 小時單獨分出來,放到3列中
df_train['month'] = pd.DatetimeIndex(df_train.datetime).month
df_train['day'] = pd.DatetimeIndex(df_train.datetime).dayofweek
df_train['hour'] = pd.DatetimeIndex(df_train.datetime).hour
這樣就有額外的3個列