1. 程式人生 > >pandas cut函式快速自定義分類

pandas cut函式快速自定義分類

資料如圖所示


生成未下單間隔列

df['未下單間隔']=df.最近下單時間.map(lambda x :\

                          round((pd.to_datetime('2018-04-08')-pd.to_datetime(x[:10])).total_seconds()/(24*60*60)))

df['未下單分類']=pd.cut(df.未下單間隔,bins=[-1,60,90,1000000],labels=['60天內','60-90天','90天以上'])

df['下單數量分類']=pd.cut(df.下單者數量,bins=[9,14,19,10000000],labels=['10-15單','15-20單','20單以上'])

df.groupby(['未下單分類','下單數量分類']).count()

結果如圖所示


這樣我就能很容易的找出90天以上未下單的,下單數量在10-15單的有多少人了