python之pandas分組統計
阿新 • • 發佈:2019-01-02
Pandas分組統計佔比
資料例如:
美贊臣標籤 2017-11-15 MOB 女性 110548715660
美贊臣標籤 2017-11-15 MOB 男性 104342715471
美贊臣標籤 2017-11-15 PC 女性 398273 887
美贊臣標籤 2017-11-15 PC 男性 4691261055
處理需求:
分組統計性別佔比
處理過程如下:
import pandas as pd
import numpy as np
df=pd.DataFrame({'key1':['美贊臣2017-11-15MOB','美贊臣2017-11-15MOB','美贊臣2017-11-15PC','美贊臣2017-11-15PC'],'key2':['女性','男鞋','女性','男性'],'imp':[1105487,1045427,3911,3922]})
df
group1=df.groupby(['key1','key2'])
group2=df.groupby(['key1'])
a1=group1.sum().reset_index()
b1=group2.sum().reset_index()
p=pd.merge(a1,b1,how='outer',on='key1')
m=p["imp_x"]/p["imp_y"]
p["rate"]=m
p
處理結果如下: