小花培訓筆記
阿新 • • 發佈:2018-12-28
同一個ip過去的登入次數
re=login_table.groupby(['ip'])['event_id'].apply(lambda x:len(np.unique(x))).reset_index()
re1=login_table[['cid','ip']].drop_duplicates()
ip_login_count_data=pd.merge(re1,re,on=['ip'],how='left')
合併資料
login_merge_columns=[pipd,id_count,ip_login_count,country_account,platform_channel, mobile_count,mobilecity_login_account]
login_features=pd.DataFrame(login_table['cid'].unique(),columns=['cid'])
#print(login_features.shape[0])
for i in login_merge_columns:
login_features=pd.merge(login_features,i,on=['cid'],how='left')
print(login_features.shape[0])