python資料分析：客戶價值分析案例實戰

阿新 • • 發佈：2019-01-23

簡介：本案例以電信運營商客戶資訊為資料，通過層次聚類和K-means聚類，對使用者劃分成不同的群體，然後可以根據使用者群體的不同特徵提供個性化的策略，從而達到提高ARPU的效果。

1.商業理解

根據客戶的日常消費行為，我們可以把客戶劃分為不同的群體，根據不同群體的消費行為特徵，我們可以作出針對性的營銷策略。從而達到發展新業務、減少客戶流失率，爭取新使用者，提高ARPU的目標

對運營商使用者的分類，一般可以分為：
公眾使用者
企業使用者
大客戶

本次針對公眾使用者進行劃分，目標將“公眾使用者”分類為：
高階使用者
中端使用者
離網趨勢使用者
其他使用者

2.展示資料

本次採用的資料有：
客戶的個人資訊
客戶的通話資訊
各資費套餐的詳情

這裡寫圖片描述

3.資料預處理

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import scipy.cluster.hierarchy#聚類、層次
#讀入資料
custinfo=pd.read_csv("custinfo.csv")
custcall=pd.read_csv("custcall.csv")

#資料聚合
custcall_average=custcall.groupby(custcall["Customer_ID" 
]).mean()
del custcall_average["month"]

#資料合併
data = pd.merge(custinfo,custcall_average,left_on='Customer_ID',right_index=True)#使用右邊dataframe的索引值作為連線鍵
data.index=data["Customer_ID"]
del data["Customer_ID"]

4.資料觀察

des=data.describe()
#檢視取值離散變數的分佈
pd.value_counts(data["Gender"]) #檢視性別分佈
pd.value_counts(data 
['Tariff'])#套餐
pd.value_counts(data['Handset'])#手機品牌

for i in data.columns:
    if i not in ['Gender','Tariff','Handset']:
        plt.figure()
        sns.distplot(data[i],bins=10,hist_kws=dict(edgecolor='k'),kde=False)
 plt.show()

這裡寫圖片描述

5.模型建立

#模型建立
#資料整理
xunibinaliang=data[["Gender",'Tariff','Handset']]
dummies=pd.get_dummies(xunibinaliang)   #將類別變數轉為虛擬變數，gender為二值型，get_dummies處理後還是一列
data_zs=pd.DataFrame
i=data.columns.difference([u'Age',u'Gender',u'Tariff',u'Handset']) #一維陣列做差
data_zs=(data[i]-data[i].mean())/data[i].std()

#確定聚類數目
from scipy.cluster.hierarchy import linkage,dendrogram
#進行層次聚類
Z = linkage(data_zs, method = 'ward', metric = 'euclidean') 
P = dendrogram(Z, 0) #將層級聚類結果以樹狀圖表示出來 dendrogram-樹圖
plt.show()#觀察樹圖，認為分成4類比較合適

這裡寫圖片描述


#K-means聚類
#引數初始化
k = 4 #聚類的類別
iteration = 500 #聚類最大迴圈次數，即迭代次數

#構建k-means模型
from sklearn.cluster import KMeans 
model = KMeans(n_clusters = k, n_jobs = 4，max_iter=iteration) #構造聚類器，分為k類，併發數4
model.fit(data_zs) #開始聚類

6.資料展示

#簡單列印結果
r1 = pd.Series(model.labels_).value_counts() #label_:每個樣本對應的簇類別標籤,統計各個類別的數目
r3=model.labels_
r2 = pd.DataFrame(model.cluster_centers_) #行為每一類的聚類中心，每一列的意義是按照data_zs
r4=model.cluster_centers_
r = pd.concat([r2, r1], axis = 1) #橫向連線（0是縱向），得到聚類中心對應的類別下的數目
r.columns = list(data_zs.columns)+ [u'class'] #重命名錶頭#這裡傳入的列表名必須list
print(r)

#類中心比較
r[i].plot(figsize=(10,10))
plt.show()

#每個類別各屬性的概率密度圖

這裡寫圖片描述

分群的注意點：
1）群間差異是否明顯
2）群內特徵是否相似
3）分群對業務是否有指導意義

python資料分析：客戶價值分析案例實戰

簡介：本案例以電信運營商客戶資訊為資料，通過層次聚類和K-means聚類，對使用者劃分成不同的群體，然後可以根據使用者群體的不同特徵提供個性化的策略，從而達到提高ARPU的效果。 1.商業理解根據客戶的日常消費行為，我們可以把客戶劃分為不同的群體，根據

Python資料科學：方差分析！

之前已經介紹的變數分析： ①相關分析：一個連續變數與一個連續變數間的關係。 ②雙樣本t檢驗：一個二分分類變數與一個連續變數間的關係。本次介紹：方差分析：一個多分類分類變數與一個連續變數間的關係。其中分類個數大於兩個，分類變數也可以有多個。當分類變

Python資料探勘：利用聚類演算法進行航空公司客戶價值分析

無小意丶個人部落格地址：無小意知乎主頁：無小意丶公眾號：資料路（shuju_lu）剛剛開始寫部落格，希望能保持關注，會繼續努力。以資料相關為主，網際網路為輔進行文章釋出。本文是《Python資料分析與挖掘實戰》一書的實戰部分，在整理分析後的復現。本篇文

python資料分析之航空公司客戶價值分析

一.引言本篇文章是根據航空公司提供的乘客個人資訊，通過建立合理的客戶價值評估模型，對客戶進行分群，比較分析不同客戶群的特點和價值，來指定相應的營銷策略，從而減少客戶流失，挖掘出潛在客戶，實現盈利。在這裡是用K-means聚類方法來對乘客進行分群的。源資料部分

資料探勘實戰：帶你做客戶價值分析(附程式碼)

來源：資料路本文約4000字，建議閱讀7分鐘。手把手教你利用利用KMeans聚類進行航空公司客戶

python資料分析：聚類分析（cluster analysis）

何為聚類分析聚類分析或聚類是對一組物件進行分組的任務，使得同一組（稱為聚類）中的物件（在某種意義上）與其他組（聚類）中的物件更相似（在某種意義上）。它是探索性資料探勘的主要任務，也是統計資料分析的常用技術，用於許多領域，包括機器學習，模式識別，影象分析，資訊檢索，生物資訊學，資料

29、RFM客戶價值分析（有圖有案例）

RFM分析：是根據使用者活躍程度和交易金額貢獻，進行客戶價值細分的一種方法一、分析指標指標解釋意義 R(Recency)近度客戶最近一次交易時間的間隔 R越小，表示客戶越近有交易發

python資料分析：時間序列分析（Time series analysis）

何為時間序列分析：時間序列經常通過折線圖繪製。時間序列用於統計，訊號處理，模式識別，計量經濟學，數學金融，天氣預報，地震預測，腦電圖，控制工程，天文學，通訊工程，以及主要涉及時間測量的任何應用科學和工程領域。時間序列分析包括用於分析時間序列資料的方法，以便提取有意義的統計資料

python資料分析：異常檢測分析（Anomaly detection analysis）

何為異常檢測在資料探勘中，異常檢測（anomaly detection）是通過與大多數資料顯著不同而引起懷疑的稀有專案，事件或觀察的識別。通常情況下，異常專案會轉化為某種問題，例如銀行欺詐，結構缺陷，醫療問題或文字錯誤。異常也被稱為異常值，新奇，噪聲，偏差和異常。資料異常可以

資料探勘——航空公司客戶價值分析（程式碼完整）

最近在閱讀張良均、王路等人出版的書《python資料分析與挖掘實戰》，其中有個案例是介紹航空公司客戶價值的分析，其中用到的聚類方法是K-Means方法，我一直把學習的重心放在監督學習上，今天就用這個案例練習一下非監督學習。由於書上將這個案例介紹的比較詳細，導致網上的好多部落

實戰：航空公司客戶價值分析

一、背景與挖掘目標試圖實現以下目標：（1）藉助航空公司資料，對客戶進行分類。（2）對不同類別的客戶進行特徵分析，比較不同類別客戶的價值分析。（3）對不同價值的客戶類別進行個性化服務，制定相應的營銷策略。二、分析方法使用 LRMFC模型來進行分析 L：三、資

資料探勘例項（航空公司客戶價值分析）

一、實現目標（1）藉助航空公司客戶資料，對客戶進行分類（2）對不同的客戶進行特徵分析，比較不同類客戶的客戶價值（3）對不同價值的客戶類別提供個性化服務，指定相應的營銷策略二、分析方法與過程航空客運資訊挖掘主要步驟：（1）從航空公司的資料來

航空公司客戶價值分析

air height xls 得到 3.1 amp 識別 cluster 有客數據集：http://pan.baidu.com/s/1clfQY6 挖掘目標（1）根據航空公司客戶數據對客戶進行分類。（2）對不同的客戶類別進行特征分析，比價不同類客戶的客戶價

Python大數據：信用卡逾期分析

OS odi tuple his cat 歷史 true .py ade # -*- coding:utf-8 -*- # 數據集成 import csv import numpy as np import pandas as pd import matp

3D點雲資料分析：pointNet++論文分析及閱讀筆記

PointNet的缺點： PointNet不捕獲由度量空間點引起的區域性結構，限制了它識別細粒度圖案和泛化到複雜場景的能力。利用度量空間距離，我們的網路能夠通過增加上下文尺度來學習區域性特徵。點集通常採用不同的密度進行取樣，這導致在統一密度下訓練的網路的效能大大降低。

基於聚類（Kmeans）演算法實現客戶價值分析系統(電信運營商)

開發環境 jupyter notebook 一、電信運營商–客戶價值分析從客戶需求出發，瞭解客戶需要什麼，他們有怎麼樣的特徵，電信運營商為客戶設定不同的優惠套餐爭取更多的使用者：推出不同的優

R——航空公司客戶價值分析

用KMeans實現航空公司客戶價值分析，程式碼如下： ###航空公司客戶價值分析 ##設定工作空間 setwd("D:/my study/R資料分析與挖掘實戰/data&code/7/上機實驗") ##資料探索分析 #資料讀取 datafile=read

海量資料處理：經典例項分析

有關海量資料處理的問題，主要有以下3類：top K問題、重複問題、排序問題 top K 問題在大規模資料處理中，經常會遇到的一類問題：在海量資料中找出出現頻率最高的前K個數，或者從海量資料中找出最大的前K個數，這類問題通常被稱為top K問題。例如，在搜尋引擎

基於R語言的航空公司客戶價值分析

#分析航空公司現狀 1.行業內競爭民航的競爭除了三大航空公司之間的競爭之外，還將加入新崛起的各類小型航空公司、民營航空公司，甚至國外航空巨頭。航空產品生產過剩，產品同質化特徵愈加明顯，於是航空公司從價格、服務間的競爭逐漸轉向對客戶的競爭。 2.行業外競爭隨著高鐵、動車等鐵路運輸的興建，航空公司受到

第三階段：1.數據分析：8.層次分析法1

方法 bsp mage 數據區分其中 png HP http 首先是AHP分析方法：對定性問題進行定量分析的度準則決策方法。其中有4個前提條件。這四個緯度就滿足了前提條件。這就是一個層次性。 P是權重。這是一個對角關系。以數字1為線進行區分。第三階段：1.數

python資料分析：客戶價值分析案例實戰

1.商業理解

2.展示資料

3.資料預處理

4.資料觀察

5.模型建立

6.資料展示

相關推薦