實戰:航空公司客戶價值分析
阿新 • • 發佈:2019-02-10
一、 背景與挖掘目標
試圖實現以下目標:
(1)藉助航空公司資料,對客戶進行分類。
(2)對不同類別的客戶進行特徵分析,比較不同類別客戶的價值分析。
(3)對不同價值的客戶類別進行個性化服務,制定相應的營銷策略。
二、分析方法
使用 LRMFC模型來進行分析
L:
三、資料探索
注意觀察describe()函式引數變化。
(1)
(2)
匯出後的Excel檔案如下:
四、資料預處理
1、資料清洗
由資料探索分析可知,資料中存在缺失值,存在票價最小值為0、平均折扣率為0但飛行公里數卻大於0的記錄。由於這些記錄的數量不多,所以對其進行丟失處理。
PS:在Excel中對
SUM_YR_1 |
SUM_YR_2 |
SUM_YR_2 |
2、屬性規約
根據LRFMC模型,選擇與該模型相關的6個屬性:FFP_DATE、LOAD_TIME、FLIGHT_COUNT、avg_discount、SEG_KM_SUM、LAST_TO_END
結果如下:
3、資料變換
資料變換是將資料轉換成“適當的”形式,以適應挖掘任務和演算法的要求。本案例中採用的資料變換方式是屬性構造和資料標準化。
由於資料中並沒有直接給出LRFMC5個指標,需要通過屬性構造來提取這5個指標。具體的計算方式如下:
(1)L=LOAD_TIME-FFP_DATE
(2)R=LAST_TO_END
(3)F=FLIGHT_COUNT
(4)M=SEG_KM_SUM
(5)C=avg_discount
程式碼如下:
資料提取後,其資料取值範圍如下: