1. 程式人生 > >資料探勘的知識點總結

資料探勘的知識點總結

資料探勘的步驟:需求->資料抓取->特徵選擇->模型選擇->驗證->應用
雖然步驟是靈活的,但是筆面試還是以這樣的過程為基準的

分析步驟:首先要做技術評估
1, 資料抽取統計分析:對於資料特徵有一個初步的把握
2, 資料清洗
3, 資料變換
4, 歸併和分類
5, 屬性選擇
6, 模型構建:如果採用低有效的演算法,可以採用整合學習的方法來進行學習,得到一個評分的排名結果
7, 模型評價:採用幾種評價手段來進行分析:使用者召回率,人工分析,誤差分析,分類準確度分析,矩陣分析,28原則等
8, 結果分析:對演算法的優缺點逐一分析,看有沒有提升的方法

需要了解的情況:
資料特徵
資料特性
從業務人員角度考慮得到的關鍵特徵
從運營方角度考慮的得到的關鍵特徵
固有模型

需要交付的檔案:
模型及使用文件
發現的一般規律
常見錯誤及解決方案
模型思路及今後可能的優化方向