1. 程式人生 > >python資料分析和挖掘實戰

python資料分析和挖掘實戰

第五章:

1, 常用的分類和預測演算法


2, 迴歸分析


3, 主要回歸模型


4, 決策樹演算法:

tip:使用dot -Tpng data.txt -o data.png 可以將生成的樹用Graphivz進行視覺化。(目前會出現編碼問題,還沒解決)

5 ,人工神經網路演算法:


6,分類與預測演算法評價

6.1 絕對誤差和相對誤差

6.2平均絕對誤差

6.3均方誤差

6.4均方差誤差

6.5 平均絕對誤差

6.6 Kappa統計

6.7識別準確度

6.8 識別精確度

6.9 反饋率

7,分類預測模型分類和預測

8, 常見的聚類方法


9, 常用聚類分析演算法

10, 連續屬性與相似性的度量


11, 度量樣本之間的相似性可以使用距離來算

12,文件資料

文件資料使用餘弦相似性度量,可以建立一個詞頻表


13,目標函式



14, 聚類函式列表:

15, 關聯規則演算法:


16,時間序列模型

17, 時間序列的預處理

首先對其的純隨機性和平穩性進行檢驗

18,主要時序模式的演算法: