第五章決策樹

阿新 • • 發佈：2018-11-23

決策樹是基於特徵（非數字，如年齡，身高特徵）進行分類的過程，通常包括特徵選擇，決策樹的生成，決策樹的剪修。

5.1決策樹模型與學習

5.1.1決策樹模型
決策樹由節點（內節點（特徵或者說屬性）和葉節點（類））和有向邊組成，是一種對例項進行分類的樹形結構。
5.1.2決策樹與if-then
決策樹模型可以看做是if-then的合集，每條路徑構建一條規則，每個例項都能隨此找到對應的分類。
5.1.3決策樹與條件概率分佈
決策樹還表示給定特徵條件下的條件概率分佈（有點類似kd樹）。對特徵空間進行劃分，葉節點上的例項對該處類的條件概率較大，往往偏向該一類。
5.1.4決策樹學習
學習的目的是根據所給的資料集建一個模型樹（確定分類的規則），使他能夠進行正確的分類（預測）。
可以用損失函式（通常是正則化的極大似然函式）量化決策樹學習成績（損失函式小成績高），但從所有損失函式中找到最優解是一個NP問題，不切實際，通過近似求解找到其次優解才是真正需要的。
演算法通常是遞迴選擇各個節點的最優特徵。

5.2特徵選擇

5.2.1特徵選擇問題
通過資訊增益或者資訊增益比定量的選擇有利於分類的特徵。
5.2.2資訊增益
隨機變數X的熵的定義： $H (X) = - Σ p$

i l o g p i H(X)=-Σp_ilogp_i

H (X) = - Σ p_{i} l o g p_{i}

（該值始終大於0，通常以2或e為底）
熵越大，隨機變數的不確定性越大，從定義可知：

0&lt;=H(p)&lt;=logn

在隨機變數X的條件下隨機變數Y的條件熵:

H(Y|X)=Σp_iH(Y|X=x_i)

（與之前不一樣）
當概率

p_i

是由資料估計（特別是極大似然估計）得到的話，所對應的是經驗熵和經驗條件熵
一般的，熵和條件熵的差被稱為互資訊，等價於決策樹學習中的資訊增益：

g(D,A)=H(D)-H(D|A)

他表示了特徵A使得資料集D資訊不確定性減少的程度。
資訊增益比：相對資料集而言，並沒有絕對意義。

第五章決策樹

5.1決策樹模型與學習

5.2特徵選擇

第五章決策樹

李航《統計學習方法》——第五章決策樹模型

李航統計學習方法第五章決策樹課後習題答案

第4章決策樹演算法【分類】（五決策樹sklearn總結和視覺化總結）

《機器學習》第三章決策樹學習筆記加總結

《統計學習方法（李航）》講義第05章決策樹

《機器學習》（周誌華）第4章決策樹筆記理論及實現——“西瓜樹”

第三章決策樹

（二）《機器學習》（周誌華）第4章決策樹筆記理論及實現——“西瓜樹”——CART決策樹

《機器學習》周志華學習筆記第四章決策樹（課後習題）python 實現

《Machine Learning in Action》| 第2章決策樹

第3章決策樹（ID3演算法、建立繪製決策樹、分類器、儲存、預測隱性眼鏡型別）

《web安全之機器學習入門》第6章決策樹與隨機森林演算法

統計學習方法李航---第5章決策樹

《機器學習》讀書筆記，第三章決策樹學習

機器學習(周志華) 參考答案第四章決策樹 python重寫版與畫樹演算法

【機器學習實戰】第3章決策樹

《Hands-On Machine Learning with Scikit-Learn & TensorFlow》讀書筆記第六章決策樹

機器學習實戰第三章——決策樹(原始碼解析)

第三章決策樹 3.1決策樹構造

第五章決策樹

5.1決策樹模型與學習

5.2特徵選擇

相關推薦