決策樹

阿新 • • 發佈：2017-07-14

id3 vertical review id3算法 rect 能力可能 height 應用

決策樹是應用最廣的歸納推理算法之中的一個，它是一種逼近離散函數方法，對噪聲數據有非常好的魯棒性，可以學習析取表達式，廣為應用的算法有ID3，ASSISTANT和C4.5。

通常決策樹代表實例屬性值約束的合取（conjunction）的析取式（disjunction）。樹根到樹葉的每一條路徑相應一組屬性測試的合取，而整棵樹是這些合取的析取。

主要的ID3算法是通過自頂向下構造決策樹進行學習的。首先考慮的問題是哪一個屬性將在樹的根節點測試。為解決這一問題，使用統計測試來確定每個實例屬性單獨分類訓練樣本的能力。將分類能力最好的屬性作為樹的跟節點，之後根節點屬性的每個可能值會產生一個分支，然後把訓練例子排列到適當的分支下，反復整個過程，用每個分支結點關聯的訓練樣本來選擇最佳屬性。這是對合格決策樹的貪婪搜索，也就是說算法從不回溯又一次考慮曾經的選擇。

那麽，怎樣確定哪一個屬性具有最佳分類能力呢？衡量屬性價值的好的定量標準是什麽？我們使用“信息增益（information gain）”來作為衡量標準。用來衡量屬性分類樣本的能力。ID3算法在增長樹的每一步使用這個標準來選擇最佳分類的屬性。

為精確定義信息增益。我們先定義信息論中廣泛使用的一個度量標準——熵（entropy），它刻畫了隨意樣本集的純度。

給定包括關於某個目標概念的正反樣本的樣本集 $S$ 。那麽 $<p>決策樹</p> </div> <div class="entry-footer"> <div class="entry-tag"> </div> <div class="entry-page"> <center><script type="text/javascript" src="/js/article.js">$

決策樹

Decision Tree 1: Basis 決策樹基礎

雪飲者決策樹系列（二）決策樹應用

決策樹與隨機森林

【Python】決策樹的python實現

SparkMLlib分類算法之決策樹學習

Python_sklearn機器學習庫學習筆記（四）decision_tree（決策樹）

SparkMLlib回歸算法之決策樹

機器學習入門 - 1. 介紹與決策樹(decision tree)

決策樹模型組合之隨機森林與GBDT（轉）

監督式學習 -- 分類決策樹（一）

分類算法：決策樹（C4.5）(轉)

安裝xgboost用於決策樹細化分枝

Spark機器學習(6)：決策樹算法

我的spark python 決策樹實例

決策樹

手把手生成決策樹(dicision tree)

決策樹原理及實現

javascript實現樸素貝葉斯分類與決策樹ID3分類

機器學習入門之決策樹算法

決策樹代碼《機器學習實戰》

決策樹

相關推薦