決策樹例項

阿新 • • 發佈：2018-11-28

import numpy as np
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import classification_report


def load_data():
    from sklearn.datasets import load_iris#鳶尾花資料集
    from sklearn.preprocessing import StandardScaler#特徵縮放
    from sklearn.model_selection import train_test_split#交叉驗證
    data = load_iris()
    X = data.data
    y = data.target
    ss = StandardScaler()
    X = ss.fit_transform(X)
    x_train, x_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=1)
    return x_train, y_train, x_test, y_test, data.feature_names


def train():
    x_train, y_train, x_test, y_test, _ = load_data()
    model = DecisionTreeClassifier()
    model.fit(x_train, y_train)
    y_pre = model.predict(x_test)
    print(model.score(x_test, y_test))
    print(classification_report(y_test, y_pre))


def grid_search():
    from sklearn.model_selection import GridSearchCV#網格搜尋
    x_train, y_train, x_test, y_test, _ = load_data()#'_'值date.feature_names，我們不用這 
    #個引數
    model = DecisionTreeClassifier()
    parameters = {'max_depth': np.arange(1, 50, 2)}#這裡超引數為決策樹中的深度
    gs = GridSearchCV(model, parameters, verbose=5, cv=5)
    gs.fit(x_train, y_train)
    print('最佳模型:', gs.best_params_, gs.best_score_)
    y_pre = gs.predict(x_test)
    print(classification_report(y_test, y_pre))


def tree_visilize():
    from sklearn import tree
    x_train, y_train, x_test, y_test, feature_names = load_data()
    print('類標：', np.unique(y_train))#np.unique為除去y_train中重複的數字
    print('特徵名稱：', feature_names)
    model = DecisionTreeClassifier(max_depth=3)
    model.fit(x_train, y_train)
    print(model.score(x_test, y_test))
    with open("allElectronicsData.dot", "w") as f:
        tree.export_graphviz(model, feature_names=feature_names, class_names=['A', 'B', 'C'], out_file=f)


if __name__ == '__main__':
    train()#訓練決策樹，這裡的決策樹沒有剪枝，生成的是最大最複雜的樹，容易過擬合
    grid_search()#訓練決策樹並找出最合適的超引數，這個引數是根據決策樹剪枝來的
    tree_visilize()#決策樹的顯示，運用剪枝後的決策樹，剪枝後深度為3

其中，tree_visilize函式為顯示決策樹的函式，需要下載軟體：軟體為graphviz-2.38.msi 詳細操作

決策樹的顯示：

這個檔案是程式碼生成的，

顯示所生成的決策樹可以用裝好的gvedit.exe開啟，在這裡。

顯示：

決策樹詳細講解文章：

文章1

文章2

文章3

決策樹例項

import numpy as np from sklearn.tree import DecisionTreeClassifier from sklearn.metrics import classification_report def load_data(): from sklea

機器學習之決策樹例項篇

1. python 2. Python機器學習的庫：scikit-learn 2.1：特性：簡單高效的資料探勘和機器學習分析對所有使用者開放，根據不同需求高度可重用性基

決策樹、隨機森林整合演算法（Titanic例項）

#coding:utf-8 import pandas #ipython notebook titanic = pandas.read_csv("titanic_train.csv") titanic.head(5) #print (titanic.describe()) t

鳶尾花決策樹/隨機森林例項——sklearn

本次實踐主要通過 DecisionTreeClassifier 熵/gini係數決策樹模型、以及RandomForestClassifier隨機森林模型進行分類;訓練集：測試集=8:2結果：返回模型評價結果、匯出DecisionTreeClassifier 熵/gini係

決策樹原理例項（python程式碼實現）

決策數(Decision Tree)在機器學習中也是比較常見的一種演算法，屬於監督學習中的一種。看字面意思應該也比較容易理解，相比其他演算法比如支援向量機(SVM)或神經網路，似乎決策樹感覺“親切”許多。優點：計算複雜度不高，輸出結果易於理解，對中間值的缺

決策樹的原理與構建--圍繞一個例項展開

1. 什麼是決策樹：決策樹是一種預測模型，用來進行分類，是一種有監督學習。樹中每個節點表示某個物件，而每個分叉路徑則代表的某個可能的屬性值，而每個葉結點則對應從根節點到該葉節點所經歷的路徑所

Spark-MLlib例項——決策樹

Spark-MLlib例項——決策樹通俗來說，決策樹分類的思想類似於找物件。現想象一個女孩的母親要給這個女孩介紹男朋友，於是有了下面的對話：女兒：多大年紀了？母親：26。女兒：長的帥不帥？母親：挺帥的。女兒：收入高不？母親：不算很高，中等情況。女兒：是公務員

決策樹演算法例項(基於ID3)

基於ID3的決策樹演算法，文中使用的sklearn的庫，使用graphviz可以將決策樹轉換為pdf檢視。案例中用到的模擬資料如下：######################################################################

通俗地說決策樹演算法（二）例項解析

前情提要：通俗地說決策樹演算法（一）基礎概念介紹一. 概述上一節，我們介紹了決策樹的一些基本概念，包括樹的基本知識以及資訊熵的相關內容，那麼這次，我們就通過一個例子，來具體展示決策樹的工作原理，以及資訊熵在其中承擔的角色。有一點得先說一下，決策樹在優化過程中，有3個經典的演算法，分別是ID3，C4.5

Decision Tree 1: Basis 決策樹基礎

entropy inf 屬於得到 == bad spa span idt 介紹我們有一些歷史數據： record id\attributes A B C Result 1 a1 b1 c1 Good 2 a2 b2 c1 Bad 3 a1 b3

雪飲者決策樹系列（二）決策樹應用

ssi 字符串長度 mes pla 選擇 font com vector nac 　　本篇以信息增益最大作為最優化策略來詳細介紹決策樹的決策流程。　　首先給定數據集，見下圖　　註：本數據來源於網絡本篇將以這些數據作為訓練數據（雖然少，但足以介紹清楚原理！），下圖是決

決策樹與隨機森林

隨機 tro 過程能夠 ots pull 葉子節點合並 pan 決策樹　　決策樹學習采用的是自頂向下的遞歸方法, 其基本思想是以信息熵為度量構造一棵熵值下降最快的樹,到葉子節點處的熵值為零, 　　此時每個葉節點中的實例都屬於同一類。決策樹三種生成算法 ID3 -

【Python】決策樹的python實現

uia bmp say 不知道 times otto outlook lru bgm 【Python】決策樹的python實現 2016-12-08 數據分析師Nieson 1. 決策樹是什麽? 簡單地理解，就是根據一些 feature 進行分類，每個節點提一個問

SparkMLlib分類算法之決策樹學習

2.3 數據預處理 true ray score 嚴重 acc 標準化 lambda SparkMLlib分類算法之決策樹學習（一）決策樹的基本概念　　　　決策樹(Decision Tree）是在已知各種情況發生概率的基礎上，通過構成決策樹來求取凈現值的期望值大於等於

Python_sklearn機器學習庫學習筆記（四）decision_tree（決策樹）

min n) 空間 strong output epo from 標簽 ict # 決策樹 import pandas as pd from sklearn.tree import DecisionTreeClassifier from sklearn.

SparkMLlib回歸算法之決策樹

ria 之間 feature 輸入修改決策樹算法技術 color 實例 SparkMLlib回歸算法之決策樹（一），決策樹概念 1，決策樹算法（ID3，C4.5 ，CART）之間的比較：　　1，ID3算法在選擇根節點和各內部節點中的分支屬性時，采用信息增益作為評價

機器學習入門 - 1. 介紹與決策樹(decision tree)

recursion machine learning programmming 機器學習(Machine Learning) 介紹與決策樹(Decision Tree)機器學習入門系列是個人學習過程中的一些記錄與心得。其主要以要點形式呈現，簡潔明了。1.什麽是機器學習？一個比較概括的理解是:

決策樹模型組合之隨機森林與GBDT（轉）

監督式學習 -- 分類決策樹（一）

cte 求解分支基本概念 tracking 它的解決 mat 這就是決策樹（decision tree）是一種基本的分類與回歸方法。其表示的樹型結構，能夠覺得是if-else規則的集合。基本的長處是分類可讀性好，速度快。一般會有三個步驟：特征選擇、決策樹的生成

分類算法：決策樹（C4.5）(轉)

clas 依賴 1.5 -s clip win pan 定義衡量 C4.5是機器學習算法中的另一個分類決策樹算法，它是基於ID3算法進行改進後的一種重要算法，相比於ID3算法，改進有如下幾個要點： 1）用信息增益率來選擇屬性。ID3選擇屬性用的是子樹的信息增益，這裏可

決策樹例項

相關推薦