sklearn構建決策樹

阿新 • • 發佈：2018-12-13

1.視覺化樹

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

from sklearn import tree
import graphviz #視覺化
import pydotplus #畫.dot檔案
from IPython.display import Image #圖片
from sklearn.model_selection import train_test_split #資料集劃分為測試集和訓練集

from sklearn.datasets.california_housing import fetch_california_housing #sklearn內建的房價的資料集

house = fetch_california_housing()
#print(house.data.shape) #(20640, 8)

dtr = tree.DecisionTreeRegressor(max_depth=2)
dtr.fit(house.data[:,[6,7]],house.target) #指定了第6,7列，fit()傳遞兩個引數X,y

#視覺化樹
#格式基本上不需要變動，這裡生成.dot檔案
dot_data = \
    tree.export_graphviz(
        dtr, #這裡是例項的名字
        out_file=None,
        feature_names=house.feature_names[6:8], #列名
        filled= True,
        impurity=False,
        rounded=True
    )

#畫樹
graph = pydotplus.graph_from_dot_data(dot_data)
graph.get_nodes()[7].set_fillcolor("#FF2DD") #填充顏色

#儲存樹
graph.write_png(r'C:\\Users\\Administrator\\Desktop\\dtr.png') #儲存圖片

在這裡插入圖片描述

2.訓練資料

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

from sklearn import tree
import graphviz #視覺化
import pydotplus #畫.dot檔案
from IPython.display import Image #圖片
from sklearn.model_selection import train_test_split #資料集劃分為測試集和訓練集

from sklearn.datasets.california_housing import fetch_california_housing #sklearn內建的房價的資料集

house = fetch_california_housing()
#print(house.data.shape) #(20640, 8)

x_train,x_test,y_train,y_test = train_test_split(house.data,house.target,test_size=0.1,random_state=42)

dtr = tree.DecisionTreeRegressor(random_state=42)
dtr.fit(x_train,y_train)

score = dtr.score(x_test,y_test)
print(score) #0.637318351331017

機器學習實戰sklearn 構建決策樹

使用sklearn 房價資料集構建決策樹 1、匯入資料集 %matplotlib inline import matplotlib.pyplot as plt import pandas as pd # 匯入資料 from sklearn.datasets.california_hous

使用 sklearn 構建決策樹並使用 Graphviz 繪製樹結構

1. 概述之前兩篇日誌，我們系統性的介紹了決策樹的構建演算法、構建流程、展示與決策：決策樹的構建演算法 – ID3 與 C4.5 演算法決策樹的構建、展示與決策本文，我們來介紹如何使用 sklearn

sklearn構建決策樹

1.視覺化樹 import numpy as np import pandas as pd import matplotlib.pyplot as plt from sklearn import tree import graphviz #視覺化 import

R語言專題，如何使用party包構建決策樹？

r語言下面將在iris數據集上，演示如何使用party包中的函數ctree來建立一棵決策樹。iris數據集中的Sepal.Length、Sepal.Width、Petal.Length和Petal.Width，都將用來預測鳶尾花的種類。party包中的函數ctree用來建立決策樹，函數predict用來對新數

基於sklearn的決策樹演算法

1、決策樹介紹決策樹簡單的理解為if-then的集合，其優點主要有分類速度快、可讀性等。決策樹的生成主要可分為三個步驟：特徵的選擇、決策樹的生成、決策樹的剪枝。 1.1特徵選擇對於結點的選擇，總得需要一個計算方法來實現，這個方法的目標是優先選擇分類能力強的特徵，這樣才提高

構建決策樹和svm模型（某金融資料集）

根據金融資料集作出的決策樹和svm模型 # 匯入需要的包 import pandas as pd from sklearn.linear_model import LogisticRegression from sklearn.model_selection i

sklearn生成決策樹及其評估

以下是以鶯尾花資料進行建模生成的決策樹。程式碼如下： import numpy as np from sklearn import datasets from sklearn.model_selection import train_test_split,cross_val_score

Python資料分析與機器學習-使用sklearn構造決策樹模型

# datasets包括內建的資料集 california_housing房價的資料集 from sklearn.datasets.california_housing import fetch_california_housing import pandas as pd

李航統計學習採用C4.5演算法構建決策樹

from numpy import * from math import log import operator def calcShannonEnt(dataset): numdataset=len(dataset) labelCount={}

機器學習之使用sklearn構造決策樹模型

一、任務基礎匯入所需要的庫 import matplotlib.pyplot as plt import pandas as pd %matplotlib inline 載入sklearn內建資料集，檢視資料描述 from sklearn.datasets.californ

決策樹（Decision Tree）SkLearn

true predict mat ray int lec pytho next() action #!/usr/bin/env python # -*- coding: utf-8 -*- from sklearn.feature_extraction import Di

決策樹構建

選擇變量 question mage 預測 id3 算法特征選擇 pan 信息熵：生活中的所見所聞，都接觸到許許多多的信息，有的信息對我們有用，有的無用。如 “地球是自轉的”，這條信息對我們沒什麽用，因為我們都知道，而且是確確實實是這樣的。香

sklearn 決策樹

貪婪 center .net inf simple 種類基於 .html 數據決策樹的原理很簡單：一顆由多個判斷節點組成的樹。因為其應用之廣，也有許許多多的衍生(Random Forest， GBDT，XGBOOST)。我想確實很有必要做一個總結。決策樹的一些優點是：

sklearn決策樹特征權重計算方法

val 1.0 方法 port col value split 比較 rand 訓練模型，生成樹圖 1 from io import StringIO 2 from sklearn.datasets import load_iris 3 from sklearn.t

sklearn學習7-----決策樹（tree)

imp 分布 nodes 但是 amp 選擇 width .com 開始 1、使用示例 2、樹模型參數：【很多參數都是用來限制樹過於龐大，即擔心其過擬合】 # 1.criterion gini or entropy：用什麽作為衡量標準 ( 熵值或者Gini系數

Python爬蟲(三)——開封市58同城出租房決策樹構建

off parent decision second string pre IE for 爬蟲決策樹框架： 1 # coding=utf-8 2 import matplotlib.pyplot as plt 3 4 decisionNode = d

sklearn庫學習之決策樹

決策樹學習決策樹，就是學習一系列if/else問題，在機器學習中，這些問題叫做測試，演算法搜尋所有可能的測試，找出對目標變數來說資訊量最大的哪一個。演算法過程生成一棵二元決策樹，其中每個結點都包含一個測試。將每個測試看成沿著一條軸對當前資料進行劃分，由於每個測試僅僅關注一個特徵，所以

sklearn的快速使用之七（決策樹迴歸）

print(__doc__) # Import the necessary modules and libraries #https://blog.csdn.net/csfreebird/article/details/52744037 import numpy as np from sklea

sklearn的快速使用之六（決策樹分類）

print(__doc__) import numpy as np import matplotlib.pyplot as plt from sklearn.datasets import load_iris from sklearn.tree import DecisionTreeClas

利用Python sklearn庫裡的決策樹模型生成決策樹圖片以及測試分類的準確度

本案例利用sklearn自帶的資料集，選取房子經緯度作為特徵引數來對標籤進行分類。也用切分的資料訓練模型來進行特徵引數的選擇得到最好的測試準確度。 Python原始碼： #!/usr/bin/env python # encoding: utf-8 """ @Company：華中科技大

sklearn構建決策樹

相關推薦