python實現決策樹程式碼

阿新 • • 發佈：2018-12-09

資料圖片

from sklearn.feature_extraction import DictVectorizer
import csv
from sklearn import preprocessing
from numpy import *
import numpy as np
from sklearn import tree
from sklearn.externals.six import StringIO

DecistionTreeData = open(r'F:\機器學習\資料\01-ML-Decision Tree.csv', 'rt')
reader = csv.reader(DecistionTreeData)
headers = next(reader)
featureList = []
labelList = []
# 把資料轉換成一個包含特徵的list
for row in reader:
    labelList.append(row[len(row) - 1])
    rowDict = {}
    for i in range(1, len(row) - 1):
        # 相當於行成key:value這樣型別的資料，由於第一個列是id，所以只提取出第二個開始到最後一個
        rowDict[headers[i]] = row[i]
    featureList.append(rowDict)
print(featureList)

# 我們要把每個例項變成矩陣的形式進行儲存
# 也就是
# youth middle_age senor high medium low yes no fair excellent buy
# 1     0           0     1    0      0   0   1  1     0        0
# 每個特徵的選項都列舉出來，選中的特徵為1 未選中的為0
# 下面的步驟就是把每個例項，每行的值轉換成矩陣的格式
vec = DictVectorizer()
dummyX = vec.fit_transform(featureList).toarray()
print("dummyX:" + str(dummyX))

print("labelList:" + str(labelList))
# 將label分類也變成上面的格式
lb = preprocessing.LabelBinarizer()
dummyY = lb.fit_transform(labelList)
# print("dummyY:"+str(dummyY))

# 直接呼叫sklearn下的tree的分類器,並且指定使用熵的方式去解決,建立決策樹
clf = tree.DecisionTreeClassifier(criterion='entropy')
clf = clf.fit(dummyX, dummyY)
print("clf:" + str(clf))

with open("allElectronicInformation.dot", 'w') as f:
    # 生成一個.dot檔案是儲存決策樹資訊的
    f = tree.export_graphviz(clf, feature_names=vec.get_feature_names(), out_file=f)

oneRowX = dummyX[0, :]
print("oneRowX" + str(oneRowX))
newRowX = oneRowX
# 修改第一個特徵的值
newRowX[0] = 1
newRowX[2] = 0


#因為一直報錯需要我reshape把陣列變成矩陣，就做了如下的操作
newRowX = np.array(newRowX)
#第一個引數是代表矩陣行的長度，第二個引數矩陣代表列的長度
newRowX = newRowX.reshape(1,len(newRowX))
print("newRowX:" + str(newRowX))
predictedY = clf.predict(newRowX)
print(str(predictedY))

python實現決策樹程式碼

資料圖片 from sklearn.feature_extraction import DictVectorizer import csv from sklearn import preprocessing from numpy import * import nu

Python實現決策樹應用之判斷隱形眼鏡的型別

程式碼模組一、DecisionTreePlot # -*- coding:utf-8 -*- __author__ = 'yangxin_ryan' import matplotlib.pyplot as plt """ 定義文字框和箭頭格式【 sawtooth 波浪方框, rou

python實現決策樹

# -*- coding: utf-8 -*- """ Created on Thu Sep 27 10:40:47 2018 @author: Administrator """ # de template # Importing the libraries impor

python實現決策樹演算法

1. #!/usr/bin/python3 import numpy as np from sklearn import tree from sklearn.metrics import precision_recall_curve from sklearn.metrics

Python實現決策樹對西瓜進行分類

使用的周志華老師書上的例子，因為習主席講過一切不給資料集的演算法都是耍流氓，所以我這裡先給出資料集： 0,色澤,根蒂,敲聲,紋理,臍部,觸感,密度,含糖率,好瓜 1,青綠,蜷縮,濁響,清晰,凹陷,硬滑,0.697,0.46,是 2,烏黑,蜷縮,沉悶,清晰,凹陷,硬滑

機器學習經典演算法詳解及Python實現--決策樹（Decision Tree）

（一）認識決策樹 1，決策樹分類原理決策樹是通過一系列規則對資料進行分類的過程。它提供一種在什麼條件下會得到什麼值的類似規則的方法。決策樹分為分類樹和迴歸樹兩種，分類樹對離散變數做決策樹，迴歸樹對連續變數做決策樹。近來的調查表明決策樹也是最經常使用的資料探勘演算法，它

Python實現決策樹並且使用Graphvize視覺化

一、什麼是決策樹（decision tree）——機器學習中的一個重要的分類演算法決策樹是一個類似於資料流程圖的樹結構：其中，每個內部節點表示一個屬性上的測試，每個分支代表一個屬性輸出，而每個樹葉結點代表類或者類的分佈，樹的最頂層是根結點根據天氣情況決定出遊與否的案例二、決策

詳解決策樹、python實現決策樹

決策樹模型定義決策過程決策樹學習特徵選擇資訊增益計算方法 ID3演算法決策樹模型定義分類決策樹模型是一種描述對例項進行分類的樹形結構。決策樹由節點（Node）和有向邊（directed edge）組成。節

python實現決策樹分類（三）

在上一篇文章中，我們已經構建了決策樹，接下來可以使用它用於實際的資料分類。在執行資料分類時，需要決策時以及標籤向量。程式比較測試資料和決策樹上的數值，遞迴執行直到進入葉子節點。這篇文章主要使用決策樹分類器就行分類，資料集採用UCI資料庫中的紅酒，白酒資料，主要特徵包括12

Python實現——決策樹實例(離散數據/香農熵)

遍歷 values 最適比例刪除類型取值 val creat 決策樹的實現太...繁瑣了。如果只是接受他的原理的話還好說，但是要想用代碼去實現比較糟心，目前運用了《機器學習實戰》的代碼手打了一遍，決定在這裏一點點摸索一下該工程。實例的代碼在使用上運用了香農熵，並

【Python】決策樹的python實現

uia bmp say 不知道 times otto outlook lru bgm 【Python】決策樹的python實現 2016-12-08 數據分析師Nieson 1. 決策樹是什麽? 簡單地理解，就是根據一些 feature 進行分類，每個節點提一個問

機器學習：決策樹過擬合與剪枝，決策樹程式碼實現（三）

文章目錄楔子變數方法資料預處理剪枝獲取待剪集：針對ID3，C4.5的剪枝損失函式的設計基於該損失函式的演算法描述基於該損失函式的程式碼實

機器學習：結點的實現，決策樹程式碼實現（二）

文章目錄楔子定義變數：定義方法獲得劃分的feature 生成結點停止條件及其處理 fit() 生成樹剪枝楔子前面已經實現了各種資訊量的計算，那麼我們劃分的基本有了，那

機器學習：資訊熵，基尼係數，條件熵，條件基尼係數，資訊增益，資訊增益比，基尼增益，決策樹程式碼實現（一）

文章目錄初始化，涉及到使用的變數：資訊熵定義公式，經驗公式程式碼：基尼係數定義公式，經驗公式程式碼：條件熵，條件基尼係數條件熵定義公式，經驗公式

【機器學習】CART分類決策樹+程式碼實現

1. 基礎知識 CART作為二叉決策樹，既可以分類，也可以迴歸。分類時：基尼指數最小化。迴歸時：平方誤差最小化。資料型別：標值型，連續型。連續型分類時採取“二分法”，取中間值進行左右子樹的劃分。 2. CART分類樹特徵A有N個取值，將每個取值作為分界點，將資料

r語言做決策樹程式碼實現

0.節點和結點的區別：節點為兩線相交，不為終點；而結點為兩線相交為終點，沒有延伸； 1.分支節點：它指向其他的節點，所以是度不為0的節點。 vs 葉子結點：度為0的結點 2.度：結點擁有的子樹數；就是說這個結點下面有幾條分支 3.樹的深度：樹有幾層 4.10折交叉驗證：常用

python機器學習實戰2：實現決策樹

1.決策樹的相關知識在之前的接觸中決策樹直觀印象應該就是if-else的迴圈，if會怎麼樣，else之後再繼續if-else直至最終的結果。在上節講的kNN它其實已經可以完成很多工，但是它最大的缺點就是無法給資料集的內在含義，決策樹的主要優勢在於資料形式非常

機器學習實戰python版第三章決策樹程式碼理解

今天開始學習第三章決策樹。前面對決策樹的講解我就不寫了，書上寫的都很清楚，就是根據特徵的不同逐步的對資料進行分類，形狀像一個倒立的樹。決策樹演算法比kNN的演算法複雜度要低，理解起來也有一定難度。資訊增益每一組資料都有自己的熵，資料要整齊，熵越低。也就是說屬於同一類的

python實現將某程式碼檔案複製／移動到指定路徑下（檔案、資料夾的移動、複製、刪除、重新命名）

用python實現將某程式碼檔案複製／移動到指定路徑下。場景例如：mv ./xxx/git/project1/test.sh ./xxx/tmp/tmp/1/test.sh （相對路徑./xxx/tmp/tmp/1/不一定存在） # -

Python建立決策樹—解決隱形眼鏡選擇問題

現在我們碰到這樣一個問題，一個人去醫院想配一副隱形眼鏡。我們需要通過問他4個問題，決定他需要帶眼鏡的型別。那麼如何解決這個問題呢？我們決定用決策樹。首先我們去下載一個隱形眼鏡資料集，資料來源於UCI資料庫。下載了lenses.data檔案，如下： 1 1 1 1 1 3 2 1 1

python實現決策樹程式碼

相關推薦