機器學習(4)--估算波士頓房屋價格----帶AdaBoost的決策樹迴歸模型

阿新 • • 發佈：2019-01-02

估算波士頓房屋價格—-帶AdaBoost決策樹迴歸模型

使用帶AdaBoost演算法的決策樹迴歸器(descision tree regressor)

決策樹模型: 樹狀模型,每個節點做決策,從而影響決策結果,葉子節點表示輸出結果,分支表示根據輸入做出中間決策
AdaBoost:利用其他系統增強模型準確型的技術

程式碼如下:

#-*- coding:utf-8 -*-
import numpy as np
from sklearn.tree import DecisionTreeRegressor
from sklearn.ensemble import AdaBoostRegressor
from 
 sklearn import  datasets
from sklearn.metrics import mean_squared_error,explained_variance_score
from sklearn.utils import shuffle
import matplotlib.pyplot as plt

#載入房屋資料 波士頓房屋價格
housing_data=datasets.load_boston()
#housing_data.data 代表輸入價格,housing_data.target代表輸出價格
x,y=shuffle(housing_data.data,housing_data.target,random_state=7 
)

#將資料分成80% 用於訓練,其他用於測試
num_training=int(0.8*len(x))
#訓練資料
x_train,y_train=x[:num_training],y[:num_training]
#測試資料
x_test,y_test=x[num_training:],y[num_training:]

#建立決策樹模型 最大深度是4 限制決策樹的深度
dt_regressor=DecisionTreeRegressor(max_depth=4)
dt_regressor.fit(x_train,y_train)

#使用帶AdaBoost演算法的決策樹模型進行擬合 fit代表擬合 

ab_regressor=AdaBoostRegressor(DecisionTreeRegressor(max_depth=4),n_estimators=400,random_state=7)
ab_regressor.fit(x_train,y_train)

#檢視決策樹迴歸器的訓練結果
y_pred_dt=dt_regressor.predict(x_test)
mse=mean_squared_error(y_test,y_pred_dt)
evs=explained_variance_score(y_test,y_pred_dt)
print "\n ###決策樹學習效果###"
print "均方誤差 = ",round(mse,2)
print "解釋方差分 = ",round(evs,2)


#檢視對AdaBoost進行進行改進之後的演算法
y_pred_ab=ab_regressor.predict(x_test)
mse=mean_squared_error(y_test,y_pred_ab)
evs=explained_variance_score(y_test,y_pred_ab)
print "\n ###AdaBoost演算法改善效果###"
print "均方誤差 = ",round(mse,2)
print "解釋方差分 = ",round(evs,2)

def plot_feature_importances(feature_importances,title,feature_names):
    #將重要性值標準化
    feature_importances=100.0*(feature_importances/max(feature_importances))
    #將得分從低到高進行排序 flipud 實現矩陣的翻轉
    index_sorted=np.flipud(np.argsort(feature_importances))
    #讓x座標軸上的把標籤居中 shape用於讀取矩陣的長度
    pos=np.arange(index_sorted.shape[0])+0.5
    #畫出條形圖
    plt.figure()
    #bar代表柱形圖
    plt.bar(pos,feature_importances[index_sorted],align='center')
    #為x軸的主刻度設定值
    plt.xticks(pos,feature_names[index_sorted])
    plt.ylabel('Relative importance')
    plt.title(title)
    plt.show()
#特徵重要性 圖形表示 feature_importances 代表每個特徵多樣性
#plot_feature_importances(dt_regressor.feature_importances_,'Decision Tree Regressor ',housing_data.feature_names)
plot_feature_importances(ab_regressor.feature_importances_,'AdaBoost Regressor ',housing_data.feature_names)

輸出結果

 ###決策樹學習效果###
均方誤差 =  14.79
解釋方差分 =  0.82

 ###AdaBoost演算法改善效果###
均方誤差 =  7.64
解釋方差分 =  0.91

繪製圖形如下所示:

這裡寫圖片描述

機器學習(4)--估算波士頓房屋價格----帶AdaBoost的決策樹迴歸模型

估算波士頓房屋價格—-帶AdaBoost決策樹迴歸模型使用帶AdaBoost演算法的決策樹迴歸器(descision tree regressor) 決策樹模型: 樹狀模型,每個節點做決策,從而影響決策結果,葉子節點表示輸出結果,分支表示根據輸

Python3實現機器學習經典演算法（四）C4.5決策樹

一、C4.5決策樹概述　　C4.5決策樹是ID3決策樹的改進演算法，它解決了ID3決策樹無法處理連續型資料的問題以及ID3決策樹在使用資訊增益劃分資料集的時候傾向於選擇屬性分支更多的屬性的問題。它的大部分流程和ID3決策樹是相同的或者相似的，可以參考我的上一篇部落格：https://www.cnblogs.

《機器學習》讀書筆記，第三章決策樹學習

決策樹學習是應用最廣泛的歸納推理演算法之一。它是一種逼近離散值函式的方法，對噪聲資料有很好的健壯性且能夠學習析取表示式本章描述了一系列決策樹學習演算法，包括如ID3、ASSISTANT和C4.5 這些決策樹學習方法搜尋一個完整表示的假設空間，從而避免了受限假設空間的不足

機器學習經典演算法詳解及Python實現--決策樹（Decision Tree）

（一）認識決策樹 1，決策樹分類原理決策樹是通過一系列規則對資料進行分類的過程。它提供一種在什麼條件下會得到什麼值的類似規則的方法。決策樹分為分類樹和迴歸樹兩種，分類樹對離散變數做決策樹，迴歸樹對連續變數做決策樹。近來的調查表明決策樹也是最經常使用的資料探勘演算法，它

spark機器學習筆記：（六）用Spark Python構建迴歸模型

博主簡介：風雪夜歸子（英文名：Allen），機器學習演算法攻城獅，喜愛鑽研Meachine Learning的黑科技，對Deep Learning和Artificial Intelligence充滿興趣，經常關注Kaggle資料探勘競賽平臺，對資料、Machi

機器學習--手寫數字識別（KNN、決策樹）

KNN 及決策樹演算法為監督學習中的兩種簡單演算法。 KNN KNN演算法（鄰近演算法）的核心思想是如果一個樣本在特徵空間中的k個最相鄰的樣本中的大多數屬於某一個類別，則該樣本也屬於這個類別，並具有這個類別上樣本的特性。歐式距離的計算公式: 假設每個樣本有兩個特徵值，如 A

spark機器學習庫指南[Spark 1.3.1版]——決策樹(decision trees)

fuqingchuan 機器學習 2015-03-22  3,477 次瀏覽 GINI, spark, 決策樹, 熵 spark機器學習庫指南[Spark 1.3.1版]——決策樹(decision trees)已關閉評論下面是章節決策

（參評）機器學習筆記——鳶尾花資料集（KNN、決策樹、樸素貝葉斯分析）

最開始選取鳶尾花資料集來了解決策樹模型時，筆者是按照學習報告的形式來寫得，在這裡將以原形式上傳。格式較為繁複，希望讀者可以耐心看完，謝謝大家。目錄 6.總結 7.問題 1、問題描述 iris是鳶尾植物，這裡儲存了其萼片和花瓣的長寬，共4個屬性，鳶尾

機器學習回顧篇（8）：CART決策樹演算法

注：本系列所有部落格將持續更新併發布在github和gitee上，您可以通過github、gitee下載本系列所有文章筆記檔案。 1 引言上一篇部落格中介紹了ID3和C4.5兩種決策樹演算法，這兩種決策樹都只能用於分類問題，而本文要說的CART（classification and regression

機器學習——十大資料探勘之一的決策樹CART演算法

本文始發於個人公眾號：TechFlow，原創不易，求個關注今天是**機器學習專題**的第23篇文章，我們今天分享的內容是十大資料探勘演算法之一的CART演算法。 CART演算法全稱是**Classification and regression tree**，也就是分類迴歸樹的意思。和之前介紹

【人臉檢測——基於機器學習4】HOG特征

block 模板 onf 介紹顏色組成 computer com ams 前言 HOG特征的全稱是Histograms of Oriented Gradients，基於HOG特征的人臉識別算法主要包括HOG特征提取和目標檢測，該算法的流程圖如下圖所示。本文主要講HOG特

機器學習-4（k-進鄰演算法簡介中）

既然要介紹該演算法，我們就簡單介紹一下歐式距離這個應該是我們初中就學過的了，2點之間的距離就是它的多維空間裡面每個維度的座標的差的平方之和，再開方公式就是 OK，我們現在按照分類的基本原則，把所有的樣本集都放進我們的座標系裡面來，有多少特徵，我們就建立幾維的空間座標系。

機器學習4---淺談神經網路

1. 神經元模型神經網路是一個多學科交叉的領域，比較常見的定義是：“”神經網路是由具有適應性的簡單單元組成的廣泛並行互連的網路，它的組織能模擬生物神經系統對真實世界物體做出的互動反應“”。神經網路中最基本的成分是神經元模型，典型的為m-p神經元模型，從生物

機器學習4（線性代數）

機器學習 ——線性代數（矩陣的知識） Octave下操作矩陣 1、矩陣基本操作建立矩陣 A = [1, 2, 3; 4, 5, 6; 7, 8, 9; 10, 11, 12] 建立向量 v = [1;2;3] 獲取矩陣行列儲存到m，n [m,n] = size(

機器學習4：邏輯迴歸與線性迴歸

邏輯迴歸與線性迴歸求解過程：總體來說，迴歸過程都分三步： 1、Model 2、Loss Fuction 3、Gradient Decent 分析： 1、Model：線性迴歸中，模型為線性方程，取值範圍無窮大；邏輯迴歸中，通過sigmod函式函式將線性方程z轉化成概率（

玩玩機器學習4——TensorFlow基礎之啟用函式

啟用函式（activation function）執行時啟用神經網路中某一部分神經元，將啟用資訊向後傳入下一層的神經網路。神經網路之所以能解決非線性問題（如語音、影象識別），本質上就是啟用函式加入了非線性因素，彌補了線性模型的表達力，把“啟用的神經元的特徵”通過

吳恩達-機器學習(4)-神經網路

文章目錄 Neural NetWorking Non-linear Hypotheses Examples and Intuitions Mutlli-class Classification

機器學習4-支援向量機

目錄支援向量機(SVM) 原理引數不同核函式的分類效果線性核函式:linear 多項式核函式:poly 徑向基核函式：rbf 樣本類別均衡化置信概率網格

人工智障學習筆記——機器學習(4)支援向量機

一.概念支援向量機(Support Vector Machine)，簡稱SVM。是常見的一種判別方法。在機器學習領域，是一個有監督的學習模型，通常用來進行模式識別、分類以及迴歸分析。 SVM的主要思想可以概括為兩點： 1.它是針對線性可分情況進行分析，對於線性不可分的情況

機器學習4/100-Logistic迴歸

Day4 Logistic迴歸 github: 100DaysOfMLCode Logistic迴歸用於分類問題，可以直接用於二分類問題，也可以設計應用於多分類問題。原理傳統的感知機將wx+b>0和wx+b<0實現二分類（0、1），Logistics迴歸更進一步，

機器學習(4)--估算波士頓房屋價格----帶AdaBoost的決策樹迴歸模型

估算波士頓房屋價格—-帶AdaBoost決策樹迴歸模型

相關推薦