用線性迴歸模型預測房價

阿新 • • 發佈：2018-12-22

本文使用sklearn 中自帶的波士頓房價資料集來訓練模型，然後利用模型來預測房價。這份收據中共收集了13個特徵。

1.輸入特徵

import matplotlib.pyplot as plt
import numpy as np
from sklearn.datasets import load_boston

boston = load_boston()
X = boston.data
y = boston.target
X.shape

輸出為：“(506,13)”共有506個樣本 13個特徵。


print(X[0])
輸出結果為：
array([  6.32000000e-03,   1.80000000e+01,   2.31000000e+00,
         0.00000000e+00,   5.38000000e-01,   6.57500000e+00,
         6.52000000e+01,   4.09000000e+00,   1.00000000e+00,
         2.96000000e+02,   1.53000000e+01,   3.96900000e+02,
         4.98000000e+00])

可以通過boston.feature_names 來檢視這些特徵的標籤

array(['CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE', 'DIS', 'RAD',
       'TAX', 'PTRATIO', 'B', 'LSTAT'], 
      dtype='|S7')

2.模型訓練

LinearRegression 類實現了線性迴歸演算法。在訓練之前先把資料集分為兩份。

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=3)

訓練模型並測試模型準確性

import time
from sklearn.linear_model import LinearRegression

model = LinearRegression()

start = time.clock()
model.fit(X_train, y_train)

train_score = model.score(X_train, y_train)
cv_score = model.score(X_test, y_test)
print('elaspe: {0:.6f}; train_score: {1:0.6f}; cv_score: {2:.6f}'.format(time.clock()-start, train_score, cv_score))

統計了模型的訓練時間，統計模型對訓練樣本的準確性得分（即對訓練樣本的擬合好壞程度）train_score,還統計了模型對測試樣本的得分 cv_score
執行結果如下：

elaspe: 0.002447; train_score: 0.723941; cv_score: 0.794958

從結果可以看出模型擬合效果一般。

3.模型優化

模型優化的方式
1.觀察特徵的變化範圍從 $10^{-3}$ 級別到 $10^2$ ,先將資料進行歸一化的處理，可以加快演算法的收斂速度。
2.增加多項式特徵

from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import PolynomialFeatures
from sklearn.pipeline import Pipeline

def polynomial_model(degree=1):
    polynomial_features = PolynomialFeatures(degree=degree,
                                             include_bias=False)
    linear_regression = LinearRegression(normalize=True)
    pipeline = Pipeline([("polynomial_features", polynomial_features),
                         ("linear_regression", linear_regression)])
    return pipeline

接著我們使用二階多項式來你和資料：

model = polynomial_model(degree=2)

start = time.clock()
model.fit(X_train, y_train)

train_score = model.score(X_train, y_train)
cv_score = model.score(X_test, y_test)
print('elaspe: {0:.6f}; train_score: {1:0.6f}; cv_score: {2:.6f}'.format(time.clock()-start, train_score, cv_score))

輸出結果是：

elaspe: 0.016412; train_score: 0.930547; cv_score: 0.860465

訓練樣本分數和測試樣本分數都提高了，模型得到了優化。
把多項式特徵改為三階檢視效果。
執行結果為：

elaspe: 0.133220; train_score: 1.000000; cv_score: -105.517016

針對訓練樣本的分數達到了1 ，而對測試樣本的分數卻是負數，產生了過擬合。

4.學習曲線

通過畫出學習曲線，來對模型的狀態及優化的方向直觀的觀察。

from common.utils import plot_learning_curve
from sklearn.model_selection import ShuffleSplit

cv = ShuffleSplit(n_splits=10, test_size=0.2, random_state=0)
plt.figure(figsize=(18, 4), dpi=200)
title = 'Learning Curves (degree={0})'
degrees = [1, 2, 3]

start = time.clock()
plt.figure(figsize=(18, 4), dpi=200)
for i in range(len(degrees)):
    plt.subplot(1, 3, i + 1)
    plot_learning_curve(plt, polynomial_model(degrees[i]), title.format(degrees[i]), X, y, ylim=(0.01, 1.01), cv=cv)

print('elaspe: {0:.6f}'.format(time.clock()-start))

學習曲線

用線性迴歸模型預測房價

本文使用sklearn 中自帶的波士頓房價資料集來訓練模型，然後利用模型來預測房價。這份收據中共收集了13個特徵。 1.輸入特徵 import matplotlib.pyplot as plt import numpy as np from sklearn.da

機器學習--線性迴歸演算法預測房價

裡面非常詳細地介紹了微積分基本運演算法則、線性迴歸演算法、梯度下降演算法及改進。 a. 用線性迴歸方法擬合正弦函式 %matplotlib inline import matplotlib.pyplot as plt import numpy as np # 生成2

skleran 學習路徑一線性迴歸模型預測

使用sklearn 裡面的datasets 內建資料集波士頓的房價來測試這個模型首先匯入 from sklearn import datasets loaded_data = datasets.load_boston()#波士頓房價預測 data_x =

利用線性迴歸模型進行kaggle房價預測

最近剛學線性迴歸的一些基礎知識，就想利用kaggle中的一個入門級比賽 House Prices: Advanced Regression Techniques進行一下鞏固，發現建模之前的資料清洗與特徵選擇非常重要。 1. 資料清洗 1.1 匯入資料將tra

機器學習實戰（一）—— 用線性回歸預測波士頓房價

-1 png 機器學習 mage 回歸線性回歸 blog 分享機器機器學習實戰（一）—— 用線性回歸預測波士頓房價

線性迴歸之波士頓房價預測

from sklearn.datasets import load_boston import numpy as np import matplotlib.pyplot as plt def feature_scalling(X): mean = X.mean(axis=0) s

迴歸模型與房價預測

from sklearn.datasets import load_boston boston = load_boston() boston.keys() print(boston.DESCR) boston.data.shape boston.feature_names import pand

作業十三(迴歸模型與房價預測)

1.匯入boston房價資料集 from sklearn.datasets import load_boston boston=load_boston() boston.keys() print(boston.DESCR) boston.data.shape

第十三次作業——迴歸模型與房價預測

1. 匯入boston房價資料集 from sklearn.datasets import load_boston boston = load_boston() boston.keys() print(boston.DESCR) boston.data.

python用線性迴歸預測股票價格

線性迴歸在整個財務中廣泛應用於眾多應用程式中。在之前的教程中，我們使用普通最小二乘法（OLS）計算了公司的beta與相對索引的比較。現在，我們將使用線性迴歸來估計股票價格。線性迴歸是一種用於模擬因變數（y）和自變數（x）之間關係的方法。通過簡單的線性迴歸，只有一個自變數x

第十二次作業——基於波士頓資料集的迴歸模型與房價預測0.0

任務：匯入boston房價資料集一元線性迴歸模型，建立一個變數與房價之間的預測模型，並圖形化顯示。多元線性迴歸模型，建立13個變數與房價之間的預測模型，並檢測模型好壞，並圖形化顯示檢查結果。一元多項式迴歸模

【SciKit-Learn學習筆記】3：線性迴歸測算波士頓房價,Logistic迴歸預測乳腺癌

學習《scikit-learn機器學習》時的一些實踐。線性迴歸這部分和第一篇筆記"繪製隨機波動樣本的學習曲線 "部分基本類似。線性迴歸裡可以加入多項式特徵，以對模型做增強。線性迴歸增加多項式特徵,擬合sin函式 import numpy as np impor

用線性迴歸進行糖尿病預測

1、匯入相關模組 import numpy as np import pandas as pd from pandas import Series,DataFrame #普通線性迴歸 from sklearn.linear_model import Li

用 sklearn 線性迴歸擬合房價與房屋尺寸關係

線性迴歸：  線性迴歸(Linear Regression)是利用數理統計中迴歸分析，來確定兩種或兩種以上變數間相互依賴的定量關係的一種統計分析方法。  線性迴歸利用稱為線性迴歸方程的最小平方函式對一個或多個自變數和因變數之間關係進行建模。這種函式

通過機器學習的線性迴歸演算法預測股票走勢（用Python實現）

在本人的新書裡，將通過股票案例講述Python知識點，讓大家在學習Python的同時還能掌握相關的股票知識，所謂一舉兩得。這裡給出以線性迴歸演算法預測股票的案例，以此講述通過Python的sklearn庫實現線性迴歸預測的技巧。本文先講以波士頓房價資

matlab實現線性迴歸成績預測

目的 1. 熟悉matlab基本語法。 2. 使用matlab進行繪圖。 3. 複習線性迴歸於梯度下降。資料集與之前的文章，樸素貝葉斯實現成績等級分類相同，也是某市一模考試成績（只保留了語文英語數學和總分）假設函式等號的左側代表預測的成績，左側(θ0，θ

利用sklearn 中的線性迴歸模型訓練資料使用到的庫有numpy pandas matplotlib

** 利用sklearn 中的線性迴歸模型訓練資料使用到的庫有numpy pandas matplotlib ** import pandas as pd import matplotlib.pyplot as plt filename='ENB2012_data.xl

單變數的線性迴歸模型演算法

【寫在前面的話】大概一年前看過Andrew老師的機器學習課程，受益良多。今年在用機器學習分類的時候，發現很多機器學習基礎知識都已經忘得一乾二淨，對自己很是無語。因此，作者打算重新溫習一篇Andrew老師的機器學習課程，並用部落格來記錄每一節課程的知識要點，加油吧！機器學習模型：

機器學習筆記（一）線性迴歸模型

一、線性迴歸模型（一）引入—梯度下降演算法 1. 線性假設： 2. 方差代價函式： 3. 梯度下降： 4. : learning rate （用來控制我們在梯度下降時邁出多大的步子，值較大，梯度下降就很迅速）值過大易造成無法收斂到minimum（每一步邁更大）

Tensorflow程式設計構造一個簡單的線性迴歸模型

模型本次使用的是線性迴歸模型 y=Wx+b 其中 W 為權重， b 為偏置。 # -*- coding: utf-8 -*- import numpy as np import tensorflow as tf import matpl

用線性迴歸模型預測房價

1.輸入特徵

2.模型訓練

3.模型優化

4.學習曲線

相關推薦