sklearn+python:線性迴歸案例

阿新 • • 發佈：2020-02-24

使用一階線性方程預測波士頓房價

載入的資料是隨sklearn一起釋出的，來自boston 1993年之前收集的506個房屋的資料和價格。load_boston()用於載入資料。

from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split
import time
from sklearn.linear_model import LinearRegression


boston = load_boston()

X = boston.data
y = boston.target

print("X.shape:{}. y.shape:{}".format(X.shape,y.shape))
print('boston.feature_name:{}'.format(boston.feature_names))

X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.2,random_state=3)

model = LinearRegression()

start = time.clock()
model.fit(X_train,y_train)

train_score = model.score(X_train,y_train)
cv_score = model.score(X_test,y_test)

print('time used:{0:.6f}; train_score:{1:.6f},sv_score:{2:.6f}'.format((time.clock()-start),train_score,cv_score))

輸出內容為：

X.shape:(506,13). y.shape:(506,)
boston.feature_name:['CRIM' 'ZN' 'INDUS' 'CHAS' 'NOX' 'RM' 'AGE' 'DIS' 'RAD' 'TAX' 'PTRATIO'
 'B' 'LSTAT']
time used:0.012403; train_score:0.723941,sv_score:0.794958

可以看到測試集上準確率並不高，應該是欠擬合。

使用多項式做線性迴歸

上面的例子是欠擬合的，說明模型太簡單，無法擬合數據的情況。現在增加模型複雜度，引入多項式。

打個比方，如果原來的特徵是[a,b]兩個特徵，

在degree為2的情況下，多項式特徵變為[1,a,b,a^2,ab,b^2]。degree為其它值的情況依次類推。

多項式特徵相當於增加了資料和模型的複雜性，能夠更好的擬合。

下面的程式碼使用Pipeline把多項式特徵和線性迴歸特徵連起來，最終測試degree在1、2、3的情況下的得分。

from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split
import time
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import PolynomialFeatures
from sklearn.pipeline import Pipeline

def polynomial_model(degree=1):
  polynomial_features = PolynomialFeatures(degree=degree,include_bias=False)

  linear_regression = LinearRegression(normalize=True)
  pipeline = Pipeline([('polynomial_features',polynomial_features),('linear_regression',linear_regression)])
  return pipeline

boston = load_boston()
X = boston.data
y = boston.target
print("X.shape:{}. y.shape:{}".format(X.shape,random_state=3)

for i in range(1,4):
  print( 'degree:{}'.format( i ) )
  model = polynomial_model(degree=i)

  start = time.clock()
  model.fit(X_train,y_train)

  train_score = model.score(X_train,y_train)
  cv_score = model.score(X_test,y_test)

  print('time used:{0:.6f}; train_score:{1:.6f},cv_score))

輸出結果為：

X.shape:(506,)
boston.feature_name:['CRIM' 'ZN' 'INDUS' 'CHAS' 'NOX' 'RM' 'AGE' 'DIS' 'RAD' 'TAX' 'PTRATIO'
 'B' 'LSTAT']
degree:1
time used:0.003576; train_score:0.723941,sv_score:0.794958
degree:2
time used:0.030123; train_score:0.930547,sv_score:0.860465
degree:3
time used:0.137346; train_score:1.000000,sv_score:-104.429619

可以看到degree為1和上面不使用多項式是一樣的。degree為3在訓練集上的得分為1，在測試集上得分是負數，明顯過擬合了。

所以最終應該選擇degree為2的模型。

二階多項式比一階多項式好的多，但是測試集和訓練集上的得分仍有不少差距，這可能是資料不夠的原因，需要更多的訊據才能進一步提高模型的準確度。

正規方程解法和梯度下降的比較

除了梯度下降法來逼近最優解，也可以使用正規的方程解法直接計算出最終的解來。

根據吳恩達的課程，線性迴歸最優解為：

theta = (X^T * X)^-1 * X^T * y

其實兩種方法各有優缺點：

梯度下降法：

缺點：需要選擇學習率，需要多次迭代

優點：特徵值很多（1萬以上）時仍然能以不錯的速度工作

正規方程解法：

優點：不需要設定學習率，不需要多次迭代

缺點：需要計算X的轉置和逆，複雜度O3；特徵值很多（1萬以上）時特變慢

在分類等非線性計算中，正規方程解法並不適用，所以梯度下降法適用範圍更廣。

以上這篇sklearn+python:線性迴歸案例就是小編分享給大家的全部內容了，希望能給大家一個參考，也希望大家多多支援我們。

sklearn+python:線性迴歸案例

使用一階線性方程預測波士頓房價載入的資料是隨sklearn一起釋出的，來自boston 1993年之前收集的506個房屋的資料和價格。load_boston()用於載入資料。

Python+sklearn使用線性迴歸演算法預測兒童身高

>>> Python+sklearn使用線性迴歸演算法預測兒童身高 In[1]: import copy import numpy as np

python 實現一個簡單的線性迴歸案例

#!/usr/bin/env python # -*- coding: utf-8 -*- # @File : 自實現一個線性迴歸.py # @Author: 趙路倉

python 線性迴歸分析模型檢驗標準--擬合優度詳解

建立完迴歸模型後，還需要驗證咱們建立的模型是否合適，換句話說，就是咱們建立的模型是否真的能代表現有的因變數與自變數關係，這個驗證標準一般就選用擬合優度。

Python 線性迴歸分析以及評價指標詳解

廢話不多說，直接上程式碼吧！ \"\"\" # 利用 diabetes資料集來學習線性迴歸 # diabetes 是一個關於糖尿病的資料集，該資料集包括442個病人的生理資料及一年以後的病情發展情況。

python線性迴歸

一.理論基礎 1.迴歸公式　　對於單元的線性迴歸，我們有：f(x) = kx + b 的方程(k代表權重，b代表截距）。　　對於多元線性迴歸，我們有：　　　　　或者為了簡化，乾脆將b視為k0·x0,，其中k0為1，於是我們就有：

Python線性迴歸應用舉例

在發電場中電力輸出（PE）與溫度（AT）、壓力（V）、溼度（AP）、壓強（RH）有關。

python深度學習-tensorflow實現一個線性迴歸的案例

線性迴歸：w1x1+w2x2+w3x3+......+wnxn+bias(這是一個偏移量)，我們採用的演算法是：線性迴歸，策略是：均方誤差，優化是：梯度下降API,

Python Flask + Echarts +sklearn做個簡單的線性迴歸

Flask + Echarts + sklearn 做個簡單的線性迴歸 @ 目錄 Flask + Echarts + sklearn 做個簡單的線性迴歸

Python多元線性迴歸-sklearn.linear_model，並對其預測結果評估

在前面的部落格已經介紹過多元迴歸模型，現在這裡粗略介紹如下 python 實現案例

python用線性迴歸預測股票價格的實現程式碼

線性迴歸在整個財務中廣泛應用於眾多應用程式中。在之前的教程中，我們使用普通最小二乘法（OLS）計算了公司的beta與相對索引的比較。現在，我們將使用線性迴歸來估計股票價格。

關於多元線性迴歸分析——Python&SPSS

原始資料在這裡 1.觀察資料首先，用Pandas開啟資料，並進行觀察。 import numpy import pandas as pd

python使用梯度下降演算法實現一個多線性迴歸

python使用梯度下降演算法實現一個多線性迴歸，供大家參考，具體內容如下圖示：

第二週：python實現線性迴歸（啞變量回歸）的高效方法

我怎麼覺得自己就像小學生在寫青創日記…… 知道了pickle是啥。pickle提供了一個簡單的持久化功能。可以將物件以檔案的形式存放在磁碟上。

如何在python中實現線性迴歸

線性迴歸是基本的統計和機器學習技術之一。經濟，電腦科學，社會科學等等學科中，無論是統計分析，或者是機器學習，還是科學計算，都有很大的機會需要用到線性模型。建議先學習它，然後再嘗試更復雜的方法。

Python-深入淺出資料分析-線性迴歸

目錄做一個薪水預測器怎麼做是不是有一個函式誤差分析在閱讀前，讀一下Python-深入淺出資料分析-總結會更好點，以後遇到問題比如程式碼執行不了，再讀讀也行，>-_-<

線性迴歸：Sklearn與Excel

作者|Kaushik Choudhury 編譯|VK 來源|Towards Data Science 大約13年前，David Cournapeau的Scikit learn作為Google Summer of Code專案的一部分開始。隨著時間的推移，Scikit learn成為Python中最著名的機器學習庫

python程式碼利用梯度下降法實現簡單的線性迴歸

1 def myregression(): 2#由於在tensofflow2.0以上的版本，eager execution 是預設開啟的。如果不加此語句，直接執行程式將會報錯

【優達學城測評】sklearn-線性迴歸

2019獨角獸企業重金招聘Python工程師標準>>> 個人覺得這是最最簡單的，套直線方程就可以。

python 還原梯度下降演算法實現一維線性迴歸

首先我們看公式：這個是要擬合的函式然後我們求出它的損失函式，注意：這裡的n和m均為資料集的長度，寫的時候忘了

sklearn+python:線性迴歸案例

相關推薦