關於多元線性迴歸分析——Python&SPSS

阿新 • • 發佈：2020-02-24

原始資料在這裡

1.觀察資料

首先，用Pandas開啟資料，並進行觀察。

import numpy 
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
 
data = pd.read_csv('Folds5x2_pp.csv')
data.head()

會看到資料如下所示：

關於多元線性迴歸分析——Python&SPSS

這份資料代表了一個迴圈發電廠，每個資料有5列，分別是:AT（溫度）,V（壓力）,AP（溼度）,RH（壓強）,PE（輸出電力)。我們不用糾結於每項具體的意思。

我們的問題是得到一個線性的關係，對應PE是樣本輸出，而AT/V/AP/RH這4個是樣本特徵，機器學習的目的就是得到一個線性迴歸模型，即: PE=θ0+θ1∗AT+θ2∗V+θ3∗AP+θ4∗RH 而需要學習的，就是θ0,θ1,θ2,θ3,θ4這5個引數。

接下來對資料進行歸一化處理：

data = (data - data.mean())/data.std()

因為迴歸線的截距θ0是不受樣本特徵影響的，因此我們在此可以設立一個X0=1，使得迴歸模型為：

PE=θ0*X0+θ1∗AT+θ2∗V+θ3∗AP+θ4∗RH

將方程向量化可得：

PE = hθ(x) = θx (θ應轉置)

2.線性迴歸

線上性迴歸中，首先應建立 cost function，當 cost function 的值最小時所取得θ值為所求的θ。

線上性迴歸中，Cost function如下所示：

關於多元線性迴歸分析——Python&SPSS

因此，可以在Python中建立函式求損失方程：

def CostFunction(X,y,theta):
  inner = np.power((X*theta.T)-y,2)
  return np.sum(inner)/(2*len(X))

然後，設初始θ為=[0,0],可得到最初的J(θ)值為0.49994774247491858，程式碼如下所示

col = data.shape[1]
X = data.iloc[:,0:col-1]
y = data.iloc[:,col-1:col]
X = np.matrix(X.values)
y = np.matrix(y.values)
theta = np.matrix(np.array([0,0]))
temp = np.matrix(np.zeros(theta.shape))
CostFunction(X,theta)

接下來，有兩種方法可以使用。1.梯度下降法（gradient descent）和 2.最小二乘法（normal equation）。在此我們使用梯度下降法來求解。

梯度下降法是求得J對θ的偏導數，通過設定步長，迭代使J(θ)逐步下降，從而求得區域性最優解。

公式如下所示：

關於多元線性迴歸分析——Python&SPSS

j：特徵編號

m:樣本編號

我們可以在Python中寫出計算迭代後的θ和J(θ)

def gradientDescent(X,theta,alpha,iters):
  temp = np.matrix(np.zeros(theta.shape))
  parameters = int(theta.ravel().shape[1])
  cost = np.zeros(iters)
  for i in range(iters):
    error = (X*theta.T)-y
    
    for j in range(parameters):
      term = np.multiply(error,X[:,j])
      temp[0,j] = theta[0,j] - (alpha/len(X))*np.sum(term)
      
    theta = temp
    cost[i] = CostFunction(X,theta)
    
  return theta,cost

在此，我設定初始的α為0.1，可求得迭代1000次後θ0,θ4的值分別是：

-5.22080706e-14,-8.63485491e-01,-1.74182863e-01,2.16058120e-02,-1.35205248e-01

此時 J(θ)的值為0.0379648。

通過，視覺化J(θ)和迭代次數可以發現，J(θ)收斂的非常快。

關於多元線性迴歸分析——Python&SPSS

畫圖觀察預測值和損失值，距離直線約近說明損失越小：

predicted = X*g.T
predicted = predicted.flatten().A[0]
y_f= y.flatten().A[0]
fig,ax = plt.subplots()
ax.scatter(y_f,predicted)
ax.plot([y.min(),y.max()],[y.min(),'k--',lw=4)
ax.set_xlabel('Measured')
ax.set_ylabel('Predicted')
plt.show()

關於多元線性迴歸分析——Python&SPSS

3.sckit-learn

因為J(θ)收斂的太快了…所以我又用sckit-learn和SPSS驗證了一下。

先看sckit-learn，在sklearn中，線性迴歸是使用的最小二乘法而不是梯度下降法，用起來也十分的簡單。

程式碼如下：

from sklearn import linear_model 
model = linear_model.LinearRegression() 
model.fit(X,y)

打印出θ值後發現和梯度下降法算出來的相差無幾，θ0,θ4的值分別是：

0，-0.86350078，-0.17417154，0.02160293，-0.13521023

4.SPSS

在看看SPSS

同樣先將資料標準化後進行線

關於多元線性迴歸分析——Python&SPSS

然後進行線性迴歸分析得到結果：

關於多元線性迴歸分析——Python&SPSS

嘛…和前面兩種方法的結果也差不多…就這樣吧。

以上這篇關於多元線性迴歸分析——Python&SPSS就是小編分享給大家的全部內容了，希望能給大家一個參考，也希望大家多多支援我們。

關於多元線性迴歸分析——Python&SPSS

原始資料在這裡 1.觀察資料首先，用Pandas開啟資料，並進行觀察。 import numpy import pandas as pd

python資料分析：多元線性迴歸

技術標籤：資料分析python 多元線性迴歸，即多個變數對目標值的影響（Y=aX1+bX2+cX3…+z）；接下來分析下“店鋪面積”和“距離最近的車站”對便利店“月營業額”的影響，並預測店鋪的月營業額。資料準備如下：

python 線性迴歸分析模型檢驗標準--擬合優度詳解

建立完迴歸模型後，還需要驗證咱們建立的模型是否合適，換句話說，就是咱們建立的模型是否真的能代表現有的因變數與自變數關係，這個驗證標準一般就選用擬合優度。

Python 線性迴歸分析以及評價指標詳解

廢話不多說，直接上程式碼吧！ \"\"\" # 利用 diabetes資料集來學習線性迴歸 # diabetes 是一個關於糖尿病的資料集，該資料集包括442個病人的生理資料及一年以後的病情發展情況。

多元線性迴歸-python實現的3種方法

import numpy as np import statsmodels.api as sm from gekko import GEKKO # Data x0 = np.array([4,5,2,3,-1,1,6,7])

Python機器學習的練習二：多元線性迴歸

在第1部分中，我們用線性迴歸來預測新的食品交易的利潤，它基於城市的人口數量。對於第2部分，我們有了一個新任務——預測房子的售價。這次的不同之處在於我們有多個因變數。我們知道房子的大小，以及房子裡臥室的數

Python多元線性迴歸-sklearn.linear_model，並對其預測結果評估

在前面的部落格已經介紹過多元迴歸模型，現在這裡粗略介紹如下 python 實現案例

02-07 多元線性迴歸(波士頓房價預測)

目錄多元線性迴歸(波士頓房價預測)一、匯入模組二、獲取資料三、訓練模型四、視覺化五、均方誤差測試

量綱對迴歸結果的影響_模型之母：多元線性迴歸

技術標籤：量綱對迴歸結果的影響 0x00 前言線上性迴歸的前3篇中，我們介紹了簡單線性迴歸這種樣本只有一個特徵值的特殊形式，並且瞭解了一類機器學習的建模推導思想，即：

機器學習演算法--多元線性迴歸模型

技術標籤：機器學習演算法python機器學習線性迴歸演算法將一元線性迴歸模型推廣到多個解釋變數，這個過程叫作多元線性迴歸：現用資料集中的所有變數來訓練多元迴歸模型：

機器學習sklearn（75）：演算法例項（三十二）迴歸（四）線性迴歸大家族（二）多元線性迴歸LinearRegression

1 多元線性迴歸的基本原理 2 最小二乘法求解多元線性迴歸的引數 https://en.wikipedia.org/wiki/Matrix_calculus

機器學習：單元線性迴歸（python簡單實現）

本篇文章主要記錄和講解使用python如何簡單實現單元線性迴歸演算法文章簡介

機器學習筆記（四）——多元線性迴歸（sklearn）

本部落格僅用於個人學習，不用於傳播教學，主要是記自己能夠看得懂的筆記（

多元線性迴歸模型

一元線性迴歸模型分析兩個變數之間知否存在明顯的線性關係一元線性迴歸公式：y=ax+b

多元線性迴歸實驗學習筆記

先貼個程式碼，有空再寫 from matplotlib import projections import numpy as np import matplotlib.pyplot as plt

5-8.實現多元線性迴歸

import numpy as np import matplotlib.pyplot as plt from sklearn import datasets boston_data = datasets.load_boston()

Microsoft 線性迴歸分析演算法

前言在此係列中涵蓋了微軟在商業智慧（BI）模組系統所能提供的所有挖掘演算法，當然此框架完全可以自己擴充，可以自定義挖掘演算法，不過目前此係列中還不涉及，只涉及微軟提供的演算法，當然這些演算法已經基本涵

Python-深入淺出資料分析-線性迴歸

目錄做一個薪水預測器怎麼做是不是有一個函式誤差分析在閱讀前，讀一下Python-深入淺出資料分析-總結會更好點，以後遇到問題比如程式碼執行不了，再讀讀也行，>-_-<

Python資料分析之雙色球基於線性迴歸演算法預測

@本文來源於公眾號：csdn2299，喜歡可以關注公眾號程式設計師學府本文例項講述了Python資料分析之雙色球基於線性迴歸演算法預測下期中獎結果。分享給大家供大家參考，具體如下：

python程式碼實現迴歸分析--線性迴歸

python程式碼實現迴歸分析--線性迴歸 Aming 科技愛好者 19 人贊同了該文章 #概念篇:

關於多元線性迴歸分析——Python&SPSS

相關推薦