一元線性迴歸-python

阿新 • • 發佈：2018-12-10

思路：

1、從0~10，生成等間距20個數作為x，

2、利用迴歸公式 y=5 + 2x + $\varepsilon$

3、計算y值

4、對資料進行估計

#生成從0到10之間選20個等間距的數
import numpy as np
import matplotlib.pyplot as plt
import statsmodels.api as sm
nsample = 20
#從0到10之間選20個等間距的數
x=np.linspace(0,10,nsample)
x

array([ 0.        ,  0.52631579,  1.05263158,  1.57894737,  2.10526316,
        2.63157895,  3.15789474,  3.68421053,  4.21052632,  4.73684211,
        5.26315789,  5.78947368,  6.31578947,  6.84210526,  7.36842105,
        7.89473684,  8.42105263,  8.94736842,  9.47368421, 10.        ])

#使用最小二乘法，需要在陣列的前面新增一列 1，目的是與常數項組合
X=sm.add_constant(x)
X

array([[ 1.        ,  0.        ],
       [ 1.        ,  0.52631579],
       [ 1.        ,  1.05263158],
       [ 1.        ,  1.57894737],
       [ 1.        ,  2.10526316],
       [ 1.        ,  2.63157895],
       [ 1.        ,  3.15789474],
       [ 1.        ,  3.68421053],
       [ 1.        ,  4.21052632],
       [ 1.        ,  4.73684211],
       [ 1.        ,  5.26315789],
       [ 1.        ,  5.78947368],
       [ 1.        ,  6.31578947],
       [ 1.        ,  6.84210526],
       [ 1.        ,  7.36842105],
       [ 1.        ,  7.89473684],
       [ 1.        ,  8.42105263],
       [ 1.        ,  8.94736842],
       [ 1.        ,  9.47368421],
       [ 1.        , 10.        ]])

#構造y值，β0=2，β1=5
bate = np.array([2,5])
bate

array([2, 5])

#設計誤差資料，構造高斯分佈
e=np.random.normal(size=nsample)
e

array([-0.08130226, -0.99898515, -0.46717904, -0.52487297, -0.85998302,
        1.00102852,  0.61557834,  0.4359724 ,  1.36966089, -0.17069984,
        0.33877027, -1.602145  , -0.1940928 ,  1.58914167, -2.09103106,
       -0.87802483, -0.46069062, -2.32511203, -1.42386623, -0.22494043])

#實際值，y=β0 + x*β1 + e，構造出來的用於測試的真實值
y=np.dot(X,bate)+e
y

array([ 1.91869774,  3.6325938 ,  6.79597886,  9.36986387, 11.66633277,
       16.15892325, 18.40505202, 20.85702504, 24.42229247, 25.51351069,
       28.65455974, 29.34522342, 33.38485457, 37.79966799, 36.75107421,
       40.59565938, 43.64457254, 44.41173008, 47.94455482, 51.77505957])

資料構造完畢，計算迴歸方程

#最小二乘法
model=sm.OLS(y,X)

#擬合數據
res=model.fit()

#迴歸係數，即β0、β2
res.params

array([2.15061173, 4.90034992])

#檢視全部評估結果資料
res.summary()

OLS Regression Results
Dep. Variable:	y	R-squared:	0.996
Model:	OLS	Adj. R-squared:	0.995
Method:	Least Squares	F-statistic:	4072.
Date:	Thu, 13 Sep 2018	Prob (F-statistic):	1.15e-22
Time:	10:44:47	Log-Likelihood:	-28.152
No. Observations:	20	AIC:	60.30
Df Residuals:	18	BIC:	62.30
Df Model:	1
Covariance Type:	nonrobust

coef	std err	t	P>\|t\|	[0.025	0.975]
const	2.1506	0.449	4.788	0.000	1.207	3.094
x1	4.9003	0.077	63.815	0.000	4.739	5.062

Omnibus:	0.468	Durbin-Watson:	1.957
Prob(Omnibus):	0.791	Jarque-Bera (JB):	0.572
Skew:	0.274	Prob(JB):	0.751
Kurtosis:	2.378	Cond. No.	11.5

Warnings: [1] Standard Errors assume that the covariance matrix of the errors is correctly specified.

#擬合估計值
y_=res.fittedvalues
y_

array([ 2.15061173,  4.72974327,  7.30887481,  9.88800634, 12.46713788,
       15.04626942, 17.62540096, 20.2045325 , 22.78366403, 25.36279557,
       27.94192711, 30.52105865, 33.10019019, 35.67932172, 38.25845326,
       40.8375848 , 43.41671634, 45.99584788, 48.57497942, 51.15411095])

#繪圖
fig,ax=plt.subplots(figsize=(8,6))
ax.plot(x,y,'o',label='data')#原始資料
ax.plot(x,y_,'r--',label='test')#擬合數據
ax.legend(loc='best')
plt.show()

一元線性迴歸-python

思路： 1、從0~10，生成等間距20個數作為x， 2、利用迴歸公式 y=5 + 2x + 3、計算y值 4、對資料進行估計 #生成從0到10之間選20個等間距的數 import numpy as np import matplotlib.pyplot as pl

機器學習3- 一元線性迴歸+Python實現

[toc] # 1. 線性模型給定 $d$ 個屬性描述的示例 $\boldsymbol{x} = (x_1; x_2; ...; x_d)$，其中 $x_i$ 為 $\boldsymbol{x}$ 在第 $i$ 個屬性上的取值，**線性模型**（*linear model*）試圖學得一個通過屬性的線性組合

python實現一元線性迴歸

最近在看中長期水文預報，打算使用python語言實現課本的模型並進行例項的計算結果的檢驗，為了監督自己和整理記錄自己實現的模型程式碼，打算寫部落格記錄自己的程式碼實現和部分思路。首先，自己不使用現成的模組實現的是一元線性迴歸模型，然後和模組實現對比，學習模組的呼叫。接下來是直接編寫的程式檔案，並計算

[Python] 一元線性迴歸分析例項

本文通過一個簡單的例子：預測房價，來探討怎麼用python做一元線性迴歸分析。 1. 預測房價房價是一個很火的話題，現在我們拿到一組資料，是房子的大小（平方英尺）和房價（美元）之間的對應關係，如下（csv資料檔案）： No,square_feet,p

梯度下降法及一元線性迴歸的python實現

梯度下降法及一元線性迴歸的python實現一、梯度下降法形象解釋　　設想我們處在一座山的半山腰的位置，現在我們需要找到一條最快的下山路徑，請問應該怎麼走？根據生活經驗，我們會用一種十分貪心的策略，即在現在所處的位置上找到一個能夠保證我們下山最快的方向，然後向著該方向行走；每到一個新位置，重複地應用上述貪心

用basicTrendline畫一元線性迴歸直線的置信區間

感慨統計學都還給老師了。。惡補！ R安裝包的時候貌似需要用管理員許可權啟動，否則安裝不了，國內映象卡得渣渣，還是國外映象真香~選擇hongkong就好了。 install.packages("basicTrendline") library(basicTrendline) x1&l

機器學習之一元線性迴歸

概述線性迴歸是利用數理統計中迴歸分析，來確定兩種或兩種以上變數間相互依賴的定量關係的一種統計分析方法，運用十分廣泛。其表達形式為y = w'x+e，e為誤差服從均值為0的正態分佈。迴歸分析中，只包括一個自變數和一個因變數，且二者的關係可用一條直線近似表示，這種迴歸分析稱為一元線性迴歸分析。如果迴歸分析

Python_一元線性迴歸及迴歸顯著性

1、資料準備資料來源自《應用迴歸分析》（第四版） ## 火災損失表 ### 距離消防站km x = [3.4, 1.8, 4.6, 2.3, 3.1, 5.5, 0.7, 3.0, 2.6, 4.

【機器學習筆記01】最小二乘法（一元線性迴歸模型）

【參考資料】【1】《概率論與數理統計》【2】 http://scikit-learn.org /stable/auto_examples/ linear_model/ plot_ols.html # sphx-glr-auto-examples-

[佔坑]線性迴歸 Python 程式碼註釋

先佔一個坑，最近幾周在做一個比賽，十一月份回來補程式碼發上來註釋掉免得又鴿了。。。。《機器學習實戰》這本書有幾點不適合入門者深入學習的地方是關鍵程式碼沒有給出具體原理，而介紹方式是對機器學習每個基礎演算法進行講解，所以經常在學習幾個章節之間會感覺到斷層，需要

機器學習--線性迴歸1（一元線性迴歸、多元線性迴歸，誤差性質）

前面幾節都是監督學習方面的演算法，監督學習是指有目標變數或預測目標的機器學習方法，迴歸與分類的不同，就在於其目標變數是連續數值型，而分類的目標變數是標稱型資料，其實前面的Logistic迴歸就是迴歸的一種，他們的處理方法大同小異，在這裡系統的講解一下回歸的來龍去脈，理解影響迴

《機器學習實戰》線性迴歸python原始碼

開啟pycharm建立一個regression.py檔案，輸入如下程式碼： #coding:utf-8 from numpy import * seterr(divide='ignore',invalid='ignore') """-------------------

一元線性迴歸VS多元線性迴歸

一元線性迴歸和多元線性迴歸表面意思容易理解，但是結合實際的資料集，會混亂。這也是在編寫線性迴歸博文的時候梳理知識點發現自己的不足，同時記錄下來，讓有疑問的同學也可以得到答案，撥開烏雲。 1

一元線性迴歸模型與最小二乘法及其C++實現

監督學習中，如果預測的變數是離散的，我們稱其為分類（如決策樹，支援向量機等），如果預測的變數是連續的，我們稱其為迴歸。迴歸分析中，如果只包括一個自變數和一個因變數，且二者的關係可用一條直線近似表示，這種迴歸分析稱為一元線性迴歸分析。如果迴歸分

機器學習公開課筆記(1)：機器學習簡介及一元線性迴歸

初步介紹監督式學習: 給定資料集並且知道其正確的輸出應該是怎麼樣的，即有反饋（feedback），分為迴歸（Regressioin）: map輸入到連續的輸出值。分類（Classification）：map輸出到離散的輸出值。非監督式學習: 給定資料集，並不知道其正確的輸出是什麼，

Tensorflow實現簡單的一元線性迴歸並儲存和載入模型

簡介：本文章以tensorflow為平臺建立了一個簡單的線性迴歸模型，並得到了不錯的效果。同時實現了模型的儲存與載入，當一個模型的訓練時間非常長的時候，利用模型的載入可以實現開啟程式時接著上次訓練。平臺：Python 3.6 IDE：Pycharm 一、

一元線性迴歸（原理）

前言：一元線性迴歸是資料探勘的基礎模型，其中包含了非常重要的數學回歸的概念，是學習多元迴歸，廣義線性迴歸的基礎。本文主要講解1）基礎原理2）數學推導3）R語言演示，來介紹一元線性迴歸。關鍵詞：一元線性迴歸基礎原理、最小二乘法、數學推導、R語言整體思路：根據已知點求一

一元線性迴歸的詳解及其Spss和Java的實現之理論說明

不要過於教條地對待研究的結果，尤其當資料的質量受到懷疑時。本文主要對統計學中最常見的一元線性迴歸內容進行系統全面的講解，以及相應案例的Excel Spss 和Java的相關實現。準備知識：對概率中隨機變數的期望、方差、協方差、和相關係數的定義、性質和

pytorch和tensorflow的愛恨情仇之一元線性迴歸例子（keras插足啦）

直接看程式碼：一、tensorflow #tensorflow import tensorflow as tf import random import numpy as np x_data = np.random.randn(100).astype(np.float32) y_data = x_dat

梯度下降法實現最簡單線性迴歸問題python實現

梯度下降法是非常常見的優化方法，在神經網路的深度學習中更是必會方法，但是直接從深度學習去實現，會比較複雜。本文試圖使用梯度下降來優化最簡單的LSR線性迴歸問題，作為進一步學習的基礎。 import numpy as np import pandas as pd from numpy import *

一元線性迴歸-python

資料構造完畢，計算迴歸方程

相關推薦