前言： True regression functions are never linear!

自從學了Andrew Ng上的machine learning及Trevor Hastie和Rob Tibshirani 的statistical learning課程之後一直想為線性迴歸寫些總結，但是躊躇了很久卻寫不下去。第一，它實在是太簡單了，感覺沒什麼東西可以寫；第二，本人水平有限，不能信手捏來，也不能像大神那樣能夠系統闡述問題，怕寫出的文章不夠嚴謹，甚至出現錯誤。但還是得硬著頭皮寫下來，原因一是簡單的東西都寫不好，就不要說要寫比較複雜的東西；原因二線性迴歸模型是其他模型的基礎，它的最重要的是思想，這種思想可以延續和擴充套件到其他模型；原因三是另外其實它遠不像我們想象的那麼簡單，有不少的細節需要考慮，下面我們將一一講述。

什麼是線性迴歸？
如何求線性迴歸的解？
如何評價線性迴歸的解？
如何評價估算出來的線性模型？
如果模型中存在定性變數應如何處理？
如果有互動項應如何處理？
其他需要考慮的問題有哪些？

1、什麼是線性迴歸？

線性迴歸由兩個片語成的：線性和迴歸。線性用來描述變數X（variable 或predictor或feature）的係數與響應Y（response）之間的關係是線性的。迴歸說明它的響應是定量（quantitative）的，而不是定性（qualitative）的。為了便於理解，我們一般先假設最簡單的情況：當變數是單變數（Simple linear regression）的時候。這個模型可以用代數表達：

y=β0+β1∗x1+ϵ......(1)

其中β0 和 β1是我們所要估計的未知引數（coefficients 或parameters），ϵ 代表誤差（可以先不用考慮）。從幾何的角度上看Y是X的一次函式，在二維座標中，它們的關係如圖1所示：
圖1. 線性迴歸模型在二維空間的關係，x軸表示變數，y軸表示響應，則和分別代表截距（intercept）和斜率（slope）。紅色的點表示樣本，藍色粗實線表示通過樣本計算出來的引數進而擬合出來的模型，順直的細線表示樣本與模型的誤差。（注：圖片來至《a introduce of statistical learning》）
同理可以擴充套件到多變數線性迴歸模型（multiple linear regression），其模型可以表達為：

y=β0+β1∗x1+...+βp∗xp+ϵ......(2)
p表示變數的個數，β0,β1,…,βp表示需要估計的引數，共有p+1個,ϵ代表誤差（可以先不用考慮）。其中變數X可以是不同形式：
. 是定量資料（quantitative），我們遇到大部分是這種情況；
. 定量資料X的各種轉換，如：取對數logX；取平方x

2；取倒數1/X等等；
. 定量資料X的基擴充套件（basic expansion）,如x2=x21,x3=x31，這就變成多項式迴歸；
. 表示離散值，比如一些定性的變數（qualitative），如性別：男和女等；
. 變數之間的互動（interaction），比如 x3=x1∗x2.
雖然上述有些情況X並不是線性的，但Y仍然是線性迴歸模型，只不過在模型的解析上會有不同，我們仍然可以用公式（2）來描述。在後面的章節我們會逐一解析。
假設在三維空間，即有2個變數x1與x2 ，則Y是個平面，如圖2所示：
圖2. 線性迴歸模型在三維空間的表示。紅色實心點表示樣本，平面表示通過這個樣本計算出來的線性迴歸模型。順直的黑色實線表示樣本到平面的距離，及樣本和模型的誤差。（注：圖片來至《a introduce of statistical learning》)

圖2. 線性迴歸模型在三維空間的表示。紅色實心點表示樣本，平面表示通過這個樣本計算出來的線性迴歸模型。順直的黑色實線表示樣本到平面的距離，及樣本和模型的誤差。（注：圖片來至《a introduce of statistical learning》)

如果有三個或三個以上的變數，則Y(模型)是個超平面，目前很難視覺化，只能靠想象了。
線性迴歸是一種有監督學習（supervised learning），即用已知的資料來訓練生成模型。既然我們已經假設模型是線性的，我們如何根據我們所擁有的資料來求它的解（引數）？

2、如何求線性迴歸模型的解？

問題描述：
假設有N個樣本（x1,y1）,(x2,y2) ,…(xn,yn),每個樣本有p個變數xi=(xi1,xi2,...,xip) ，求 β0、β1 、…、βp ，使得這些訓練樣本與得出的模型的擬合度最好。
最常用的是的方法是最小二乘法（least squares），該方法早在1805年法國科學家勒讓德（Legendre）就已經發表了，接著高斯（gauss）也在1809年發表了該方法，並稱該方法在1795年他就提出了，所以就產生了爭議[1]。最小二乘法，用殘差平方和（Residual Sum of Squares, RSS）來描述樣本與模型的擬合度，定義如下：

RSS(β)=∑i=1N(yi−β0−∑j=1pxijβj)2......(3)
yi表示樣本的響應，括號的另外兩項表示通過樣本的變數，我們估計出來的模型。其中β=(β0、β1 、…、βp )，表示最後要求的引數。RSS越小表示擬合得越好。所以問題可以轉換為：
minβRSS(β)......(4)
在機器學習中用代價函式（cost function）來表示，只不過代價函式對RSS做了一個2倍的平均：
J(β)=(1/2∗N)RSS(β)
其實它對解的結果並沒有影響。
如何求β使其在訓練樣本中擁有最小RSS?統計學習一般用最小二乘法，機器學習一般用梯度下降法（Gradient Descent，GD）。下面介紹這兩種方法。

2.1 最小二乘法

2.1.1 定義：

為了方便表示，我們用矩陣的方法表示RSS:

RSS(β)=(Y−Xβ)T(Y−Xβ)....

線性迴歸(Linear regression)及其相關問題

前言： True regression functions are never linear!

1、什麼是線性迴歸？

2、如何求線性迴歸模型的解？

2.1 最小二乘法

2.1.1 定義：

線性迴歸(Linear regression)及其相關問題

機器學習（二）--------單變數線性迴歸(Linear Regression with One Variable)

線性迴歸linear regression

線性迴歸 (Linear Regression)

機器學習一：線性迴歸 (Linear Regression)

統計學簡單的線性迴歸(Linear Regression)

機器學習方法：迴歸（一）：線性迴歸Linear regression

基於Tensorflow實現基本的線性迴歸(Linear regression)

通俗理解線性迴歸(Linear Regression)

Python線性迴歸模型原理及其應用

多元線性迴歸方程原理及其推導

線性迴歸 linea regression 原理及推導

機器學習-多元線性迴歸(Multiple Regression)演算法

機器學習實戰（七）線性迴歸（Linear Regression）

機器學習筆記——線性迴歸（Linear Regression）

線性迴歸（linear regression)

用python來實現機器學習（一）：線性迴歸（linear regression）

機器學習之線性迴歸（Linear Regression）

ML-matlab實現linear regression線性迴歸

機器學習之線性迴歸演算法(Linear Regression)(含python原始碼)

線性迴歸(Linear regression)及其相關問題

前言： True regression functions are never linear!

1、什麼是線性迴歸？

2、 如何求線性迴歸模型的解？

2.1 最小二乘法

2.1.1 定義：

相關推薦

2、如何求線性迴歸模型的解？