1. 程式人生 > >多元線性迴歸中的公式推導

多元線性迴歸中的公式推導

這次接著一元線性迴歸繼續介紹多元線性迴歸,同樣還是參靠周志華老師的《機器學習》,把其中我一開始學習時花了較大精力弄通的推導環節詳細敘述一下。

本文用到的部分關於向量求導的知識可以參看博文標量、向量、矩陣求導

資料集D={(x1,y1),(x2,y2)(xm,ym)},其中 xi=[xi(1),xi(2)xi(d)]T 表示一條樣本資料有 d 個屬性,我們的目標是尋找 d 維列向量 w 和常數 b,使得模型

(1)f(xi)=wTxi+b所得的預測值與真實值
yi
儘可能接近。

我們可以採用一些小策略把式(2)統一用矩陣和向量表示,把常數 b 放入權值向量 w 得到一個 (d+1) 維的權值向量 w^=(w;b),同時在每個樣本例項中新增第 (d+1) 個屬性,置為 1xi^=(xi;1)。將樣本所有屬性排列為矩陣可以得到:

X=[x1^x2^xm^]
y=(y1,y2ym)T ,同一元線性迴歸中最小化預測值與真實值誤差平方和一樣,在多元迴歸中我們要最小化
||yXw^
||2


w=argw^min(yXw^)T(yXw^)
此處將最小化的目標函式視為 w^ 的“單變數”函式,令