機器學習之線性迴歸模型

阿新 • • 發佈：2018-12-16

當我們拿到樣本並經過特徵降維後得到 x1、x2 … 低維特徵，經過多項式對映得到線性迴歸的模型假設：線性迴歸模型假設上式 x1、x2 是樣本特徵，如果 y 是現實中房子的價格，那麼 x1、x2 相當於房子的面積、臥室數量等影響房子價格的因素，而 θ0、θ1、θ2 … 是係數，也就是各影響因素的權值

用 h(x) 來表示預測結果，上式用線性代數來表達：線性迴歸預測模型線性模型用於預測，當前主要的問題是如何求出最優的係數 θ ，使得這個模型變得更準確和可靠，最常用的兩個方法是最小二乘法和梯度下降演算法

最小二乘法：

給定目標函式：式中 h(x) 是預測結果，y 是真實值，用它們之間的誤差平方和來評估 θ 最優，目標函式 J(θ

) 越小，θ 越好，使得 J(θ) 取最小值的那個 θ 就是最優的，而取最小值的那個 J(θ) 叫做損失函式損失函式的求法：求損失函式

如果 X^T•X•θ 可逆，則損失函式求解

如果 XT•X•θ 不可逆或防止過擬合，則加入 λ 擾動：損失函式優化求解

優化與拓展：線性迴歸的複雜度懲罰因子

過擬合：如果有9個樣本點，那麼可以最高用8階的多項式來擬合，階數越高擬合度越高，但階數越高不一定越好，因為會出現震盪現象，當我們再用這個多項式來預測的話會因為震盪出現較大的偏差

防止過擬合：

一、Ridge 迴歸：將目標函式加入平方和損失 Σθ^2 這樣的項叫做正則項

二、LASSO：正則項是一次冪 LASSO LASSO 有一定的特徵選擇能力，選擇最主要的低階特徵，降低了高階的權值，J(θ

) 對 θ 求偏導得 LASSO偏導

式中 λ 是 θ 的引數，叫超引數，是沒辦法通過樣本求出來的，一般通過交叉驗證得到給出 λ=0.01、λ=0.02 … 的候選，從訓練資料集中分出一部分作為驗證資料集，驗證每一個 λ 對應的 θ，用 θ 的均方誤差 MSE 確定候選中最優的 λ

交叉驗證（n折）：

把驗證資料集分成 n 份前 n-1 份來作為訓練資料，把第 n 份作為驗證資料集再把前 n-2 份、第 n 份作為訓練資料集，把第 n-1 份作為驗證集再把前 n-3 份、n-2~n-1 份作為資料集，把第 n-2 份作為驗證集再把 … 交叉驗證

梯度下降演算法

對於線性迴歸模型假設隨機初始化 θ，然後讓 θ

沿著梯度方向迭代，更新後的 θ 使得 J(x) 變得更小， θ 就更優梯度下降

α：學習率、步長（用回溯線性搜尋尋找最優的學習率是最正的方法；第二種辦法（在實踐中常用）是隨機給一個初始學習率，接下來不斷修正，這是比較簡單高效的方法；第三種是給一個固定的學習率，一般情況下可用）

優化與拓展：

一、批量梯度下降演算法（需要拿到所有樣本）：二、隨機梯度下降（拿到一個樣本下降一回，速度快，非常適合線上學習）：三、擇中梯度下降（實踐中常用，既不是拿到全部樣本下降一次，也不是拿到一個樣本下降一次，而是若干個樣本的平均梯度作為更新方向）稱 “mini-batch SGD“

判定係數(模型好壞的指標)：

對於 m 個樣本：(x1, y1), (x2, y2) … 某模型的預測值：(x1, y1^), (x2, y2^) … 樣本的平方和：TSS = Σ(y-y~)^2 殘差平方和：RSS = Σ(y^-y)2 定義 R^2 = 1-RSS/TSS R^2 越大，效果越好迴歸平方和：ESS = Σ(y^-y~)2

機器學習之線性迴歸模型

最小二乘法：

優化與拓展：線性迴歸的複雜度懲罰因子

防止過擬合：

交叉驗證（n折）：

梯度下降演算法

優化與拓展：

判定係數(模型好壞的指標)：

機器學習之線性迴歸模型

JavaScript機器學習之線性迴歸

【ML2】機器學習之線性迴歸

機器學習之線性迴歸SVR

機器學習_線性迴歸模型

機器學習之線性迴歸（Linear Regression）

機器學習之線性迴歸原理及sklearn實現

機器學習之線性迴歸演算法(Linear Regression)(含python原始碼)

機器學習之線性迴歸極大似然估計法

機器學習之線性迴歸公式推導

【機器學習】線性迴歸模型分析

機器學習之線性迴歸筆記

機器學習之線性迴歸及程式碼示例

機器學習之線性迴歸：演算法兌現為python程式碼

機器學習之線性迴歸（機器學習基石）

機器學習之線性迴歸-AndrewNg學習筆記

spark Ml 機器學習之線性迴歸

機器學習之線性迴歸

20171028機器學習之線性回歸過擬合問題的解決方案

機器學習筆記——線性迴歸（Linear Regression）

機器學習之線性迴歸模型

最小二乘法：

優化與拓展：線性迴歸的複雜度懲罰因子

防止過擬合：

交叉驗證（n折）：

梯度下降演算法

優化與拓展：

判定係數(模型好壞的指標)：

相關推薦