1. 程式人生 > >統計學 簡單的線性迴歸(Linear Regression)

統計學 簡單的線性迴歸(Linear Regression)

線性迴歸的作用: 當我們獲得資料之後, 我們想要知道這些資料間元素的關係, 我們可以定義一個等式去描述這中關係. 這就是線性迴歸的作用. 

dependent variable: 就是要被預測的變數

Independent variable: 就是用來預測的變數

以下這個公式就是一個簡單的線性迴歸的模型. 

beta 0 和 1 都是模型的變數

epsilon 是隨機變數, 作為error term.  ( 個人理解: 因為現實生活中資料的預測結果可能被一些噪音所改變, 比如一個商店的銷售額, 可能因為某天的某個客人很有錢而改變, 但是這種很有錢的客戶很少見, 這種情況下的預測結果會有偏差, 使用epsilon 來進行校正. )


可能的線性迴歸圖例:


線性迴歸的基本步驟:


我們通過 regression model 的到 regression equation, 然後使用 歷史資料 對regression equation 的引數進行優化 得到 estimated regression equation. 獲得最優引數, 進行預測新的independent 資料

例子:

背景. 一連鎖飯店的 銷售額 和 坐落在它周圍的 大學的 學生數量 可能有關係 所以我們對 銷售額 和 學生數量 之間的關係很感興趣. 

我們收集了一部分歷史資料. 如下


將資料轉換為散點圖:


  1. 我們現在的問題 就能轉化成 找到一條直線, 這條直線需要滿足 使歷史資料中的各個 x 所對應的 y
    各個在直線上對應的y-head差最小
  2. 公式 : yi 是 歷史資料x對應的y y-head 是 x 對應的在直線上y的值.
  3. 根據estimation regression equation 我們知道
  4. 將 3 帶入 2, 在對 b0 和 b1 分別求 偏導. 如圖 (下圖為錯誤版本,b1推導錯誤,感謝  )
  5. 大哭第二遍修改居然還修改錯了,感謝同學再次指正。果然上完一天班腦子就是亂的。


發現問題歡迎指出.謝謝