統計學 簡單的線性迴歸(Linear Regression)
阿新 • • 發佈:2018-12-30
線性迴歸的作用: 當我們獲得資料之後, 我們想要知道這些資料間元素的關係, 我們可以定義一個等式去描述這中關係. 這就是線性迴歸的作用.
dependent variable: 就是要被預測的變數
Independent variable: 就是用來預測的變數
以下這個公式就是一個簡單的線性迴歸的模型.
beta 0 和 1 都是模型的變數
epsilon 是隨機變數, 作為error term. ( 個人理解: 因為現實生活中資料的預測結果可能被一些噪音所改變, 比如一個商店的銷售額, 可能因為某天的某個客人很有錢而改變, 但是這種很有錢的客戶很少見, 這種情況下的預測結果會有偏差, 使用epsilon 來進行校正. )
可能的線性迴歸圖例:
線性迴歸的基本步驟:
我們通過 regression model 的到 regression equation, 然後使用 歷史資料 對regression equation 的引數進行優化 得到 estimated regression equation. 獲得最優引數, 進行預測新的independent 資料
例子:
背景. 一連鎖飯店的 銷售額 和 坐落在它周圍的 大學的 學生數量 可能有關係 所以我們對 銷售額 和 學生數量 之間的關係很感興趣.
我們收集了一部分歷史資料. 如下
將資料轉換為散點圖:
- 我們現在的問題 就能轉化成 找到一條直線, 這條直線需要滿足 使歷史資料中的各個 x 所對應的 y
- 公式 : yi 是 歷史資料x對應的y y-head 是 x 對應的在直線上y的值.
- 根據estimation regression equation 我們知道
- 將 3 帶入 2, 在對 b0 和 b1 分別求 偏導. 如圖 (下圖為錯誤版本,b1推導錯誤,感謝 )
- 第二遍修改居然還修改錯了,感謝同學再次指正。果然上完一天班腦子就是亂的。
發現問題歡迎指出.謝謝