統計學簡單的線性迴歸(Linear Regression)

阿新 • • 發佈：2018-12-30

線性迴歸的作用: 當我們獲得資料之後, 我們想要知道這些資料間元素的關係, 我們可以定義一個等式去描述這中關係. 這就是線性迴歸的作用.

dependent variable: 就是要被預測的變數

Independent variable: 就是用來預測的變數

以下這個公式就是一個簡單的線性迴歸的模型.

beta 0 和 1 都是模型的變數

epsilon 是隨機變數, 作為error term. ( 個人理解: 因為現實生活中資料的預測結果可能被一些噪音所改變, 比如一個商店的銷售額, 可能因為某天的某個客人很有錢而改變, 但是這種很有錢的客戶很少見, 這種情況下的預測結果會有偏差, 使用epsilon 來進行校正. )

可能的線性迴歸圖例:

線性迴歸的基本步驟:

我們通過 regression model 的到 regression equation, 然後使用歷史資料對regression equation 的引數進行優化得到 estimated regression equation. 獲得最優引數, 進行預測新的independent 資料

例子:

背景. 一連鎖飯店的銷售額和坐落在它周圍的大學的學生數量可能有關係所以我們對銷售額和學生數量之間的關係很感興趣.

我們收集了一部分歷史資料. 如下

將資料轉換為散點圖:

發現問題歡迎指出.謝謝

統計學 簡單的線性迴歸(Linear Regression)