資料探勘-Logistic迴歸建模

阿新 • • 發佈：2019-01-19

Logistic迴歸建模

Logistic迴歸屬於概率型非線性迴歸，對於二分類的Logistic迴歸，因變數y只有“是、否”兩個取值，記為“是、否“兩個取值，記為0和1。假設在自變數想，x1,x2.......,x_p 作用下，y取“是”的概率是p，則取“否”的概率是1-p，研究的是當y取“是”發生的概率p與自變數x1,x2,x3……, x_p

的關係。

Logistic函式

Logistic迴歸模型中的因變數只有1-0(如是和否、發生和不發生)兩種取值。假設在p個獨立自變數x1,x2……x_p 作用下，記y取1的概率是p=P(y=1|X),取0的概率是1-p,取1和0的概率之比p/1-p (odds),稱為事件的優勢比，對優勢比取自然對數即得Logistic變換Logit(p)=Ln(p/1-p)。

令Logit(p)=Ln(p/1-p)=z，則p=1/1+e^-z即為Logistic函式。當p在（0,1）之間變化時，odds的取值範圍是，則Ln(p/1-p)的取值範圍為。

Logistic迴歸模型

Logistic迴歸模型是建立在Ln(p/1-p)與自變數的線性迴歸模型

Logistic迴歸模型為：

Logistic迴歸建模步驟

Logistic迴歸模型的建模步驟如下圖

1）根據分析目的設定指標變數（因變數和自變數），然後收集資料。

2） Y取1的概率是p=P(y=1|X),取0的概率為1-p。用Ln(p/1-p)和自變數列出線性迴歸方程，估計出模型中的迴歸係數。

3）進行模型檢驗：根據輸出的方差分析表中的F值和p值來檢驗該回歸方程是否顯著，如果p值小於顯著性水平則模型通過檢驗，可以進行下一步迴歸係數的檢驗；否則要重新選擇指標變數，重新建立迴歸方程。

4）進行迴歸係數的顯著性檢驗：在多元線性迴歸中，迴歸方程顯著並不意味著每個自變數對y的影響都顯著，為了從迴歸方程中剔除那些次要的、可有可無的變數，重新建立更為簡單有效的迴歸方程，需要對每一個自變數進行顯著性檢驗，檢驗結果由引數估計表得到。採用逐步迴歸法，首先剔除掉最不顯著的因變數，重新構造迴歸方程，一直到模型和參與的迴歸係數都通過檢驗。

5）模型應用：輸入自變數的取值，就可以得到預測變數的值，或者根據預測變數的值去控制自變數的取值。

資料探勘-Logistic迴歸建模

資料探勘-Logistic迴歸建模

機器學習與資料探勘-logistic迴歸及手寫識別例項的實現

【Mark Schmidt課件】機器學習與資料探勘——非線性迴歸

資料探勘 R 迴歸分析

Python資料探勘實戰——迴歸

資料探勘經典演算法：Logistic(邏輯迴歸) python和sklearn實現

資料探勘演算法-Logistic迴歸

資料探勘領域中的分類和迴歸區別是什麼？

第六章資料探勘建模過程

用 WEKA 進行資料探勘（1）簡介和迴歸

吳裕雄資料探勘與分析案例實戰（6）——線性迴歸預測模型

【Python資料探勘課程】五.線性迴歸知識及預測糖尿病例項

【python資料探勘課程】十九.鳶尾花資料集視覺化、線性迴歸、決策樹花樣分析

MADlib——基於SQL的資料探勘解決方案（17）——迴歸之Cox比例風險迴歸

【python資料探勘課程】十八.線性迴歸及多項式迴歸分析四個案例分享

【資料探勘知識點七】相關與迴歸分析

【python資料探勘課程】十六.邏輯迴歸LogisticRegression分析鳶尾花資料

python資料探勘筆記】十八.線性迴歸及多項式迴歸分析四個案例分享

資料探勘十大經典演算法--CART: 分類與迴歸樹

資料探勘，篩選，補充的廣義線性模型的---- LASSO 迴歸

資料探勘-Logistic迴歸建模

相關推薦