Python邏輯迴歸模型應用舉例

阿新 • • 發佈：2022-04-17

取UCI公共測試資料庫中澳大利亞信貸批准資料集作為本例資料集，
其擁有14個特徵，1個分類標籤y（1--同意貸款，0--不同意貸款）共計690個申請者記錄

1、資料獲取

import  pandas as pd
data = pd.read_excel('credit.xlsx')
data

	x1	x2	x3	x4	x5	x6	x7	x8	x9	x10	x11	x12	x13	x14	d
0	1	22.08	11.460	2	4	4	1.585	0	0	0	1	2	100	1213	0
1	0	22.67	7.000	2	8	4	0.165	0	0	0	0	2	160	1	0
2	0	29.58	1.750	1	4	4	1.250	0	0	0	1	2	280	1	0
3	0	21.67	11.500	1	5	3	0.000	1	1	11	1	2	0	1	1
4	1	20.17	8.170	2	6	4	1.960	1	1	14	0	2	60	159	1
...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...
685	1	31.57	10.500	2	14	4	6.500	1	0	0	0	2	0	1	1
686	1	20.67	0.415	2	8	4	0.125	0	0	0	0	2	0	45	0
687	0	18.83	9.540	2	6	4	0.085	1	0	0	0	2	100	1	1
688	0	27.42	14.500	2	14	8	3.085	1	1	1	0	2	120	12	1
689	1	41.00	0.040	2	10	4	0.040	0	1	1	0	1	560	1	1

690 rows × 15 columns

2、訓練樣本與測試樣本劃分

#訓練用的特徵資料用x表示，預測變數用y表示   測試樣本分別記為x1,y1
#以前600資料為訓練資料，後90個為測試資料

x = data.iloc[:600,:14].values
x

array([[1.000e+00, 2.208e+01, 1.146e+01, ..., 2.000e+00, 1.000e+02,
        1.213e+03],
       [0.000e+00, 2.267e+01, 7.000e+00, ..., 2.000e+00, 1.600e+02,
        1.000e+00],
       [0.000e+00, 2.958e+01, 1.750e+00, ..., 2.000e+00, 2.800e+02,
        1.000e+00],
       ...,
       [1.000e+00, 3.492e+01, 2.500e+00, ..., 2.000e+00, 2.390e+02,
        2.010e+02],
       [1.000e+00, 2.408e+01, 8.750e-01, ..., 2.000e+00, 2.540e+02,
        1.951e+03],
       [1.000e+00, 3.733e+01, 6.500e+00, ..., 2.000e+00, 9.300e+01,
        1.000e+00]])

y = data.iloc[:600,14].values
y

array([0, 0, 0, 1, 1, 1, 0, 1, 0, 0, 1, 1, 0, 1, 0, 1, 1, 1, 0, 1, 0, 0,
       0, 0, 0, 1, 0, 1, 1, 1, 1, 0, 0, 1, 0, 0, 1, 1, 1, 1, 1, 0, 1, 0,
       0, 1, 0, 1, 0, 1, 0, 0, 0, 0, 0, 1, 1, 0, 1, 1, 0, 0, 1, 0, 1, 1,
       0, 0, 0, 1, 0, 0, 0, 1, 1, 0, 0, 0, 0, 1, 1, 0, 0, 0, 0, 1, 0, 1,
       1, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1, 0, 1, 1, 1, 0, 1, 1, 0, 1, 0,
       0, 0, 0, 1, 0, 1, 1, 1, 1, 1, 1, 0, 0, 1, 1, 0, 1, 0, 1, 1, 1, 0,
       0, 0, 0, 0, 0, 1, 1, 1, 0, 0, 0, 1, 0, 1, 1, 0, 0, 1, 1, 0, 0, 0,
       1, 1, 1, 0, 1, 0, 0, 0, 1, 1, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 1, 0,
       0, 0, 1, 1, 0, 0, 1, 1, 1, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 1, 0,
       0, 0, 1, 0, 1, 0, 1, 1, 0, 0, 0, 0, 1, 1, 0, 0, 0, 1, 0, 0, 0, 1,
       1, 0, 1, 0, 0, 0, 0, 1, 1, 1, 1, 0, 0, 1, 1, 1, 0, 0, 0, 1, 1, 1,
       1, 0, 0, 0, 0, 1, 1, 1, 0, 0, 1, 0, 1, 1, 1, 1, 0, 0, 0, 1, 0, 1,
       1, 0, 0, 1, 0, 0, 0, 1, 0, 1, 1, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 1,
       1, 1, 0, 0, 0, 0, 1, 1, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 1, 0, 1,
       0, 0, 0, 0, 0, 1, 1, 0, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0,
       1, 1, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 0, 1, 0,
       1, 0, 0, 0, 0, 0, 1, 0, 1, 1, 0, 0, 0, 0, 0, 1, 0, 1, 1, 0, 0, 0,
       1, 1, 1, 0, 0, 1, 1, 0, 0, 0, 1, 1, 0, 1, 1, 1, 1, 0, 0, 1, 1, 0,
       0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 1, 0, 1, 0, 0, 0, 1, 1, 1, 0, 0, 1,
       0, 1, 1, 1, 0, 1, 0, 0, 1, 0, 0, 0, 1, 0, 0, 1, 0, 1, 0, 1, 1, 0,
       1, 0, 0, 1, 0, 1, 1, 0, 0, 0, 0, 0, 1, 1, 0, 0, 1, 1, 0, 1, 0, 1,
       0, 1, 0, 1, 1, 0, 1, 0, 1, 1, 1, 0, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0,
       1, 1, 1, 1, 1, 0, 1, 1, 0, 0, 0, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1,
       0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 1, 1, 1, 0, 1, 0, 0, 1, 1, 0, 1, 0,
       0, 0, 0, 0, 0, 1, 0, 1, 0, 1, 1, 1, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0,
       1, 1, 0, 0, 0, 0, 0, 1, 0, 1, 0, 1, 0, 0, 1, 1, 1, 0, 0, 0, 0, 0,
       1, 0, 1, 1, 0, 0, 0, 0, 0, 1, 1, 1, 0, 1, 0, 1, 1, 0, 0, 1, 0, 1,
       0, 0, 1, 1, 0, 1], dtype=int64)

x1 = data.iloc[600:,:14].values
x1

array([[0.000e+00, 2.075e+01, 9.540e+00, ..., 2.000e+00, 2.000e+02,
        1.001e+03],
       [1.000e+00, 3.667e+01, 3.250e+00, ..., 2.000e+00, 1.020e+02,
        6.400e+02],
       [1.000e+00, 2.258e+01, 1.004e+01, ..., 2.000e+00, 6.000e+01,
        3.970e+02],
       ...,
       [0.000e+00, 1.883e+01, 9.540e+00, ..., 2.000e+00, 1.000e+02,
        1.000e+00],
       [0.000e+00, 2.742e+01, 1.450e+01, ..., 2.000e+00, 1.200e+02,
        1.200e+01],
       [1.000e+00, 4.100e+01, 4.000e-02, ..., 1.000e+00, 5.600e+02,
        1.000e+00]])

y1 = data.iloc[600:,14].values
y1

array([0, 1, 1, 1, 1, 0, 0, 1, 0, 1, 1, 0, 1, 0, 1, 1, 0, 0, 0, 1, 0, 1,
       1, 0, 1, 0, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 0, 0, 1, 0, 1, 1, 0,
       0, 0, 0, 0, 0, 1, 1, 0, 0, 1, 0, 0, 1, 0, 0, 1, 1, 0, 1, 1, 0, 0,
       0, 0, 0, 0, 1, 1, 0, 1, 1, 0, 0, 0, 0, 1, 0, 0, 1, 0, 1, 1, 0, 1,
       1, 1], dtype=int64)

3、邏輯迴歸分析

#匯入邏輯迴歸模組（LR）
from sklearn.linear_model import LogisticRegression as LR

#利用LR建立邏輯迴歸物件lr
lr = LR(max_iter=3000)

#呼叫lr中的fit()方法進行訓練
lr.fit(x,y)

LogisticRegression(max_iter=3000)

這裡遇到一個問題：TOP: TOTAL NO. of ITERATIONS REACHED LIMIT......extra_warning_msg=_LOGISTIC_SOLVER_CONVERGENCE_MSG

解決辦法
意思是達到限制的迭代總數，只需要增加迭代次數（最大值）或縮放資料就可以。
將程式碼改為（增加迭代次數）：

最大迭代次數預設值為1000，把它改為3000即可
lr = LR(max_iter=3000)

#呼叫lr中的score（）方法返回模型準確率
r = lr.score(x,y)  #模型準確率(針對訓練資料)
r

0.875

#呼叫lr中的predict()方法，對測試樣本x1進行預測，獲取預測結果
R = lr.predict(x1)
R

array([0, 1, 1, 1, 1, 0, 0, 1, 0, 1, 1, 0, 1, 0, 1, 1, 0, 0, 0, 1, 0, 1,
       1, 0, 1, 1, 1, 0, 0, 0, 0, 0, 1, 0, 0, 1, 0, 0, 0, 0, 0, 1, 1, 0,
       1, 0, 1, 0, 1, 1, 1, 0, 0, 1, 0, 0, 1, 0, 0, 0, 1, 0, 1, 1, 0, 0,
       0, 0, 0, 0, 1, 1, 0, 1, 0, 0, 0, 0, 0, 1, 0, 1, 1, 0, 1, 1, 0, 1,
       1, 0], dtype=int64)

#預測準確率
Z = R-y1
Rs=len(Z[Z==0])/len(Z)
Rs

0.8666666666666667



import pandas as pd
data = pd.read_excel('credit.xlsx')
x = data.iloc[:600,:14].values
y = data.iloc[:600,14].values
x1= data.iloc[600:,:14].values
y1= data.iloc[600:,14].values
from sklearn.linear_model import LogisticRegression as LR
lr = LR(max_iter=3000)   #建立邏輯迴歸模型類
lr.fit(x, y) #訓練資料
r=lr.score(x, y); # 模型準確率（針對訓練資料）
print('模型準確率（針對訓練資料）:',r)
R=lr.predict(x1)
Z=R-y1
Rs=len(Z[Z==0])/len(Z)
print('預測結果為：',R)
print('預測準確率為：',Rs)

模型準確率（針對訓練資料）: 0.875
預測結果為： [0 1 1 1 1 0 0 1 0 1 1 0 1 0 1 1 0 0 0 1 0 1 1 0 1 1 1 0 0 0 0 0 1 0 0 1 0
 0 0 0 0 1 1 0 1 0 1 0 1 1 1 0 0 1 0 0 1 0 0 0 1 0 1 1 0 0 0 0 0 0 1 1 0 1
 0 0 0 0 0 1 0 1 1 0 1 1 0 1 1 0]
預測準確率為： 0.8666666666666667

Python邏輯迴歸模型應用舉例

取UCI公共測試資料庫中澳大利亞信貸批准資料集作為本例資料集，其擁有14個特徵，1個分類標籤y（1--同意貸款，0--不同意貸款）共計690個申請者記錄

Python利用邏輯迴歸模型解決MNIST手寫數字識別問題詳解

本文例項講述了Python利用邏輯迴歸模型解決MNIST手寫數字識別問題。分享給大家供大家參考，具體如下：

邏輯迴歸模型python程式碼加詳細註釋

技術標籤：機器學習機器學習python 文章參考於https://blog.csdn.net/dQCFKyQDXYm3F8rB0/article/details/79767043 筆者只是對其中的程式碼做了較為詳細的註釋，便於初學者理解與線性迴歸不同，Logistic 迴歸沒

Python pandas RFM模型應用例項詳解

本文例項講述了Python pandas RFM模型應用。分享給大家供大家參考，具體如下：

PyTorch建立簡單的邏輯迴歸模型(LogisticRegression)

import torch import torch.nn.functional as F# 從torch引入啟用函式 x_data = torch.tensor([[1.0], [2.0], [3.0]]).cuda()# 將資料放在GPU上

利用邏輯迴歸模型判斷使用者提問意圖

在之前開發聊天機器人的文章裡，我們講解了如何使用線上工具LUIS (https://luis.ai) 開發Chat bot的自然語言理解模型。

各種機器學習演算法的應用場景分別是什麼（比如樸素貝葉斯、決策樹、K 近鄰、SVM、邏輯迴歸最大熵模型）？...

連結：https://www.zhihu.com/question/26726794 編輯：深度學習與計算機視覺宣告：僅做學術分享，侵刪

基於PYTHON SKLEARN應用邏輯迴歸對泰坦尼克乘客存活做預測（一）

Python 的sklearn庫包含許多可用於機器學習的工具，本文以經典的泰坦尼克號問題為例，來說明在Python中使用sklearn做機器學習的一般流程。由於本人對機器學習瞭解還不深，對於本文內容如有任何建議或意見，歡迎提出

拓端tecdat：Python整合機器學習：用AdaBoost、決策樹、邏輯迴歸整合模型分類和迴歸和網格搜尋超引數優化

原文連結：http://tecdat.cn/?p=24231 原文出處：拓端資料部落公眾號 Boosting 是一類整合機器學習演算法，涉及結合許多弱學習器的預測。

Python線性迴歸應用舉例

在發電場中電力輸出（PE）與溫度（AT）、壓力（V）、溼度（AP）、壓強（RH）有關。

Python利用邏輯迴歸分類實現模板

Logistic Regression Classifier邏輯迴歸主要思想就是用最大似然概率方法構建出方程，為最大化方程，利用牛頓梯度上升求解方程引數。

python 線性迴歸分析模型檢驗標準--擬合優度詳解

建立完迴歸模型後，還需要驗證咱們建立的模型是否合適，換句話說，就是咱們建立的模型是否真的能代表現有的因變數與自變數關係，這個驗證標準一般就選用擬合優度。

python實現梯度下降和邏輯迴歸

本文例項為大家分享了python實現梯度下降和邏輯迴歸的具體程式碼，供大家參考，具體內容如下

R語言邏輯迴歸和泊松迴歸模型對發生交通事故概率建模

原文連結http://tecdat.cn/?p=14139 我們已經看到了如何考慮風險敞口，計算包含風險敞口的多個數量（經驗均值和經驗方差）的非引數估計量。讓我們看看如果要對二項式變數建模。

python實現邏輯迴歸的示例

程式碼 import numpy as np import matplotlib.pyplot as plt from sklearn.datasets.samples_generator import make_classification

python 牛頓法實現邏輯迴歸（Logistic Regression）

本文采用的訓練方法是牛頓法（Newton Method）。程式碼 import numpy as np class LogisticRegression(object):

Python 實現3種迴歸模型（Linear Regression，Lasso，Ridge）的示例

公共的抽象基類 import numpy as np from abc import ABCMeta,abstractmethod class LinearModel(metaclass=ABCMeta):

python--一元線性迴歸模型

技術標籤：pythonpython機器學習模型中只有一個自變數和因變數可表示成。數學公式可表示成：

python 迴歸_Python自編線性迴歸模型估計程式

技術標籤：python 迴歸python 線性迴歸python線性迴歸線性迴歸 python Python自編線性迴歸模型估計程式(梯度下降)

Python：7-2 找出肇事者，迴圈與布林邏輯（高教社，《Python程式設計基礎及應用》習題6-6） (7分)

技術標籤：PTA習題答案--Pythonpython演算法在視線不太好的黑夜一司機撞傷行人之後逃逸，有3個目擊者記住了該車的部分車號特徵。甲說：“車牌號的前兩位相同，且末位數是奇數”；乙說：“車牌號的後兩位加起來

Python邏輯迴歸模型應用舉例

1、資料獲取

2、訓練樣本與測試樣本劃分

3、邏輯迴歸分析

這裡遇到一個問題：TOP: TOTAL NO. of ITERATIONS REACHED LIMIT......extra_warning_msg=_LOGISTIC_SOLVER_CONVERGENCE_MSG

相關推薦