1. 程式人生 > >Python資料分析與挖掘實戰程式碼糾錯 程式碼5-1

Python資料分析與挖掘實戰程式碼糾錯 程式碼5-1

#-*- coding: utf-8 -*-
#邏輯迴歸 自動建模
import pandas as pd
#引數初始化
filename = '../data05/bankloan.xls'
data = pd.read_excel(filename)
x = data.iloc[:,:8].as_matrix()
y = data.iloc[:,8].as_matrix()
from sklearn.linear_model import LogisticRegression as LR
from sklearn.linear_model import RandomizedLogisticRegression as RLR 
rlr = RLR() #建立隨機邏輯迴歸模型,篩選變數
rlr.fit(x, y) #訓練模型
rlr.get_support() #獲取特徵篩選結果,也可以通過.scores_方法獲取各個特徵的分數
print(u'通過隨機邏輯迴歸模型篩選特徵結束')
print(u'有效特徵為:%s' % ','.join(data.columns[rlr.get_support(8)]))

x = data[data.columns[rlr.get_support(8)]].as_matrix() #篩選好特徵
lr = LR() #建立邏輯貨櫃模型
lr.fit(x, y) #用篩選後的特徵資料來訓練模型
print(u'邏輯迴歸模型訓練結束。')