機器學習(四)邏輯迴歸模型訓練
阿新 • • 發佈:2018-12-12
本篇不講演算法
只講用Python (pandas, matplotlib, numpy, sklearn) 進行訓練的一些要點
1.合併index
np.concatenate([index1,index2])
2.from sklearn.cross_validation import train_test_split
train_test_split(X, y, test_size = 0.3, random_state = 0) 一般要指定切分比例
返回X_train, X_test, y_train, y_test
做樣本劃分用的
3.
接下來看看具體怎麼訓練模型
from sklearn.linear_model import LogisticRegression
from sklearn.cross_validation(現在應該是model_selection,版本更新了) import KFold, cross_val_score
from sklearn.metrics import confusion_matrix, recall_score, classification_report
所以總的來說沒有一步一步程式碼寫的必要,這裡也就不寫了。
總結一下,主要有以下幾個操作:
1.train_test_split劃分資料集
2.KFold建立交叉驗證
3.recall_score 和 cross_val_score 的使用
4.把資料填進合適的模型