【sklearn學習1】快速認識sklearn架構
阿新 • • 發佈:2018-12-12
【官方文件】點選進入
參考博文:sklearn庫的學習(po主yealxxy,《——部分圖和內容轉自)
ML神器:sklearn的快速使用(po主ML小菜鳥,《——部分內容轉自
一 什麼是sklearn
全稱scikit-learn,是python中機器學習的包,有以下特點(摘自官方文件):
- 是資料探勘和資料分析的簡單好用的工具
- 易上手 可重用
- 基於NumPy, SciPy, and matplotlib
- 開源,商業可用
1.1 機器學習一覽
天啦嚕這張圖的machine learning架構真的好清楚,忍不住拿來用一下。
機器學習的常見流程:獲取資料 -> 資料預處理 -> 訓練建模 -> 模型評估 -> 預測,分類
sklearn的演算法也是按照機器學習流程內容大概分為幾塊
二 sklearn使用
2.1 import
2.2資料集
資料集模組為sklearn.datasets 官方手冊
sklearn包含一些資料集,可供使用者直接呼叫,以下為小資料集的使用,不需要下載
from sklearn import datasets
iris = datasets.load_iris() # 匯入鳶尾花資料集
X = iris.data # 獲得其特徵向量
y = iris.target # 獲得樣本label