1. 程式人生 > >【sklearn學習1】快速認識sklearn架構

【sklearn學習1】快速認識sklearn架構

【官方文件】點選進入

    參考博文:sklearn庫的學習(po主yealxxy,《——部分圖和內容轉自)

                        ML神器:sklearn的快速使用(po主ML小菜鳥,《——部分內容轉自

一 什麼是sklearn

    全稱scikit-learn,是python中機器學習的包,有以下特點(摘自官方文件):

  • 是資料探勘和資料分析的簡單好用的工具
  • 易上手 可重用
  • 基於NumPy, SciPy, and matplotlib
  • 開源,商業可用      

1.1 機器學習一覽

    天啦嚕這張圖的machine learning架構真的好清楚,忍不住拿來用一下。

    機器學習的常見流程:獲取資料 -> 資料預處理 -> 訓練建模 -> 模型評估 -> 預測,分類

    sklearn的演算法也是按照機器學習流程內容大概分為幾塊

 

二 sklearn使用

2.1 import

 

2.2資料集

  資料集模組為sklearn.datasets 官方手冊

  sklearn包含一些資料集,可供使用者直接呼叫,以下為小資料集的使用,不需要下載

from sklearn import datasets


iris = datasets.load_iris() # 匯入鳶尾花資料集
X = iris.data # 獲得其特徵向量
y = iris.target # 獲得樣本label