機器學習實踐（六）—sklearn之轉換器和估計器

阿新 • • 發佈：2018-11-25

一、sklearn轉換器

想一下之前做的特徵工程的步驟？
- 1 例項化 (例項化的是一個轉換器類(Transformer))
- 2 呼叫fit_transform(對於文件建立分類詞頻矩陣，不能同時呼叫)

我們把特徵工程的介面稱之為轉換器，其中轉換器呼叫有這麼幾種形式
- fit_transform
- fit
- transform
這幾個方法之間的區別是什麼呢？我們看以下程式碼就清楚了

示例程式碼

from sklearn.preprocessing import 
 StandardScaler

# 建立一個標準差轉換器
transfer = StandardScaler()
a = [[1,2,3],[4,5,6]]

# 進行計算均值和標準差，並進行轉換，計算均值和標準差的結果會儲存在transfer物件中，之後用到均值或標準差都會從物件中直接提取，如果重新計算會重新儲存。
transfer.fit_transform(a)

# 進行均值和標準差的計算，儲存在transfer物件中，
transfer.fit(a)

# 進行轉換
transfer.transform(a)

二、sklearn估計器

在sklearn中，估計器(estimator)是機器學習演算法的API，是進行機器學習的面向物件，它的內部能夠像轉換器那樣自動地儲存一些運算結果。

列舉一些估計器
- 1 用於分類的估計器：
  - sklearn.neighbors k-近鄰演算法
  - sklearn.naive_bayes 貝葉斯
  - sklearn.linear_model.LogisticRegression 邏輯迴歸
  - sklearn.tree 決策樹與隨機森林
- 2 用於迴歸的估計器：
  - sklearn.linear_model.LinearRegression 線性迴歸
  - sklearn.linear_model.Ridge 嶺迴歸
- 3 用於無監督學習的估計器
  - sklearn.cluster.KMeans 聚類

估計器工作流程

例項化一個估計器
```
estimator = LNeighborsClassifier()
```
傳入訓練資料集，進行機器訓練
```
estimator.fit(x_train,y_train)
```

模型評估

方法1. 比較真實值與預測值

y_predict = estimator.predict(x_test)
y_predict == y_test

方法2. 計算模型準確率
```
estimator.score(x_test,y_test)
```

機器學習實踐（六）—sklearn之轉換器和估計器

一、sklearn轉換器想一下之前做的特徵工程的步驟？ 1 例項化 (例項化的是一個轉換器類(Transformer)) 2 呼叫fit_transform(對於文件建立分類詞頻矩陣，不能同時呼叫) 我們

機器學習實踐（七）—sklearn之K-近鄰演算法

一、K-近鄰演算法(KNN)原理 K Nearest Neighbor演算法又叫KNN演算法，這個演算法是機器學習裡面一個比較經典的演算法，總體來說KNN演算法是相對比較容易理解的演算法定義如果一個樣本在特徵空間中的k個最相似(即特徵空間中最鄰近)的樣本中的

機器學習實踐（三）—sklearn之特徵工程

一、特徵工程介紹 1. 為什麼需要特徵工程 Andrew Ng ： “Coming up with features is difficult, time-consuming, requires expert knowledge. “Applied machine learnin

機器學習實踐（二）—sklearn之資料集

一、可用資料集 Kaggle網址：https://www.kaggle.com/datasets UCI資料集網址： http://archive.ics.uci.edu/ml/ scikit-learn網址：http://scikit-learn.org/sta

機器學習實踐（一）—sklearn之概述

1956年，人工智慧元年。人類能夠創造出人類還未知的東西。這未知的東西人類能夠保證它不誤入歧途嗎。一、機器學習和人工智慧，深度學習的關係機器學習是人工智慧的一個實現途徑深度學習是機器學習的一個方法發展而來二、機器學習，深度

機器學習實踐（五）—sklearn之特徵降維

一、特徵降維概述為什麼要對特徵進行降維處理如果特徵本身存在問題或者特徵之間相關性較強，對於演算法學習預測會影響較大什麼是降維降維是指在某些限定條件下，降低隨機變數(特徵)個數，得到一組“不

機器學習實踐（四）—sklearn之特徵預處理

一、特徵預處理概述什麼是特徵預處理 # scikit-learn的解釋 provides several common utility functions and transformer classes to change raw feature vectors into

機器學習實踐（九）—sklearn之樸素貝葉斯演算法

一、樸素貝葉斯演算法什麼是樸素貝葉斯分類方法屬於哪個類別概率大，就判斷屬於哪個類別概率基礎概率定義為一件事情發生的可能性 P(X) : 取值在[0, 1] 聯合概率、條件概率與相互獨立

機器學習實踐（八）—sklearn之交叉驗證與引數調優

一、交叉驗證與引數調優交叉驗證(cross validation) 交叉驗證：將拿到的訓練資料，分為訓練集、驗證集和測試集。訓練集：訓練集+驗證集測試集：測試集

Spring 學習筆記（六）AOP 之思想概念和作用、JDK代理與Cglib子類代理

概念 AOP為Aspect Oriented Programming的縮寫，意味：面向切面程式設計。與IOC一樣，是一種思想。作用對業務邏輯進行分離，降低耦合度，提高程式的重用性，提高開發效率。 JDK動態代理（介面代理）弱點：JDK動態代理

機器學習實踐（十六）—sklearn之模型儲存和載入

一、sklearn - 模型的儲存和載入 - API from sklearn.externals import joblib 儲存 joblib.dump(rf, ‘test.pkl’) 載入 estimator

機器學習筆記（六）神經網路引入及多分類問題實踐

一、神經網路引入我們將從計算機視覺直觀的問題入手，提出引入非線性分類器的必要性。首先，我們希望計算機能夠識別圖片中的車。顯然，這個問題對於計算機來說是很困難的，因為它只能看到畫素點的數值。應用機器學習，我們需要做的就是提供大量帶標籤的圖片作為訓練集，有的圖片是一輛車，有的圖片不是一輛車，最終我們

機器學習筆記（六）邏輯回歸

邏輯回歸 alt 表示結果不變改變最小值 nbsp 可能性一、邏輯回歸問題二分類的問題為是否的問題，由算出的分數值，經過sign函數輸出的是（+1，-1），想要輸出的結果為一個幾率值，則需要改變函數模型，其中，，則邏輯回歸的函數為二、邏輯回歸錯誤評價線性

吳恩達機器學習筆記（六） —— 支持向量機SVM

次數括號圖片最小我們支持向量機svm UNC 意思 strong 主要內容：一.損失函數二.決策邊界三.Kernel 四.使用SVM 一.損失函數二.決策邊界對於：當C非常大時，括號括起來的部分就接近於0，所以就變成了：

機器學習實戰（六）AdaBoost元演算法

目錄 0. 前言 1. AdaBoost 2. 單層決策樹 3. 非均衡資料 4. 實戰案例 4.1. 馬病死亡案例學習完機器學習實戰的AdaBoost元演算法，簡單的做個筆記。文中部分描述屬於個人消化後的理解，僅

機器學習基礎（六）—— 交叉熵代價函式（cross-entropy error）

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

機器學習筆記（六）：KNN分類器

1 KNN演算法 1.1 KNN演算法簡介 KNN（K-Nearest Neighbor）工作原理：存在一個樣本資料集合，也稱為訓練樣本集，並且樣本集中每個資料都存在標籤，即我們知道樣本集中每一資料與所屬分類對應的關係。輸入沒有標籤的資料後，將新資料中的每個特徵與樣本集中資料對應的特

深度學習實踐（一）—tensorflow之概述

內容預覽 1.1 深度學習與機器學習的區別 1.1.1 特徵提取方面 1.1.2 資料量和計算效能要求 1.1.3 演算法代表 1.2 深度學習的應用場景 1.2.1 影象識別 1.2

機器學習入門（六）決策樹

--------韋訪 20181030 1、概述這一講，我們來看看決策樹。 2、概念決策樹（decision tree）是一種常用的分類與迴歸方法，其模型為樹狀結構，如下圖所示，其中，最頂部的圓點為根節點，其他圓點為內部節點，方形為葉子節點。決策樹

機器學習筆記（六）-吳恩達視訊課程（神經網路學習二）

1.代價函式神經網路層數L，表示L層（最後一層）神經元個數，表示每層的輸出神經元數二類分類：=1 輸出層有一個神經元，輸出的y是一個實數 y = 0 or 1 表示類別多類別分類：一共有K類，則=K，輸出層有K個神經元，&nbs

機器學習實踐（六）—sklearn之轉換器和估計器

一、sklearn轉換器

示例程式碼

二、sklearn估計器

列舉一些估計器

估計器工作流程

相關推薦