利用sklearn實現多分類demo

阿新 • • 發佈：2019-01-11

常見的文字分類中，二分類問題居多，多分類問題其實也挺常見的，這裡簡單給出一個多分類的實驗demo。

1 引入相應的庫

# 引入必要的庫
import numpy as np
import matplotlib.pyplot as plt
from itertools import cycle
from sklearn import svm, datasets
from sklearn.metrics import roc_curve, auc
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import 
 label_binarize
from sklearn.multiclass import OneVsRestClassifier
from scipy import interp

% matplotlib inline

2 載入資料及資料格式轉化

實驗資料直接使用sklearn中的鳶尾花（iris）資料

（1）載入資料

iris = datasets.load_iris()
X = iris.data
y = iris.target

（2）標籤二值化

# 檢視原來標籤資料格式
print(y.shape)
print(y)
# 標籤轉化
y = label_binarize(y, classes=[0 
, 1, 2])
print(y[:3])

(150,)
[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2
 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
 2 2]
[[1 0 0]
 [1 0 0]
 [1 0 0]]

轉化示意圖
標籤轉化

（3）劃分訓練集和測試集

# 設定種類
n_classes = y.shape[1]

# 訓練模型並預測
random_state = np.random.RandomState(0)
n_samples, n_features = X.shape
# 隨機化資料，並劃分訓練資料和測試資料
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=.5,random_state=0)

3 訓練模型

# Learn to predict each class against the other
model = OneVsRestClassifier(svm.SVC(kernel='linear', probability=True,random_state=random_state))
clt = model.fit(X_train, y_train)

4 效能評估

（1）分別在訓練集和測試集上檢視得分

在訓練集上檢視分類得分

clt.score(X_train, y_train)

0.8133333333333334

在測試集上檢視得分

clt.score(X_test,y_test)

0.6533333333333333

（2）檢視預測的各類別情況

①利用SVM的方法decision_function給每個樣本中的每個類一個評分

y_preds_scores=clt.decision_function(X_test)
y_preds_scores[:5]

array([[-3.58459897, -0.3117717 ,  1.78242707],
       [-2.15411929,  1.11394949, -2.393737  ],
       [ 1.89199335, -3.89592195, -6.29685764],
       [-4.52609987, -0.63396965,  1.96065819],
       [ 1.39684192, -1.77722963, -6.26300472]])

根據評分將其轉化為原始標籤格式

np.argmax(clt.decision_function(X_test), axis=1)[:5]

array([2, 1, 0, 2, 0])

②利用predict_proba檢視每一類的預測概率

clt.predict_proba(X_test)[:4]

array([[3.80289117e-03, 4.01872348e-01, 9.31103883e-01],
       [4.57780355e-02, 7.88455913e-01, 3.39207219e-02],
       [9.81843900e-01, 8.97766449e-03, 1.27447369e-04],
       [7.34898836e-04, 3.12667406e-01, 9.45766977e-01]])

np.argmax(clt.predict_proba(X_test),axis=1)[:5]

array([2, 1, 0, 2, 0])

參考

利用sklearn實現多分類demo

常見的文字分類中，二分類問題居多，多分類問題其實也挺常見的，這裡簡單給出一個多分類的實驗demo。 1 引入相應的庫 # 引入必要的庫 import numpy as np import matplotlib.pyplot as plt from ite

利用sklearn 實現SVM分類

scv 函式 class sklearn.svm.SVC(C=1.0, kernel='rbf', degree=3, gamma='auto', coef0=0.0, shrinking=True, probability=False, tol=0.001, cache

matlab利用hinge loss實現多分類SVM

1 介紹本文將介紹hinge loss E(w)以及其梯度∇E(w)。並利用批量梯度下降方法來優化hinge loss實現SVM多分類。利用hinge loss在手寫字資料庫上實驗，能達到87.040%的正確識別率。 2. hinge los

SVM實現多分類的三種方案

一次 libs 工程類函數合並 clas 情況之一設計轉載自：http://www.cnblogs.com/CheeseZH/p/5265959.html SVM本身是一個二值分類器　　SVM算法最初是為二值分類問題設計的，當處理多類問題時，就需要構造合適的多類

SpringBoot12 QueryDSL02之利用QueryDSL實現多表關聯查詢

之間 entity hide cto tar nds 執行 arc -- 1 業務需求　　有的系統業務邏輯比較復雜，存在著多表關聯查詢的的情況，查詢的內容不僅僅是單張表的的內容而是多張表的字段組合而成的，直接使用SplringDataJPA實現是比較復雜的，但是如果使用Q

Python3：利用Socket實現多使用者實時聊天.

我們繼續在用程式碼演示Socket和Server 實現通訊這個章節繼續擴充套件首先我們要做到的是實時通訊，這裡面牽扯了3個知識點：既然是實時通訊，必須是用input線上輸入我們要把close 語句刪除，否則會自己斷掉為了達到實時通訊，必須不斷的迴

SpringBoot31 整合SpringJDBC、整合MyBatis、利用AOP實現多資料來源切換

一、整合SpringJDBC 1 JDBC 　　JDBC（Java Data Base Connectivity，Java 資料庫連線）是一種用於執行 SQL 語句的 Java API，可以為多種關係資料庫提供統一訪問，它由一組用 Java 語言編寫的類和介面組成。JDBC 提

nginx利用try_files實現多個源

col 作用視頻 pre cep files 是否 err data 比如一個視頻網站，視頻資源分散在幾臺機器上，但是給用要提供統一的IP,路徑，端口。就需要nginx，先檢查本機是否有改文件，如果沒有就代理其他地方 location / { root /da

bootstrap中利用Tag實現多個div的上下頁切換

func acc tex oot trap www. active cli ane 添加 nav 和 nav-tabs 類到 ul 中，將會應用 Bootstrap 標簽樣式，添加 nav 和 nav-pills 類到 ul 中，將會應用 Bootstrap 膠囊式樣式 &

利用js實現多行文字框的全選

<!DOCTYPE html> <html> <head> <title>139</title> <meta charset="utf-8"> <script type="t

recyclerview+viewpager實現多分類fragment介面仿京東分類介面

好久沒寫部落格了，今天決定寫一篇簡單的功能實現熱熱手這是我2018年10月份在京東app錄製的他們的分類介面，今天主要就是實現這樣的一個分類的介面整理思路首先整理思路啊。整體介面的實現方式可能很多，但是需要儘可能的用簡單的方式，比如左邊的分類介面和右邊的

利用synchronized實現多執行緒同步

多執行緒程式設計帶來便利性的同時，也給我們的程式設計帶來了難度，因為多執行緒的執行具有隨機性，當多個執行緒對共享資源操作時，就很容易引發問題。下面模擬了一個取錢的執行緒，當兩個取錢的執行緒對同一個賬戶進行操作時，我們就會發現異常。下

基於粒子群演算法的概率神經網路實現多分類（PSO_PNN）

基於粒子群演算法的概率神經網路實現多分類：用粒子群演算法（PSO）實現概率神經網路中（PNN）的引數spread的最優化，並用PNN實現訓練並測試多類別資料，多分類效果很棒，有需要請聯絡[email protected]，需要一定費用。

基於Tensorflow實現多分類支援向量機

1、匯入必要的程式設計庫； import matplotlib.pyplot as plt import numpy as np import tensorflow as tf from sklearn import datasets sess = tf.Se

利用lock實現多執行緒同步

我們不僅可以使用synchronized來實現多執行緒同步，還可以通過建立鎖物件來實現多執行緒的同步，還是上次模擬取現的操作，這次利用lock物件實現同步，下面是程式碼： import java.util.concurrent.locks.Reentrant

SVM的實現多分類的幾種方法以及優缺點詳解

轉載自： SVM本身是一個二值分類器　　SVM演算法最初是為二值分類問題設計的，當處理多類問題時，就需要構造合適的多類分類器。　　目前，構造SVM多類分類器的方法主要有兩類　　（1）直接法，直接在目標函式上進行修改，將多個分類面的引數求解合併到一個最優化

利用Python實現多執行緒聊天功能

#-*- coding:utf-8 -*- from threading import Thread from socket import * #1.實現接收訊息 def recvDate(): while True: recvInfo = udpSocket.recvfrom(

SKlearn實現鳶尾花分類

1.鳶尾花資料集介紹：Iris資料集是常用的分類實驗資料集，由Fisher在1936收集整理。Iris也稱鳶尾花卉資料集，是一類多重變數分析的資料集。資料集包含150個數據集，分為3類，每類50個數據，每個資料包含4個屬性。可通過花萼長度，花萼寬度，花瓣長度，花瓣寬度4個屬性

EL之RF(RFC)：利用RF對多分類問題進行建模並評估(六分類+分層抽樣)

EL之RF(RFC)：利用RF對多分類問題進行建模並評估(六分類+分層抽樣) 輸出結果設計思路核心程式碼 missCLassError = [] nTreeList = range(50, 2000, 50) for iTrees in n

利用sklearn實現多分類demo

1 引入相應的庫

2 載入資料及資料格式轉化

（1） 載入資料

（2） 標籤二值化

（3）劃分訓練集和測試集

3 訓練模型

4 效能評估

（1）分別在訓練集和測試集上檢視得分

（2）檢視預測的各類別情況

參考

相關推薦

（1）載入資料

（2）標籤二值化