scikit-learn 支援向量機實現手寫體識別

阿新 • • 發佈：2018-12-09

隨時程式碼，閱讀筆記


%matplotlib inline
import matplotlib.pyplot as plt
import numpy as np
from sklearn import datasets


digits = datasets.load_digits() # 載入資料



# 把資料所代表的圖片顯示出來
images_and_labels = list(zip(digits.images, digits.target))
plt.figure(figsize=(8, 6), dpi=200)
for index, (image, label) in enumerate(images_and_labels[:8]):
    plt.subplot(2, 4, index + 1)
    plt.axis('off')
    plt.imshow(image, cmap=plt.cm.gray_r, interpolation='nearest')
    plt.title('Digit: %i' % label, fontsize=20)
    


print("shape of raw image data: {0}".format(digits.images.shape))
print("shape of data: {0}".format(digits.data.shape))


#shape of raw image data: (1797, 8, 8)
#shape of data: (1797, 64)


# 把資料分成訓練資料集和測試資料集
from sklearn.cross_validation import train_test_split
Xtrain, Xtest, Ytrain, Ytest = train_test_split(digits.data, digits.target, test_size=0.20, random_state=2);

# 使用支援向量機來訓練模型
from sklearn import svm
clf = svm.SVC(gamma=0.001, C=100., probability=True)
clf.fit(Xtrain, Ytrain);



# 評估模型的準確度
from sklearn.metrics import accuracy_score
Ypred = clf.predict(Xtest);
accuracy_score(Ytest, Ypred)
clf.score(Xtest, Ytest)

# 檢視預測的情況
fig, axes = plt.subplots(4, 4, figsize=(8, 8))
fig.subplots_adjust(hspace=0.1, wspace=0.1)

for i, ax in enumerate(axes.flat):
    ax.imshow(Xtest[i].reshape(8, 8), cmap=plt.cm.gray_r, interpolation='nearest')
    ax.text(0.05, 0.05, str(Ypred[i]), fontsize=32,
            transform=ax.transAxes,
            color='green' if Ypred[i] == Ytest[i] else 'red')
    ax.text(0.8, 0.05, str(Ytest[i]), fontsize=32,
            transform=ax.transAxes,
            color='black')
    ax.set_xticks([])
    ax.set_yticks([])

# Xtest[4] 的各種可能性
clf.predict_proba(Xtest[4].reshape(1, -1))


# 儲存模型引數
from sklearn.externals import joblib
joblib.dump(clf, 'digits_svm.pkl');

# 匯入模型引數，直接進行預測
clf = joblib.load('digits_svm.pkl')
Ypred = clf.predict(Xtest);
clf.score(Xtest, Ytest)

8x8的影象大小，還好，如果影象太大，直接使用畫素值，分類結果並不好，需要降維處理，結合PCA。

scikit-learn 支援向量機實現手寫體識別

隨時程式碼，閱讀筆記 %matplotlib inline import matplotlib.pyplot as plt import numpy as np from sklearn import datasets digits = datasets.load_d

機器學習實戰——SVM支援向量機實現記錄

問題：TypeError: data type not understood alphas = mat(zeros(m,1)) 原因是zeros(())格式不對，更改後： alphas = mat(zeros((m,1))) 問題：關於IDLE中換行，回車前面出現很多空格的情況

skiti-learn 支援向量機類庫（SVM）

SVM演算法庫分為兩類，一類是分類演算法庫，SVC，NuSVC,LinearSVC；另一類是迴歸演算法庫，SVR,NuSVR,LinearSVR。分類演算法庫中，SVC，NuSVC差不多，區別在於損失的度量方式不同；LinearSVC是線性分類，不支援從低維到高維的核函式，僅僅支援線性核函

支援向量機（SVM）實現MNIST手寫體數字識別

一、SVM演算法簡述支援向量機即Support Vector Machine，簡稱SVM。一聽這個名字，就有眩暈的感覺。支援(Support)、向量(Vector)、機器(Machine)，這三個毫無關聯的詞，硬生生地湊在了一起。從修辭的角度，這個合成詞最終落腳到”Machine”上，還以

支援向量機之SVM演算法庫(scikit-learn)（三）

1. SVM核函式概述　　　　在scikit-learn中，內建的核函式一共有4種，當然如果你認為線性核函式不算核函式的話，那就只有三種。　　　　1）線性核函式（Linear Kernel）表示式為：K(x,z)=x∙zK(x,z)=x∙z，就是普通的內積，LinearSVC 和 Linea

大資料入門——手寫體資料識別（支援向量機）

#手寫體資料讀取 from sklearn.datasets import load_digits digits=load_digits() print(digits.data.shape) #

機器學習之支援向量機SVM Support Vector Machine (五) scikit-learn演算法庫

一、scikit-learn SVM演算法庫概述 scikit-learn中SVM的演算法庫分為兩類，一類是分類演算法庫，包括SVC、 NuSVC和LinearSVC三個類。另一類是迴歸演算法庫，包括SVR、NuSVR和LinearSVR三個類。相關的

各種機器學習方法（線性迴歸、支援向量機、決策樹、樸素貝葉斯、KNN演算法、邏輯迴歸）實現手寫數字識別並用準確率、召回率、F1進行評估

本文轉自：http://blog.csdn.net/net_wolf_007/article/details/51794254 前面兩章對資料進行了簡單的特徵提取及線性迴歸分析。識別率已經達到了85%，完成了數字識別的第一步：資料探測。這一章要做的就各

python機器學習庫scikit-learn簡明教程之：SVM支援向量機

1.獲得樣例資料 scikit-learn庫有一些標準的資料集，例如分類的數字集，波士頓房價迴歸資料集。在下面，我們啟動Python直譯器，然後載入資料集。我們可以認為，美元符號後輸入python然

Python/scikit-learn機器學習庫(SVM支援向量機)

SVM SVM用於分類、迴歸、異常檢測。優點: 高維空間有效。維度小於樣本數時依然有效。樣本少時表現不好。分類多分類: SVC、NuSVC、LinearSVC。SVMs決策函式依賴於訓練資料中一部分，這些向量稱為支援向量。 NuSVC

《Hands-On Machine Learning with Scikit-Learn & TensorFlow》讀書筆記第五章支援向量機

第5章支援向量機支援向量機（SVM）是個非常強大並且有多種功能的機器學習模型，能夠做線性或者非線性的分類，迴歸，甚至異常值檢測。機器學習領域中最為流行的模型之一，是任何學習機器學習的人必備的工具。SVM 特別適合應用於複雜但中小規模資料集的分類問題。

支援向量機（Python實現）

這篇文章是《機器學習實戰》（Machine Learning in Action）第六章支援向量機演算法的Python實現程式碼。 1 參考連結（1）支援向量機通俗導論(理解SVM的三層境界) （2）支援向量機—SMO論文詳解（序列最小最優化演算法） 2 實現程式

《機器學習》周志華學習筆記第六章支援向量機（課後習題）python 實現

一、 1.間隔與支援向量 2.對偶問題 3.核函式 xi與xj在特徵空間的內積等於他們在原始yangben空間中通過函式k(.,.)計算的結果。核矩陣K總是半正定的。 4.軟間隔與正則化軟間隔允許某些samples不滿足約束鬆弛變數 5.支援

學習筆記（九）：使用支援向量機識別XSS

1.特徵化：提取特徵，對特徵進行向量化，標準化，均方差縮放，去均值操作 def get_len(url): return len(url) def get_url_count(url): if re.search('(http://)|(http://)',url,re.IGNO

Python實現支援向量機（基於雙月資料集）

1、生成資料集 class moon_data_class(object): def __init__(self,N,d,r,w): self.N=N self.w=w self.d=d self.r=

Python實現支援向量機(SVM) MNIST資料集

Python實現支援向量機(SVM) MNIST資料集 SVM的原理這裡不講，大家自己可以查閱相關資料。下面是利用sklearn庫進行svm訓練MNIST資料集，準確率可以達到90%以上。 from sklearn import svm import numpy as np

機器學習 scikit-learn3 模型實踐 - 支援向量機和決策樹

支援向量機和決策樹 - 目錄 1 簡介 1.1 程式碼下載 1.2 程式碼使用方法 3 核心程式碼說明 3.1 模型配置 3.2 模型訓練 3.3 輸出結果 3.3.1 Linea

【機器學習】最小二乘法支援向量機LSSVM的數學原理與Python實現

【機器學習】最小二乘法支援向量機LSSVM的數學原理與Python實現一、LSSVM數學原理 1. 感知機 2. SVM 3. LSSVM 4. LSSVM與SVM的區別二、LSSVM的py

支援向量機演算法的實現和應用（Python3超詳細的原始碼實現+圖介紹）

支援向量機演算法的實現和應用，因為自己推到過SVM，建議自己推到一遍，這裡不對SVM原理做詳細的說明。原理公式推到推薦看：https://blog.csdn.net/jcjx0315/article/details/61929439 #!/usr/bin/env python # enc

支援向量機（SVM）和python實現（三）

6. python實現根據前面的一步步推導獲得的結果，我們就可以使用python來實現SVM了這裡我們使用iris資料集進行驗證，由於該資料集有4維，不容易在二維平面上表示，我們先使用LDA對其進行降維，又因為該資料集有3類樣本，我們編寫的SVM是二分類的，所以我們將

scikit-learn 支援向量機實現手寫體識別

相關推薦