[機器學習]機器學習筆記整理09- 基於SVM影象識別

阿新 • • 發佈：2018-12-30

前言

前面介紹了SVM的基本概念和一般操作步驟,若如不理解請參考:
[機器學習]機器學習筆記整理08- SVM演算法原理及實現
下面來介紹一下,利用SVM進行影象識別.

影象識別

PCA降維

PCA 主要用於資料降維，對於一系列例子的特徵組成的多維向量，多維向量裡的某些元素本身沒有區分性，比如某個元素在所有的例子中都為1，或者與1差距不大，那麼這個元素本身就沒有區分性，用它做特徵來區分，貢獻會非常小。所以我們的目的是找那些變化大的元素，即方差大的那些維，而去除掉那些變化不大的維，從而使特徵留下的都是精品，而且計算量也變小了。
SVM叫做支援向量機，之前的部落格有所涉及有。SVM方法是通過一個非線性對映p，把樣本空間對映到一個高維乃至無窮維的特徵空間中，使得在原來的樣本空間中非線性可分的問題轉化為在特徵空間中的線性可分的問題。

實驗資料採集

再看看實驗採用的資料集，資料集叫做Labeled Faces in the Wild。大約200M左右。整個有10000張圖片，5700個人，1700人有兩張或以上的照片。相關的網址：http://vis-www.cs.umass.edu/lfw/index.html

具體實現

1.匯入模組

from __future__ import print_function

from time import time
import logging
import matplotlib.pyplot as plt

from sklearn.cross_validation import train_test_split
from 
 sklearn.datasets import fetch_lfw_people
from sklearn.grid_search import GridSearchCV
from sklearn.metrics import classification_report
from sklearn.metrics import confusion_matrix
from sklearn.decomposition import RandomizedPCA
from sklearn.svm import SVC
# 顯示進度和錯誤資訊
logging.basicConfig(level=logging.INFO, format='%(asctime)s %(message)s' 
)


###############################################################################

lfw_people = fetch_lfw_people(min_faces_per_person=70, resize=0.4)

# 轉換為陣列
n_samples, h, w = lfw_people.images.shape

# 對於機器學習，我們直接使用2個數據（由於該模型忽略了相對畫素位置資訊）
X = lfw_people.data
n_features = X.shape[1]

# 預測的標籤是該人的身份
y = lfw_people.target
target_names = lfw_people.target_names
n_classes = target_names.shape[0]

print("Total dataset size:")
print("n_samples: %d" % n_samples)
print("n_features: %d" % n_features)
print("n_classes: %d" % n_classes)


###############################################################################
# 分為訓練集和使用分層k折的測試集

# 分為培訓和測試集
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.25)


###############################################################################
# 在面部資料集上計算PCA（特徵面）（被視為未標記的資料集）：無監督特徵提取/維數降低
n_components = 150

print("Extracting the top %d eigenfaces from %d faces"
      % (n_components, X_train.shape[0]))
t0 = time()
pca = RandomizedPCA(n_components=n_components, whiten=True).fit(X_train)
print("done in %0.3fs" % (time() - t0))

eigenfaces = pca.components_.reshape((n_components, h, w))

print("Projecting the input data on the eigenfaces orthonormal basis")
t0 = time()
X_train_pca = pca.transform(X_train)
X_test_pca = pca.transform(X_test)
print("done in %0.3fs" % (time() - t0))


###############################################################################
# 訓練SVM分類模型

print("Fitting the classifier to the training set")
t0 = time()
param_grid = {'C': [1e3, 5e3, 1e4, 5e4, 1e5],
              'gamma': [0.0001, 0.0005, 0.001, 0.005, 0.01, 0.1], }
clf = GridSearchCV(SVC(kernel='rbf', class_weight='auto'), param_grid)
clf = clf.fit(X_train_pca, y_train)
print("done in %0.3fs" % (time() - t0))
print("Best estimator found by grid search:")
print(clf.best_estimator_)


###############################################################################
# 測試集上的模型質量的定量評估

print("Predicting people's names on the test set")
t0 = time()
y_pred = clf.predict(X_test_pca)
print("done in %0.3fs" % (time() - t0))

print(classification_report(y_test, y_pred, target_names=target_names))
print(confusion_matrix(y_test, y_pred, labels=range(n_classes)))


###############################################################################
# 使用matplotlib進行定性評估

def plot_gallery(images, titles, h, w, n_row=3, n_col=4):
    """Helper function to plot a gallery of portraits"""
    plt.figure(figsize=(1.8 * n_col, 2.4 * n_row))
    plt.subplots_adjust(bottom=0, left=.01, right=.99, top=.90, hspace=.35)
    for i in range(n_row * n_col):
        plt.subplot(n_row, n_col, i + 1)
        plt.imshow(images[i].reshape((h, w)), cmap=plt.cm.gray)
        plt.title(titles[i], size=12)
        plt.xticks(())
        plt.yticks(())


# 在測試集的一部分繪製預測結果

def title(y_pred, y_test, target_names, i):
    pred_name = target_names[y_pred[i]].rsplit(' ', 1)[-1]
    true_name = target_names[y_test[i]].rsplit(' ', 1)[-1]
    return 'predicted: %s\ntrue:      %s' % (pred_name, true_name)

prediction_titles = [title(y_pred, y_test, target_names, i)
                     for i in range(y_pred.shape[0])]

plot_gallery(X_test, prediction_titles, h, w)

# 繪製最有意義的特徵面的畫廊

eigenface_titles = ["eigenface %d" % i for i in range(eigenfaces.shape[0])]
plot_gallery(eigenfaces, eigenface_titles, h, w)

plt.show()

實驗結果

這裡寫圖片描述

[機器學習]機器學習筆記整理09- 基於SVM影象識別

前言前面介紹了SVM的基本概念和一般操作步驟,若如不理解請參考: [機器學習]機器學習筆記整理08- SVM演算法原理及實現下面來介紹一下,利用SVM進行影象識別. 影象識別 PCA降維 PCA 主要用於資料降維，對於一系列例

機器學習入門之《統計學習方法》筆記整理——感知機

從頭開始學習李航老師的《統計學習方法》，這本書寫的很好，非常適合機器學習入門。如果部分顯示格式有問題請移步Quanfita的部落格檢視目錄感知機模型什麼是感知機？感知機是二類分類的線性分類模型，其輸入為例項的特徵向量

【學習筆記】pyQt5學習筆記(4）——第一個影象識別demoV3.0B

軟體更新日誌V3.0B版本，在2.0基礎上實現了呼叫攝像頭的實時識別功能。V3.0A版若不實時重新整理識別畫面，可以手動點一次識別一次…… 附上完整程式碼，也是做個程式碼備份。需要的小夥伴自取就ok～軟體目前存在的bug是1.在開始識別後會很卡，目前認為可能的原因是每次重新整理

深度學習實戰（3）-打造自己的影象識別模型

這個筆記弄的我難受，推薦觀看者還是看原書吧............ 用VGG16作為例子簡單介紹：如何使用，去掉尾部，保留引數初始值如何訓練資料準備檔案轉換 data_convert.py原始碼： # coding:utf-8 fr

OpenCV+深度學習預訓練模型，簡單搞定影象識別 | 教程

轉載：https://mp.weixin.qq.com/s/J6eo4MRQY7jLo7P-b3nvJg 李林編譯自 pyimagesearch 作者 Adrian Rosebrock 量子位報道 | 公眾號 QbitAI OpenCV是一個2000年釋出的

Coursera 深度學習吳恩達 deep learning.ai 筆記整理（3-2）——機器學習策略

新的 bsp 誤差 spa 歸納空間 font 處理整理一、誤差分析定義：有時我們希望算法能夠勝任人類能做的任務，但是當算法還沒達到人類所預期的性能時，人工檢查算法錯誤會讓你知道接下來做什麽，這也就是誤差分析檢查，發現會把夠狗當恒，是否需要做一個項目專門處理狗

機器學習（吳恩達）-筆記整理、問題提出-（1-19）

這個課講得很不錯的，把數學部分省略了不少，雖然這是一件危險的事（在危險的邊緣瘋狂試探。誤）。目前看到19，更新到19的筆記。筆記我採用的是英文的，方便和文件接軌。詞彙： Field: 1.n

【機器學習筆記26】基於VGG16的影象風格遷移

Note: 本文主要是對論文及參考文獻【1】中程式碼的理解概述該演算法的本質是利用深度卷積網路對影象輸入的抽象，主要是三部分：將風格影象輸入卷積神經網路，將某些層輸出作為風格特徵（做一次）；將內容影象輸入卷積神經網路，將某些層輸出作為內容特徵（做一

機器學習十大經典演算法之決策樹（學習筆記整理）

一、決策樹概述決策樹是一種樹形結構，其中每個內部節點表示一個屬性上的測試，每個分支代表一個測試輸出，每個葉節點代表一種類別。決策樹是一個預測模型，代表的是物件屬性與物件值之間的一種對映關係。最初的節點稱為根節點（如圖中的"顏色"），有分支的節點稱為中間節點

[機器學習]機器學習筆記整理08- SVM演算法原理及實現

<html> 1 背景最早是由 Vladimir N. Vapnik 和 Alexey Ya. Chervonenkis 在1963年提出目前的版本(so

機器學習公開課筆記第九周之大數據梯度下降算法

機器學習 nbsp gradient min 三種依次再看獲得 mini 一，隨機梯度下降法(Stochastic Gradient Descent) 當訓練集很大且使用普通梯度下降法(Batch Gradient Descent)時，因為每一次\(\theta\)

Python_sklearn機器學習庫學習筆記（四）decision_tree（決策樹）

min n) 空間 strong output epo from 標簽 ict # 決策樹 import pandas as pd from sklearn.tree import DecisionTreeClassifier from sklearn.

機器學習基礎概念筆記

最大什麽 mar 機器學習決策常見 idg 框架評估監督學習：分類和回歸屬於監督學習。這類算法必須知道預測什麽，即目標變量的分類信息。　　常見算法：k-近鄰算法、線性回歸、樸素貝葉斯算法、支持向量機、決策樹、Lasso最小回歸系數估計、Ridge回歸、局部加權線

廣義線性模型 - Andrew Ng機器學習公開課筆記1.6

sans luci art 能夠 tro ron 便是 import grand 在分類問題中我們如果：他們都是廣義線性模型中的一個樣例，在理解廣義線性模型之前須要先理解指數分布族。指數分

機器學習基石筆記11——機器可以怎樣學習（3）

1.2 div esc 怎樣學習 clas regress 1.3 1.4 Lecture 11： Linear Models for Classification 11.1 Linear Models for Binary Classification 11.2 S

ng機器學習視頻筆記（五） ——過擬合與正則化

哪些重復關註 osi 現實 regular 鏈接梯度下降簡單 ng機器學習視頻筆記（五） ——過擬合與正則化（轉載請附上本文鏈接——linhxx）一、過擬合和欠擬合 1、概念當針對樣本集和特征值，進行預測的時候，推導θ、梯度下降等，都在

ng機器學習視頻筆記（六） ——神經網絡基礎

一個變量視頻 img 輸入 center 內容 line 基礎 ng機器學習視頻筆記（六） ——神經網絡基礎（轉載請附上本文鏈接——linhxx）一、概述神經網絡，可以理解為輸入的內容，經過一系列的內部的處理，得到輸出的假設函數。簡單的神

ng機器學習視頻筆記（一）——線性回歸、代價函數、梯度下降基礎

info 而且 wid esc 二維 radi pan 圖形 clas ng機器學習視頻筆記（一） ——線性回歸、代價函數、梯度下降基礎（轉載請附上本文鏈接——linhxx）一、線性回歸線性回歸是監督學習中的重要算法，其主要目的在於用一個函數表

ng機器學習視頻筆記（二） ——梯度下降算法解釋以及求解θ

表示大於解釋圖片 bubuko eight 閾值自己極小值 ng機器學習視頻筆記（二） ——梯度下降算法解釋以及求解θ （轉載請附上本文鏈接——linhxx）一、解釋梯度算法梯度算法公式以及簡化的代價函數圖，如上圖所示。

ng機器學習視頻筆記（十一） ——K-均值算法理論

微信公眾分類 under 等於分析一個筆記不同 learn ng機器學習視頻筆記（十一） ——K-均值算法理論（轉載請附上本文鏈接——linhxx）一、概述 K均值（K-Means）算法，是一種無監督學習（Unsupervised

[機器學習]機器學習筆記整理09- 基於SVM影象識別

前言

影象識別

PCA降維

實驗資料採集

具體實現

實驗結果

相關推薦