分類器之正負樣本收集、訓練、測試

阿新 • • 發佈：2019-01-10

分類器學習所需檔案如下：
這裡寫圖片描述
opencv工具

opencv_createsample.exe
opencv_traincascade.exe

資料準備

1、pos資料夾（正樣本）
2、neg資料夾 (負樣本訓練時所需檔案)
3、xml (分類器儲存的位置)
4、pos.txt （正樣本圖片路徑和圖片大小說明）
5、 neg.txt （負樣本圖片路徑說明訓練時所需檔案）
6、pos.vec (pos.txt->pos.vec 訓練時所需檔案)

7、create_sample.bat (pos.txt->pos.vec的命令）
8、treain.bat (訓練的命令）

一、針對人臉檢測，需要收集正樣本，負樣本

1、正樣本的收集

通過截圖電腦螢幕蒐集人臉影象

（ps:當然也可通過本地視訊蒐集人臉影象，程式碼作簡單修改即可）
python程式碼如下：

# 注意使用的時候，地址作相應變化
from PIL import ImageGrab
import cv2
import numpy as np
import time

def collect_img(filepath):
    k = 1 

    # 識別出人臉後要畫的邊框的顏色，RGB格式
    color = (0, 255, 0)
    while 1:
        time.sleep(0.5)
        img = ImageGrab.grab()
        img = np.array(img, dtype=np.uint8)
        # 將當前幀轉換成灰度影象
        img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

        # 人臉檢測，1.1和2分別為圖片縮放比例和需要檢測的有效點數
        faceRects = classfier.detectMultiScale(img_gray, scaleFactor=1.1 
, minNeighbors=3, minSize=(40, 40))

        if len(faceRects) > 0:  # 大於0則檢測到人臉
            for faceRect in faceRects:  # 單獨框出每一張人臉
                x, y, w, h = faceRect
                if w>100 and h>100:
                    # cv2.rectangle(img, (x - 10, y - 10), (x + w + 10, y + h + 10), color, 2)
                    filename = filepath + "\\" + str(k) + ".jpg"
                    k = k+1
                    # cv2.imwrite(filename, img)
                    cv2.imwrite(filename, img[y:y+h, x:x+w, :])

                    # filename = filepath + "\\" + str(k+1) + ".jpg"
                    # cv2.imwrite(filename, img)
        if k>10000:
            break
# 主函式
classfier = cv2.CascadeClassifier(r"D:\Program Files\Abacibda36\Lib\site-packages\cv2\data\haarcascade_frontalface_alt_tree.xml")
filepath = r"G:\img\face\pos"
collect_img(filepath)

2、負樣本的蒐集

也可以通過截圖網頁視訊，或者本地視訊進行非人臉資料的蒐集

3、通過pos中的圖片集生成正樣本目錄pos.txt

（ps：注意pos.txt中的資料格式）


#  將圖片的資訊儲存成txt資訊

import numpy as np
import cv2
import matplotlib as plt
import os
import time

def save_imginfo_to_txt(filepath, txtpath):
    files = os.listdir(filepath)
    res = []
    for file in files:
        filename = filepath + "\\" + file
        img = cv2.imread(filename)
        # 資料的格式
        res.append([filename, 1, 0, 0, img.shape[0], img.shape[1]])
    save_txt = txtpath + "\\" + "file_name.txt"
    file = open(save_txt, 'a')
    for i in res:
        file.write(' '.join([str(j) for j in i]))
        file.write("\n")
    file.close()

# 主函式
filepath = r"G:\img\face\pos"
txtpath = r"G:\img\face"
save_imginfo_to_txt(filepath, txtpath)

4、負樣本同上

（PS：負樣本的格式注意）
負樣本只需要儲存路徑即可

5、通過pos.txt生成pos.vec

在進行這一個步驟的時候，python的工具opencv_createsamples.exe需要複製到當前的資料夾下
寫一個bat檔案
create_sample.bat
內容如下：

cd C:\Users\Administrator\Desktop\machine_learning\face_study
opencv_createsamples.exe -info  pos.txt -vec pos.vec -num 250 -w 35 -h 35
pause

二、萬事俱備，只欠訓練

在進行這一個步驟的時候，python的工具opencv_traincascade.exe需要複製到當前的資料夾下
訓練需要的東西：pos.vec（原始檔正樣本）
負樣本（neg.txt）
訓練的時候，也寫一個bat檔案
內容如下：

cd C:\Users\Administrator\Desktop\machine_learning\face_study
opencv_traincascade.exe  -data xml -vec pos.vec -bg neg.txt -numPos 100 -numNeg 300 -numStages 15 -precalcValbufSize 200 -precalcdxBufSize 1000 -featureType LBP -w 35 -h 35 -minHitRate 0.99 -maxFalseAlarmRate 0.4 -weightTrimRate 0.95 -maxDepth 1 -maxWeakCount 100 -mode ALL
pause

如果想知道具體引數
可以在cmd目錄下，輸入

C:\Users\Administrator>opencv_traincascade.exe
Usage: opencv_traincascade.exe
  -data <cascade_dir_name>                   //儲存檔案
  -vec <vec_file_name>                       //正樣本 pos.vec
  -bg <background_file_name>                 //負樣本 neg.txt
  [-numPos <number_of_positive_samples = 2000>][-numNeg <number_of_negative_samples = 1000>][-numStages <number_of_stages = 20>][-precalcValBufSize <precalculated_vals_buffer_size_in_Mb = 1024>][-precalcIdxBufSize <precalculated_idxs_buffer_size_in_Mb = 1024>][-baseFormatSave][-numThreads <max_number_of_threads = 9>][-acceptanceRatioBreakValue <value> = -1>]
--cascadeParams--
  [-stageType <BOOST(default)>][-featureType <{HAAR(default), LBP, HOG}>][-w <sampleWidth = 24>][-h <sampleHeight = 24>]
--boostParams--
  [-bt <{DAB, RAB, LB, GAB(default)}>][-minHitRate <min_hit_rate> = 0.995>][-maxFalseAlarmRate <max_false_alarm_rate = 0.5>][-weightTrimRate <weight_trim_rate = 0.95>][-maxDepth <max_depth_of_weak_tree = 1>][-maxWeakCount <max_weak_tree_count = 100>]
--haarFeatureParams--
  [-mode <BASIC(default) | CORE | ALL
--lbpFeatureParams--
--HOGFeatureParams--

三、測試

這裡讀入視訊，進行人臉分類器xml的測試

import cv2
import numpy as np

window_name = "figure"
cap = cv2.VideoCapture("./1.mp4")
# 告訴OpenCv使用人臉識別分類器
haar_xml = r"C:\Users\Administrator\Desktop\machine_learning\face_study\xml\cascade.xml"
classfier = cv2.CascadeClassifier(haar_xml)
# 識別出人臉後要畫的邊框的顏色，RGB格式
color = (0, 255, 0)

while(1):
    # get a frame
    ret, frame = cap.read()
    if not ret:
        break
    # 將當前幀轉換成灰度影象
    grey = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)

    # 人臉檢測，1.1和2分別為圖片縮放比例和需要檢測的有效點數
    faceRects = classfier.detectMultiScale(grey, scaleFactor=1.1, minNeighbors=3,minSize=(20,20))

    if len(faceRects) > 0:  # 大於0則檢測到人臉
        for faceRect in faceRects:  # 單獨框出每一張人臉q
            x, y, w, h = faceRect
            cv2.rectangle(frame, (x - 10, y - 10), (x + w + 10, y + h + 10), color, 2)

    # 顯示影象
    cv2.imshow(window_name, frame)
    if cv2.waitKey(100) & 0xFF == ord('q'):
        break

cap.release()
cv2.destroyAllWindows()

若有疏漏之處，再完善！

分類器之正負樣本收集、訓練、測試

分類器學習所需檔案如下： opencv工具 opencv_createsample.exe opencv_traincascade.exe 資料準備 1、pos資料夾（正樣本） 2、neg資料夾 (負樣本

機器學習之分類器——Matlab中各種分類器的使用總結（隨機森林、支援向量機、K近鄰分類器、樸素貝葉斯等）

Matlab中常用的分類器有隨機森林分類器、支援向量機（SVM）、K近鄰分類器、樸素貝葉斯、整合學習方法和鑑別分析分類器等。各分類器的相關Matlab函式使用方法如下：首先對以下介紹中所用到的一些變數做統一的說明： train_data——訓練樣本，矩陣的每

DL之RNN：人工智慧為你寫歌詞(林夕寫給陳奕迅)——基於TF利用RNN演算法實現【機器為你作詞】、訓練&測試過程全記錄

DL之RNN：人工智慧為你寫歌詞(林夕寫給陳奕迅)——基於TF利用RNN演算法實現【機器為你作詞】、訓練&測試過程全記錄輸出結果 1、test01 你的揹包一個人過我誰不屬了不甘心不能回頭我的揹包載管這個誰讓我們是要不可但求跟你過一生你把我灌醉即使嘴角

DL之RNN：人工智慧為你寫周董歌詞——基於TF利用RNN演算法實現【機器為你作詞】、訓練&測試過程全記錄

DL之RNN：人工智慧為你寫周董歌詞——基於TF利用RNN演算法實現~機器為你作詞~、訓練&測試過程全記錄輸出結果 1、test01 夕海而我在等待之光在月前被畫面而我心碎你的個世紀你的時間我在趕過去我的不是你不會感覺媽媽我說不要不要說我會愛你我不要你不

線性分類器之Fisher線性判別

在許多實際問題中，由於樣本特徵空間的類條件密度函式常常很難確定，利用Parzen窗等非引數方法估計分佈往往需要大量樣本，而且隨著特徵空間維數的增加所需樣本數急劇增加，因此在實際問題中，往往不去求類條件概率密度函式，而是利用樣本集直接設計分類器。具體說就是首先給定

分類器之adaboost

http://www.cnblogs.com/hrhguanli/p/3932488.html Boosting簡單介紹分類中通常使用將多個弱分類器組合成強分類器進行分類的方法，統稱為整合分類方法（Ensemble Method）。比較簡單的如在Boosting之前

機器學習筆記（二）——分類器之優缺點分析

原始資料中存在著大量不完整、不一致、有異常的資料，須進行資料清洗。資料清洗主要是刪除原始資料集中的無關資料、重複資料，平滑噪聲資料，篩選掉與挖掘主題無關的資料，處理缺失值、異常值。一、線性分類器： f=w^T+b / logistic regression 學習方

2線性分類器基本原理-2.3線性分類器之SoftMax和交叉熵損失(Cross-Entropy)

影象分類器模型的整體結構：交叉熵（Cross-Entropy）損失和 SoftMax SVM是最常用的兩個分類器之一，而另一個就是Softmax分類器，它的損失函式與SVM損失函式不同。對於學習過二元邏輯迴歸分類器的讀者來說，SoftMax分類器就可

JAVA垃圾收集器之Parallel Scavenge收集器

Parallel Scavenge收集器是JAVA虛擬機器中垃圾收集器的一種。和ParNew收集器類似，是一個新生代收集器。使用複製演算法的並行多執行緒收集器。 1、特點 Parallel Scavenge收集器的關注點與其他收集器不同， ParallelScavenge

線性分類器之感知器模型（Perceptron）

前文提到，Fisher判別器的設計一般分兩步，一是確定最優的投影方向，二是在投影方向上確定閾權值。而感知器則是一種直接得到完整的線性判別函式g(x)=ωTx+ω0的方法。所以從某種意義上講，感知器模型是Fisher判別的一種改進。瞭解神經網路的人也都知道，感知器

halcon中的分類器之GMM運算元全講解

強大的Halcon的分類器有三種MLP、SVM、GMM，在這裡為大家詳細介紹GMM，原理的東西自己百度吧，這裡主要講GMM庫怎麼用，希望對大家有用 creat_class_gmm(); 含義：建立高斯

學習筆記TF016:CNN實現、數據集、TFRecord、加載圖像、模型、訓練、調試

quest oba lose 神經元 byte 足夠 jpg eight 值轉換 AlexNet(Alex Krizhevsky,ILSVRC2012冠軍)適合做圖像分類。層自左向右、自上向下讀取，關聯層分為一組，高度、寬度減小，深度增加。深度增加減少網絡計算量。訓練模

Caffe SSD編譯、訓練及測試

SSD採用VGG16作為基礎模型，然後在VGG16的基礎上新增了卷積層來獲得更多的特徵以用於檢測。SSD的網路結構如上圖所示（上面是SSD模型，下面是Yolo模型），可以明顯看到SSD利用了多尺度的特徵圖做檢測。安裝 clone程式碼（假設程式碼clone到$CAFF

caffe-SSD 安裝、訓練、SSD測試（ubuntu18.04+cuda9.0+openvc3.4）

安裝及MNIST模型測試、matlab caffe介面測試 https://blog.csdn.net/qq_35608277/article/details/84938244 自己看程式碼提供者的最直接，大家都是根據他的ｃｏｐｙ的： https://github.com/weili

pytorch: 準備、訓練和測試自己的圖片資料

大部分的pytorch入門教程，都是使用torchvision裡面的資料進行訓練和測試。如果我們是自己的圖片資料，又該怎麼做呢？一、我的資料我在學習的時候，使用的是fashion-mnist。這個資料比較小，我的電腦沒有GPU，還能吃得消。關於fashion-mnist資料，可以百度，也可以點此瞭解

Faster rcnn 安裝、訓練、測試、除錯

先上個檢測效果：（1）圖片人臉檢測+關鍵點（2）攝像頭實時人臉+關鍵點 **********************************************************

深度學習---煉丹trick之正確使用BN（訓練和測試/預測時怎麼用）

一、為什麼需要batch normalization 儘管梯度下降法訓練神經網路很簡單高效，但是需要人為地去選擇引數，比如學習率，引數初始化，權重衰減係數，Dropout比例等，而且這些引數的選擇對於訓練結果至關重要，以至於我們很多時間都浪費到這些調參上。BN演算法的強大之處在下面幾個方

SSD配置、訓練、測試以及應用到自己的資料集

git clone https://github.com/weiliu89/caffe.git git checkout ssd make all 如果報錯： /usr/include/boost/property_tree/detail/json_parser_r

FCN製作自己的資料集、訓練和測試 caffe

花了兩三週的時間，在導師的催促下，把FCN的全部流程走了一遍，期間走了很多彎路，現在記錄一下。系統環境：ubuntu 16.04LTS 一、資料集的製作注：我的資料集是仿照VOC資料集進行製作的 1.resize 資料集我的GPU視訊記憶體4G，跑過大的圖片帶不動，需要resize圖片大小，放幾

SSD 安裝、訓練、測試（ubuntu14.04+cuda7.5+openvc2.4.9）

安裝步驟 1.安裝git，下載SSD原始碼包 sudo apt-get install git git clone https://github.com/weiliu89/caffe.git cd caffe git checkout ssd 以下幾條命令是驗證相應的包是

分類器之正負樣本收集、訓練、測試

一、針對人臉檢測，需要收集正樣本，負樣本

1、正樣本的收集

通過截圖電腦螢幕蒐集人臉影象

2、負樣本的蒐集

也可以通過截圖網頁視訊，或者本地視訊進行非人臉資料的蒐集

3、通過pos中的圖片集生成正樣本目錄pos.txt

4、負樣本同上

5、通過pos.txt生成pos.vec

二、萬事俱備，只欠訓練

三、測試

這裡讀入視訊，進行人臉分類器xml的測試

相關推薦