opencv——基於KNN的數字識別

阿新 • • 發佈：2019-01-13

KNN即K個最近鄰，網上有很多關於KNN的文章。我大概總結下核心：假設有A圖片，讓A與訓練樣本依次計算相似度（可用歐式距離），挑選出K個與A圖片相似度最大的圖片，這K個圖片中，哪種型別最多那麼定義A圖片也屬於該型別。

首先，需要有數字的訓練樣本

https://download.csdn.net/download/weixin_41721222/10784418

KNN的數字識別程式碼與基於SVM的數字識別大體一致

https://blog.csdn.net/weixin_41721222/article/details/84953788

核心思路：

1：獲取一張訓練圖片後會將圖片特徵寫入到容器中，緊接著會將標籤寫入另一個容器中，這樣就保證了特徵和標籤是一一對應的關係。

2：特徵可用LBP,HOG等提取，但是我們這裡主要說KNN訓練過程，所以用最簡單的方法，即把訓練圖片的全部畫素序列成一行畫素作為特徵，用reshape（1，1）。

3：圖片特徵資料得轉換成CV_32FC1的資料格式。

4：所有訓練樣本與測試樣本的尺寸都應該一樣（這裡我都選擇20*20）。

下面程式碼是opencv3和C++

可以根據自己需要修改訓練樣本類別，數目，尺寸。oss的訓練樣本路徑，src的檢測圖片路徑。

/// 字元識別——基於模版匹配.cpp: 定義控制檯應用程式的入口點。
//


#include "stdafx.h"
#include<opencv2/opencv.hpp>
#include<iostream>

using namespace std;
using namespace cv;
using namespace ml;
ostringstream oss;
int num = -1;
Mat dealimage;
Mat src;
int k = 0;
Mat yangben_gray;
Mat yangben_thresh;

int main()
{

	////===============================讀取訓練資料===============================////
	const int classsum = 10;//圖片共有10類
	const int imagesSum =500;//每類有500張圖片			   
	const int imageRows = 20;//圖片尺寸
	const int imageCols = 20;
	//訓練資料，每一行一個訓練圖片
	Mat trainingData;
	//訓練樣本標籤
	Mat labels;
	//最終的訓練樣本標籤
	Mat clas;
	//最終的訓練資料
	Mat traindata;
	//////////////////////從指定資料夾下提取圖片//////////////////
	for (int p = 0; p < classsum; p++)
	{
		oss << "C:/Users/zhang/Desktop/opencv——例項/小案例/車牌檢測/基於adaboost機器學習/模版匹配樣本/";
		num += 1;//num從0到9
		int label = num;
		oss << num << "/*.jpg";//圖片名字字尾，oss可以結合數字與字串
		string pattern = oss.str();//oss.str()輸出oss字串，並且賦給pattern
		oss.str("");//每次迴圈後把oss字串清空
		vector<Mat> input_images;
		vector<String> input_images_name;
		glob(pattern, input_images_name, false);
		//為false時，僅僅遍歷指定資料夾內符合模式的檔案，當為true時，會同時遍歷指定資料夾的子資料夾
		//此時input_images_name存放符合條件的圖片地址
		int all_num = input_images_name.size();//檔案下總共有幾個圖片
											   //cout << num << ":總共有" << all_num << "個圖片待測試" << endl;

		for (int i = 0; i < imagesSum; i++)
		{
			cvtColor(imread(input_images_name[i]), yangben_gray, COLOR_BGR2GRAY);
			threshold(yangben_gray, yangben_thresh, 0, 255, THRESH_OTSU);
			input_images.push_back(yangben_thresh);
			//迴圈讀取每張圖片並且依次放在vector<Mat> input_images內
			dealimage = input_images[i];


			//注意：我們簡單粗暴將整個圖的所有畫素作為了特徵，因為我們關注更多的是整個的訓練過程
			//，所以選擇了最簡單的方式完成特徵提取工作，除此中外，
			//特徵提取的方式有很多，比如LBP，HOG等等
			//我們利用reshape()函式完成特徵提取,
			//reshape(1, 1)的結果就是原影象對應的矩陣將被拉伸成一個一行的向量，作為特徵向量。
			dealimage = dealimage.reshape(1, 1);//圖片序列化
			trainingData.push_back(dealimage);//序列化後的圖片依次存入
			labels.push_back(label);//把每個圖片對應的標籤依次存入
		}
	}

	//圖片資料和標籤轉變下
	Mat(trainingData).copyTo(traindata);//複製
	traindata.convertTo(traindata, CV_32FC1);//更改圖片資料的型別，必要，不然會出錯
	Mat(labels).copyTo(clas);//複製

	////===============================建立KNN模型===============================////
	Ptr<KNearest>knn = KNearest::create();
	knn->setDefaultK(10);//k個最近領
	knn->setIsClassifier(true);//true為分類，false為迴歸
	//訓練資料和標籤的結合
	Ptr<TrainData>trainData = TrainData::create(traindata, ROW_SAMPLE, clas);
	//訓練
	knn->train(trainData);

	//model->save("E:/image/KNearestModel.xml"); 

	////===============================預測部分===============================////
	//預測分類
	Mat src = imread("C:/Users/zhang/Desktop/opencv——例項/小案例/車牌檢測/基於adaboost機器學習/檢測到的車牌字元/4.jpg");
	cvtColor(src, src, COLOR_BGR2GRAY);
	threshold(src, src, 0, 255, CV_THRESH_OTSU);
	imshow("原影象", src);
	Mat input;
	src = src.reshape(1, 1);//輸入圖片序列化
	input.push_back(src);
	input.convertTo(input, CV_32FC1);//更改圖片資料的型別，必要，不然會出錯

	float r = knn->predict(input);   //對所有行進行預測
	cout << r << endl;
	waitKey(0);
	return 0;
}

結果：

opencv——基於KNN的數字識別

KNN即K個最近鄰，網上有很多關於KNN的文章。我大概總結下核心：假設有A圖片，讓A與訓練樣本依次計算相似度（可用歐式距離），挑選出K個與A圖片相似度最大的圖片，這K個圖片中，哪種型別最多那麼定義A圖片也屬於該型別。首先，需要有數字的訓練樣本 https://download.csdn.n

opencv 基於KNN的手寫數字字元識別

樓主為武漢市某科技大學的機械小碩，由於某種原因，開始學習和使用opencv，所以算是半路出家和非科班出身，如有描述的不夠專業地方，還請多多包涵和批評指正。本文主要實現對手寫數字字元的識別，主要用到的方法為k-近鄰分類方法，用到opencv提供的KNearest類。也是在

OpenCV玩九宮格數獨（二）：knn數字識別

前言首先需要說明，這裡所說的數字識別不是手寫數字識別！但凡對機器學習有所瞭解的人，相信看到數字識別的第一反應就是MNIST。MNIST是可以進行數字識別，但是那是手寫數字。我們現在要做的是要識別從九宮格圖片中提取出來的印刷體的數字。手寫數字集訓練出來的模

Opencv手寫數字識別_Opencv3.0+KNN+HOG特徵_原始碼_MAC_OS環境搭建視訊教程.

寫在前面最近在學習Opencv，本人android開發狗，對Opencv純屬興趣。一個破本科畢業的我，發現智商完全不夠用，書到用是方恨少，都怪自己數學太渣。好在Opencv封裝得比較好，如果只是使用的話，大概知道原理就知道該怎麼用。經過學習總結，寫了一個小Demo，

OpenCV 玩九宮格數獨（二）：knn 數字識別

前言首先需要說明，這裡所說的數字識別不是手寫數字識別！但凡對機器學習有所瞭解的人，相信看到數字識別的第一反應就是MNIST。MNIST是可以進行數字識別，但是那是手寫數字。我們現在要做的是要識別從九宮格圖片中提取出來的印刷體的數字。手寫數字集訓練出來的模型用來識別

python使用opencv基於GoogLeNet 模型識別圖片！

2017年8月釋出的OpenCV 3.3正式帶來了高度改進的深度學習dnn模組。該模組現在持許多深度學習框架，包括Caffe，TensorFlow和Torch/PyTorch。該API可C ++可在Python中呼叫，很容易磁碟載入模型；預處理輸入影象；通過網路傳遞影象並獲取輸出分類。

Java應用OpenvCV指南其六：利用OpenCV實現的數字識別（驗證碼識別）

之前介紹了很多概念上的東西，這次讓我們來進行一次實際的應用。數字識別可以應用在許多領域，如數字型驗證碼的識別，車牌識別等領域。下面借我之前完成的一個數字驗證碼識別的小專案來簡單認識一下圖象識別領域的知識。如果在閱讀這篇文章時有什麼疑問，可以參考一下之

Java基於opencv實現圖像數字識別(一)

binary oid ring 是把 sca pre 內存還需要自己 Java基於opencv實現圖像數字識別(一) 最近分到了一個任務，要做數字識別，我分配到的任務是把數字一個個的分開；當時一臉懵逼，直接百度java如何分割圖片中的數字，然後就百度到了用Buffere

Java基於opencv實現圖像數字識別(二)—基本流程

數字都是模型 PE 設計 category 理解兩種 ace Java基於opencv實現圖像數字識別(二)—基本流程做一個項目之前呢，我們應該有一個總體把握，或者是進度條；來一步步的督促著我們來完成這個項目，在我們正式開始前呢，我們先討論下流程。我做的主要是表格

opencv 視覺項目學習筆記（二）：基於 svm 和 knn 車牌識別

its ++ eas -a rect() repr poi obj std 車牌識別的屬於常見的模式識別，其基本流程為下面三個步驟： 1）分割：檢測並檢測圖像中感興趣區域； 2）特征提取：對字符圖像集中的每個部分進行提取； 3）分類：判斷圖像快是不是車牌或者每

基於opencv的數字識別

最近學習了opencv，然後想通過其對圖片上的數字進行識別，參考了網上幾篇關於opencv數字識別的部落格，我自己也寫了一個程式玩玩。我是在vs2017和opencv3.4.1環境下實現的。這裡先說一下我的思路和步驟：

基於KNN分類演算法手寫數字識別的實現（二）——構建KD樹

上一篇已經簡單粗暴的建立了一個KNN模型對手寫圖片進行了識別，所以本篇文章採用構造KD樹的方法實現手寫數字的識別。（一）構造KD樹構造KD樹的基本原理網上都有介紹，所以廢話不多說，直接上程式碼。 #Knn KD_Tree演算法 import math from

opencv——基於SVM的數字識別（3）

前兩篇文章寫了基於兩種特徵提取的SVM數字識別 https://blog.csdn.net/weixin_41721222/article/details/84953788 https://blog.csdn.net/weixin_41721222/article/details/84978

opencv 視覺專案學習筆記（二）：基於 svm 和 knn 車牌識別

車牌識別的屬於常見的模式識別，其基本流程為下面三個步驟： 1）分割：檢測並檢測影象中感興趣區域； 2）特徵提取：對字元影象集中的每個部分進行提取； 3）分類：判斷影象快是不是車牌或者每個車牌字元的分類。車牌識別分為兩個步驟，車牌檢測，車牌識別，都屬於模式識別。基本結構如下：一、車牌

基於opencv的手寫數字識別（MFC,HOG,SVM）

因為本程式是提取HOG特徵，使用SVM進行分類的，所以大概瞭解下HOG的一些知識，其中我覺得怎麼計算影象HOG特徵的維度會對程式瞭解有幫助關於HOG，我們可以參考： http://gz-ricky.blogbus.com/logs/85326

基於Tensorflow, OpenCV. 使用MNIST資料集訓練卷積神經網路模型，用於手寫數字識別

基於Tensorflow，OpenCV 使用MNIST資料集訓練卷積神經網路模型，用於手寫數字識別一個單層的神經網路，使用MNIST訓練，識別準確率較低兩層的卷積神經網路，使用MNIST訓練（模型使用MNIST測試集準確率高於99%

OpenCV手寫數字字元識別(基於k近鄰演算法)

公眾號：老王和他的IT界朋友們歡迎投稿： [email protected] QQ交流群： 593683975 QQ群提供技術交流，CSDN資源，百度文庫等資源共享加群問題：拋硬幣正面上的期望？我們想用一段音樂，幾張圖片，些

[機器學習]基於OpenCV實現最簡單的數字識別

http://blog.csdn.net/jinzhuojun/article/details/8579416 本文將基於OpenCV實現簡單的數字識別。這裡以遊戲Angry Birds為例，通過以下幾個主要步驟對其中右上角的分數部分進行自動識別。 1. 學習分類器根據

opencv——基於SVM的數字識別（2）

上篇文章我們用的特徵是訓練樣本的所有畫素點值，雖然方便但不準確。這篇文章主要介紹用SVM+HOG特徵對數字進行識別。詳細請看上篇文章，它們主要區別在於訓練樣本HOG特徵的提取，其他基本一樣，所以我直接附上程式碼。下面程式碼是opencv3和C++ 可以根據自己需要修改訓練樣本類

opencv——基於SVM的數字識別（1）

關於SVM的原理有很多優秀的視訊和資料，這裡我主要說下利用SVM對數字識別的具體應用首先，需要有數字的訓練樣本 https://download.csdn.net/download/weixin_41721222/10784418 把0-9資料夾放入模版匹配樣本之中，自己可

opencv——基於KNN的數字識別

相關推薦