opencv 基於KNN的手寫數字字元識別

阿新 • • 發佈：2019-02-03

樓主為武漢市某科技大學的機械小碩，由於某種原因，開始學習和使用opencv，所以算是半路出家和非科班出身，如有描述的不夠專業地方，還請多多包涵和批評指正。

本文主要實現對手寫數字字元的識別，主要用到的方法為k-近鄰分類方法，用到opencv提供的KNearest類。

也是在網上看到的程式碼，覺得很好玩，然後下載了工程，原工程是opencv2早期版本，還是cvmat的時代，看起來很不方便和習慣。

樓主花了點兒時間，好好學習了下，然後修改成了opencv2後期mat時代的程式碼，opencv2.4.9-2.4.13應該都可以跑起來。

先講下原理吧

1、得到訓練的資料，一般都會是兩個矩陣，一個矩陣存放著資料，另一個矩陣存放資料對應的標記（如數字0,1,2,3....）

2、訓練資料，這一步，很簡單，一個函式就可以搞定

3、根據需要識別的圖片，預測其屬於哪一類。

總結來講：既然opencv都為我們封裝好了演算法，提供了一個可供呼叫的類，使用起來，必然是比較簡單的。大部分的精力和程式碼，都花在得到標準化的資料上。

話不多說，先上一部分程式碼吧

class basicOCR
{
public:
	float classify(Mat img, int showResult);
	basicOCR();
	void test();
private:
	char file_path[255];
	int train_samples;
	int classes;
	Mat trainData;
	Mat trainClasses;
	int size;
	static const int K = 5;//最大鄰居個數
	KNearest *knn;
	void getData();
	void train();
	void preprocessing(Mat &srcimage, int new_width, int new_height);
};

封裝成一個類

</pre><pre name="code" class="cpp">basicOCR::basicOCR()//建構函式
{

	//initial
	sprintf(file_path, "OCR/");
	train_samples = 50;//訓練樣本，總共100個，50個訓練，50個測試
	classes = 10;//暫時識別十個數字

	size = 128;//

	trainData.create(train_samples*classes, size*size, CV_32FC1);//訓練資料的矩陣
	trainClasses.create(train_samples*classes, 1, CV_32FC1);

	//Get data (get images and process it)
	getData();

	//train	
	train();
	//Test	
	test();

	printf(" ------------------------------------------------------------------------\n");
	printf("|\t識別結果\t|\t 測試精度\t|\t  準確率\t|\n");
	printf(" ------------------------------------------------------------------------\n");
}

類的建構函式，可以看到，存放訓練資料的矩陣trainData和存放對應標記的矩陣trainClasses

void basicOCR::getData()
{
	Mat src_image;
	char file[255];
	int i, j;
	for (i = 0; i<classes; i++)
	{
		for (j = 0; j< train_samples; j++)
		{

			//載入pbm格式影象，作為訓練
			if (j<10)
				sprintf(file, "%s%d/%d0%d.pbm", file_path, i, i, j);
			else
				sprintf(file, "%s%d/%d%d.pbm", file_path, i, i, j);
			src_image = imread(file, 0);
			if (src_image.empty())
			{
				printf("Error: Cant load image %s\n", file);
				//exit(-1);
			}
			//process file
			preprocessing(src_image, size, size);

			//Set data 
			float* data1 = trainData.ptr<float>(i*train_samples+j);
			float* data2 = src_image.ptr<float>(0);
			for (int k = 0; k < src_image.cols; k++)
			{
				data1[k] = data2[k];
			}

			//Set class label
			trainClasses.at<float>(i*train_samples + j, 0) = i;
		}
	}
}

得到資料矩陣和相應的標記矩陣。

好了，只貼部分程式碼吧，如需要完整的工程，可以到hust平凡之路下載。

請原諒我這種賺取積分的行為。畢竟，人生已經如此的艱難。

opencv 基於KNN的手寫數字字元識別

樓主為武漢市某科技大學的機械小碩，由於某種原因，開始學習和使用opencv，所以算是半路出家和非科班出身，如有描述的不夠專業地方，還請多多包涵和批評指正。本文主要實現對手寫數字字元的識別，主要用到的方法為k-近鄰分類方法，用到opencv提供的KNearest類。也是在

OpenCV手寫數字字元識別(基於k近鄰演算法)

公眾號：老王和他的IT界朋友們歡迎投稿： [email protected] QQ交流群： 593683975 QQ群提供技術交流，CSDN資源，百度文庫等資源共享加群問題：拋硬幣正面上的期望？我們想用一段音樂，幾張圖片，些

K近鄰分類器(KNN)手寫數字(MNIST)識別

KNN(K-Nearest-Neighbor) 是分類演算法中比較簡單的一個演算法。演算法思想非常簡單：對於一個未知類別的樣例，我們在很多已知類別的樣本中找出跟它最相近的K個樣本，賦予該樣例這K個樣本中佔多數的類別。如圖中所示，如果我們選取

基於SVM和KNN的手寫數字的識別（分類）——小試牛刀篇

下面分別採用的是k近鄰演算法（KNN）和SVM實現的手寫數字識別。 python實現程式碼： # -*- coding: utf-8 -*- import os import numpy as np def img2vector(filename, label): #

機器學習實戰--KNN手寫數字識別

程式碼： import numpy as np import operator import matplotlib import matplotlib.pyplot as plt import os def classfy0KNN(intX,dataset,labels

KNN實現手寫數字的識別

import numpy as np import matplotlib.pyplot as plt from sklearn.neighbors import KNeighborsClassifier

機器學習--knn手寫數字識別系統

0.k近鄰演算法剛接觸java，並且在學習機器學習的相關演算法，knn又非常的易於實現，於是就有了這個小系統。 1.knn演算法簡介：存在一個樣本資料集合，也稱為訓練樣本集，並且樣本集中的每一個數據都有標籤，即我們知道樣本集中的每一個數據的特徵和對應的型別。當輸入沒有標

TF之RNN：(TF自帶函式下載MNIST55000訓練集圖片)基於順序的RNN分類案例手寫數字圖片識別實現高精度99%準確率

import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data mnist = input_data.read_data_sets('MNIST_data', one_hot

MNIST手寫數字圖片識別（線性回歸、CNN方法的手工及框架實現）（未完待續）

shape 初始化 result rect not found pro res edi ise 0-Background 作為Deep Learning中的Hello World 項目無論如何都要做一遍的。代碼地址：Github 練習過程中將持續更新blog及代碼。第一

python神經網路（五）輸入手寫數字進行識別

一、斷點續訓為防止突然斷電、引數白跑的情況發生，在backward中加入類似於之前test中載入ckpt的操作，給所有w和b賦儲存在ckpt中的值：（1）如果儲存斷點檔案的目錄資料夾中，包含有效斷點狀態檔案，則返回該檔案: 引數說明 checkpoint_dir: 表示

Tensorflow入門教程之手寫數字MINST識別

Tensorflow入門教程之手寫數字MINST識別 MNIST是在機器學習領域中的一個經典問題。該問題解決的是把28x28畫素的灰度手寫數字圖片識別為相應的數字，其中數字的範圍從0到9. MNIST 資料下載 Yann LeCun's MNIST page也提供了訓練集與測試集資料

tensorflow實戰入門題目--手寫數字的識別

tensorflow實戰入門題目–手寫數字的識別這是我的第一篇部落格，有很多寫不好的地方，還請大家多多批評指正。手寫體的示範：匯入資料，由於mnist手寫數字在 from tensorflow.examples.tutorials.mnist import i

吳裕雄 python神經網絡手寫數字圖片識別（5）

end false new ppm sqrt 格式 ica utils lin import kerasimport matplotlib.pyplot as pltfrom keras.models import Sequentialfrom keras.layers i

使用LeNet-5實現mnist手寫數字分類識別 TensorFlow

TensorFlow的學習材料很多，但很少有講得特別詳細，讓小白一看就懂的。我自己總結了cnn實現mnist分類識別的方法，希望能給TensorFlow初學者一些幫助，實測在python3下可以執行。 # -*- coding: utf-8 -*- # 使用LeNet-5實

深度學習系列——AlxeNet實現MNIST手寫數字體識別

本文實現AlexNet,用於識別MNIST手寫數字體。所有程式碼的框架基於tensorflow。看了幾篇論文的原始碼之後，覺得tensorflow 確實很難，學習程式設計還是靠實踐。這篇部落格留著給自己以及學習深度學習道路上的小夥伴們一些參考吧，希望能對大家有所幫助！

初識GAN之MNIST手寫數字的識別

初識GAN，因為剛好在嘗試用純python實現手寫數字的識別，所以在這裡也嘗試了一下。筆者也是根據網上教程一步步來的，不多說了，程式碼如下： from tensorflow.examples.tutorials.mnist import input_data i

機器學習實戰：knn手寫數字

資料及程式碼github。 """ @author: lishihang @software: PyCharm @file: handwritten.py @time: 2018/11/26 16:18 """ import numpy as np import m

使用LSTM實現mnist手寫數字分類識別 TensorFlow

RNN做影象識別原理：MNIST資料集中一張圖片資料包含28*28的畫素點。RNN是將一張圖片資料的一行作為一個向量總體輸入一個X中。也就是說，RNN有28個輸入X，一個輸入X有28個畫素點。輸出最後一個結果做為預測值。 TensorFlow入門學習程式碼： # -

DL之NN：(sklearn自帶資料集為1797個樣本*64個特徵)利用NN之sklearn、NeuralNetwor.py實現手寫數字圖片識別95%準確率

先檢視sklearn自帶digits手寫資料集(1797*64)import numpy as np from sklearn.datasets import load_digits from skl

一步步提高手寫數字的識別率(3)

在前面的兩篇文章《一步步提高手寫數字的識別率(1)》和《一步步提高手寫數字的識別率(2)》中，我們分別介紹了使用Softmax迴歸和神經網路來實現手寫數字識別，其準確率分別在92和98%左右，這在機器學習領域是一個非常不錯的準確率，如果我們採用卷積神經網路，準確

opencv 基於KNN的手寫數字字元識別

相關推薦