OpenCV-簡單數字識別OCR

阿新 • • 發佈：2019-01-31

1、資料

這裡寫圖片描述
digit.png

這裡寫圖片描述
dig.png

2、C++

2.1 建立樣本和標籤資料的程式碼

#include "opencv2/opencv.hpp"

using namespace cv;
using namespace std;

int main(int argc, char** argv)
{

    //Process image to extract contour
    Mat thr, gray, con;
    Mat src = imread("digit.png", 1);
    cvtColor(src, gray, CV_BGR2GRAY);
    threshold(gray, thr, 200 
, 255, THRESH_BINARY_INV); //Threshold to find contour
    thr.copyTo(con);

    // Create sample and label data
    vector< vector <Point> > contours; // Vector for storing contour
    vector< Vec4i > hierarchy;
    Mat sample;
    Mat response_array;
    findContours(con, contours, hierarchy, CV_RETR_CCOMP, CV_CHAIN_APPROX_SIMPLE); //Find contour 


    for (int i = 0; i< contours.size(); i = hierarchy[i][0]) // iterate through first hierarchy level contours
    {
        Rect r = boundingRect(contours[i]); //Find bounding rect for each contour
        rectangle(src, Point(r.x, r.y), Point(r.x + r.width, r.y + r.height), Scalar(0, 0, 255), 2, 8, 0);
        Mat ROI = thr(r); //Crop the image 

        Mat tmp1, tmp2;
        resize(ROI, tmp1, Size(10, 10), 0, 0, INTER_LINEAR); //resize to 10X10
        tmp1.convertTo(tmp2, CV_32FC1); //convert to float
        sample.push_back(tmp2.reshape(1, 1)); // Store  sample data
        imshow("src", src);
        int c = waitKey(0); // Read corresponding label for contour from keyoard
        c -= 0x30;     // Convert ascii to intiger value
        response_array.push_back(c); // Store label to a mat
        rectangle(src, Point(r.x, r.y), Point(r.x + r.width, r.y + r.height), Scalar(0, 255, 0), 2, 8, 0);
    }

    // Store the data to file
    Mat response, tmp;
    tmp = response_array.reshape(1, 1); //make continuous
    tmp.convertTo(response, CV_32FC1); // Convert  to float

    FileStorage Data("TrainingData.yml", FileStorage::WRITE); // Store the sample data in a file
    Data << "data" << sample;
    Data.release();

    FileStorage Label("LabelData.yml", FileStorage::WRITE); // Store the label data in a file
    Label << "label" << response;
    Label.release();
    cout << "Training and Label data created successfully....!! " << endl;

    imshow("src", src);
    waitKey();

    return 0;
}

2.2 訓練和測試程式碼

#include "opencv2/opencv.hpp"
#include<opencv2\ml\ml.hpp>

using namespace cv;
using namespace std;

int main(int argc, char** argv)
{

    Mat thr, gray, con;
    Mat src = imread("dig.png", 1);
    cvtColor(src, gray, CV_BGR2GRAY);
    threshold(gray, thr, 200, 255, THRESH_BINARY_INV); // Threshold to create input
    thr.copyTo(con);


    // Read stored sample and label for training
    Mat sample;
    Mat response, tmp;
    FileStorage Data("TrainingData.yml", FileStorage::READ); // Read traing data to a Mat
    Data["data"] >> sample;
    Data.release();

    FileStorage Label("LabelData.yml", FileStorage::READ); // Read label data to a Mat
    Label["label"] >> response;
    Label.release();

    Ptr<ml::KNearest>  knn(ml::KNearest::create());
    //ml::KNearest knn();
    knn->train(sample, ml::ROW_SAMPLE,response); // Train with sample and responses
    cout << "Training compleated.....!!" << endl;

    vector< vector <Point> > contours; // Vector for storing contour
    vector< Vec4i > hierarchy;

    //Create input sample by contour finding and cropping
    findContours(con, contours, hierarchy, CV_RETR_CCOMP, CV_CHAIN_APPROX_SIMPLE);
    Mat dst(src.rows, src.cols, CV_8UC3, Scalar::all(0));

    for (int i = 0; i< contours.size(); i = hierarchy[i][0]) // iterate through each contour for first hierarchy level .
    {
        Rect r = boundingRect(contours[i]);
        Mat ROI = thr(r);
        Mat tmp1, tmp2;
        resize(ROI, tmp1, Size(10, 10), 0, 0, INTER_LINEAR);
        tmp1.convertTo(tmp2, CV_32FC1);
        Mat response;
        float p = knn->findNearest(tmp2.reshape(1, 1), 1, response);
        char name[4];
        sprintf(name, "%d", (int)p);
        putText(dst, name, Point(r.x, r.y + r.height), 0, 1, Scalar(0, 255, 0), 2, 8);
    }

    imshow("src", src);
    imshow("dst", dst);
    imwrite("dest.jpg", dst);
    waitKey();

    return 0;
}

3、Python

import sys

import numpy as np
import cv2

im = cv2.imread('digit.png')
im3 = im.copy()

gray = cv2.cvtColor(im,cv2.COLOR_BGR2GRAY)
blur = cv2.GaussianBlur(gray,(5,5),0)
thresh = cv2.adaptiveThreshold(blur,255,1,1,11,2)

#################      Now finding Contours         ###################

image,contours,hierarchy = cv2.findContours(thresh,cv2.RETR_LIST,cv2.CHAIN_APPROX_SIMPLE)

samples =  np.empty((0,100))
responses = []
keys = [i for i in range(48,58)]

for cnt in contours:
    if cv2.contourArea(cnt)>50:
        [x,y,w,h] = cv2.boundingRect(cnt)

        if  h>28:
            cv2.rectangle(im,(x,y),(x+w,y+h),(0,0,255),2)
            roi = thresh[y:y+h,x:x+w]
            roismall = cv2.resize(roi,(10,10))
            cv2.imshow('norm',im)
            key = cv2.waitKey(0)

            if key == 27:  # (escape to quit)
                sys.exit()
            elif key in keys:
                responses.append(int(chr(key)))
                sample = roismall.reshape((1,100))
                samples = np.append(samples,sample,0)

responses = np.array(responses,np.float32)
responses = responses.reshape((responses.size,1))
print ("training complete")

np.savetxt('generalsamples.data',samples)
np.savetxt('generalresponses.data',responses)

import cv2
import numpy as np

#######   training part    ############### 
samples = np.loadtxt('generalsamples.data',np.float32)
responses = np.loadtxt('generalresponses.data',np.float32)
responses = responses.reshape((responses.size,1))

model = cv2.KNearest()
model.train(samples,responses)

############################# testing part  #########################

im = cv2.imread('dig.png')
out = np.zeros(im.shape,np.uint8)
gray = cv2.cvtColor(im,cv2.COLOR_BGR2GRAY)
thresh = cv2.adaptiveThreshold(gray,255,1,1,11,2)

image,contours,hierarchy = cv2.findContours(thresh,cv2.RETR_LIST,cv2.CHAIN_APPROX_SIMPLE)

for cnt in contours:
    if cv2.contourArea(cnt)>50:
        [x,y,w,h] = cv2.boundingRect(cnt)
        if  h>28:
            cv2.rectangle(im,(x,y),(x+w,y+h),(0,255,0),2)
            roi = thresh[y:y+h,x:x+w]
            roismall = cv2.resize(roi,(10,10))
            roismall = roismall.reshape((1,100))
            roismall = np.float32(roismall)
            retval, results, neigh_resp, dists = model.find_nearest(roismall, k = 1)
            string = str(int((results[0][0])))
            cv2.putText(out,string,(x,y+h),0,1,(0,255,0))

cv2.imshow('im',im)
cv2.imshow('out',out)
cv2.waitKey(0)

OpenCV-簡單數字識別OCR

1、資料 digit.png dig.png 2、C++ 2.1 建立樣本和標籤資料的程式碼 #include "opencv2/opencv.hpp" using namespace cv; using namesp

OpenCV實現0到9數字識別OCR

使用OpenCV對0到9數字進行識別，實現簡單OCR功能，基於CA（輪廓）分析實現特徵提取，基於L1距離計算匹配實現數字識別。在排除干擾的基礎上，識別精度可以達到98%以上。整個演算法分為兩個部分，第一部分是特徵提取，提取的特徵實現了尺度不變性與輕微光照與變形干擾排除，第二部分基於特徵資料進行匹配實

基於opencv的數字識別

最近學習了opencv，然後想通過其對圖片上的數字進行識別，參考了網上幾篇關於opencv數字識別的部落格，我自己也寫了一個程式玩玩。我是在vs2017和opencv3.4.1環境下實現的。這裡先說一下我的思路和步驟：

[機器學習]基於OpenCV實現最簡單的數字識別

http://blog.csdn.net/jinzhuojun/article/details/8579416 本文將基於OpenCV實現簡單的數字識別。這裡以遊戲Angry Birds為例，通過以下幾個主要步驟對其中右上角的分數部分進行自動識別。 1. 學習分類器根據

Java基於opencv實現圖像數字識別(一)

binary oid ring 是把 sca pre 內存還需要自己 Java基於opencv實現圖像數字識別(一) 最近分到了一個任務，要做數字識別，我分配到的任務是把數字一個個的分開；當時一臉懵逼，直接百度java如何分割圖片中的數字，然後就百度到了用Buffere

Java基於opencv實現圖像數字識別(二)—基本流程

數字都是模型 PE 設計 category 理解兩種 ace Java基於opencv實現圖像數字識別(二)—基本流程做一個項目之前呢，我們應該有一個總體把握，或者是進度條；來一步步的督促著我們來完成這個項目，在我們正式開始前呢，我們先討論下流程。我做的主要是表格

【深度學習】python實現簡單神經網路以及手寫數字識別案例

前言 \quad \qu

TensorFlow筆記（3）——利用TensorFlow和MNIST資料集訓練一個最簡單的手寫數字識別模型

前言當我們開始學習程式設計的時候，第一件事往往是學習列印"Hello World"。就好比程式設計入門有Hello World，機器學習入門有MNIST。 MNIST是一個入門級的計算機視覺資料集，它包含各種手寫數字圖片：它也包含每一張圖片對應的標籤，告訴我們這個是數字幾。比如，上

opencv——基於SVM的數字識別（3）

前兩篇文章寫了基於兩種特徵提取的SVM數字識別 https://blog.csdn.net/weixin_41721222/article/details/84953788 https://blog.csdn.net/weixin_41721222/article/details/84978

TensorFlow筆記（3）——利用TensorFlow和MNIST資料集訓練一個最簡單的手寫數字識別模型...

前言當我們開始學習程式設計的時候，第一件事往往是學習列印"Hello World"。就好比程式設計入門有Hello World，機器學習入門有MNIST。 MNIST是一個入門級的計算機視覺資料集，它包含各種手寫數字圖片：

OpenCV機器學習：SVM分類器實現MNIST手寫數字識別

0. 開發環境最近機器學習隨著AI人工智慧的興起越來越火，博主想找一些ML的庫來練手。突然想起之前在看Opencv的doc時發現有ML的component，於是心血來潮就開始寫程式碼試試。話不多說，直接進正題。以下我的開發環境配置： -Windows7

基於opencv的手寫數字識別（MFC,HOG,SVM）

因為本程式是提取HOG特徵，使用SVM進行分類的，所以大概瞭解下HOG的一些知識，其中我覺得怎麼計算影象HOG特徵的維度會對程式瞭解有幫助關於HOG，我們可以參考： http://gz-ricky.blogbus.com/logs/85326

OpenCV儀表資料識別（二）：數字區域自動定位

下載和配置Opencv在網上和書上有很多的講解，這裡不再贅述。此處附上Opencv的下載連結。想要對圖片中的數字資訊進行識別首先要對圖片進行預處理，排除干擾的因素，只留下有價值的資訊。這裡需要兩張圖，一張為有資料的圖片，一張為儀表關閉時沒有資料的圖

卷積神經網路（二）：應用簡單卷積網路實現MNIST數字識別

卷積神經網路簡單實現MNIST數字識別本篇的主要內容：一個兩層卷積層的簡單卷積網路的TensorFlow的實現網路的結構在這張圖裡，我把每一層的輸入以及輸出的結構都標註了，結合閱讀程式碼食用效果更佳。具體程式碼具體的內容，都寫在相應位置的註釋中

基於Tensorflow, OpenCV. 使用MNIST資料集訓練卷積神經網路模型，用於手寫數字識別

基於Tensorflow，OpenCV 使用MNIST資料集訓練卷積神經網路模型，用於手寫數字識別一個單層的神經網路，使用MNIST訓練，識別準確率較低兩層的卷積神經網路，使用MNIST訓練（模型使用MNIST測試集準確率高於99%

從零使用OpenCV快速實現簡單車牌識別系統

不錯的計算機視覺部落格：http://blog.csdn.net/lee_cv/article/details/9180719 篇文章獻給所有第一次聽說車牌識別ANPR但需要短時間實現的苦逼同學們。最近的小學期實訓做的是一個車牌識別系統，說實話真不知道學校怎麼想的，雖

Tensorflow手寫數字識別之簡單神經網路分類與CNN分類效果對比

用Tensorflow進行深度學習和人工智慧具有開發簡單，建模速度快，準確度高的優點。作為學習影象識別分類的入門，手寫輸入數字識別是個很好的例子。 MNIST包中共有60000個手寫數字筆跡灰度影象作為訓練集，每張手寫數字筆跡圖片均已儲存為28*28畫素，同時還有一個la

opencv——基於SVM的數字識別（2）

上篇文章我們用的特徵是訓練樣本的所有畫素點值，雖然方便但不準確。這篇文章主要介紹用SVM+HOG特徵對數字進行識別。詳細請看上篇文章，它們主要區別在於訓練樣本HOG特徵的提取，其他基本一樣，所以我直接附上程式碼。下面程式碼是opencv3和C++ 可以根據自己需要修改訓練樣本類

opencv——基於KNN的數字識別

KNN即K個最近鄰，網上有很多關於KNN的文章。我大概總結下核心：假設有A圖片，讓A與訓練樣本依次計算相似度（可用歐式距離），挑選出K個與A圖片相似度最大的圖片，這K個圖片中，哪種型別最多那麼定義A圖片也屬於該型別。首先，需要有數字的訓練樣本 https://download.csdn.n

opencv——基於SVM的數字識別（1）

關於SVM的原理有很多優秀的視訊和資料，這裡我主要說下利用SVM對數字識別的具體應用首先，需要有數字的訓練樣本 https://download.csdn.net/download/weixin_41721222/10784418 把0-9資料夾放入模版匹配樣本之中，自己可

OpenCV-簡單數字識別OCR

1、資料

2、C++

2.1 建立樣本和標籤資料的程式碼

2.2 訓練和測試程式碼

3、Python

相關推薦