學習KNN（二）KNN演算法手寫數字識別的OpenCV實現

阿新 • • 發佈：2019-01-03

在OpenCV的安裝檔案路徑/opencv/sources/samples/data/digits.png下，有這樣一張圖：
這裡寫圖片描述
圖片大小為1000*2000,有0-9的10個數字，每5行為一個數字，總共50行，共有5000個手寫數字，每個數字塊大小為20*20。
為了後續方便處理，我們先寫一段小程式把這5000個圖截取出來：

#include <opencv2/opencv.hpp>
#include <iostream>

 using namespace std;
 using namespace cv;

 int main()
 {
     char ad[128]={0};
     int  filename = 0 
,filenum=0; 
     Mat img = imread("digits.png");
     Mat gray;
     cvtColor(img, gray, CV_BGR2GRAY);
     int b = 20;
     int m = gray.rows / b;   //原圖為1000*2000
     int n = gray.cols / b;   //裁剪為5000個20*20的小圖塊

     for (int i = 0; i < m; i++)
     {
         int offsetRow = i*b;  //行上的偏移量
         if(i%5==0&&i!=0 
)
         {
             filename++;
             filenum=0;
         }
         for (int j = 0; j < n; j++)
         {
                int offsetCol = j*b; //列上的偏移量
             sprintf_s(ad, "D:\\data\\%d\\%d.jpg",filename,filenum++);
             //擷取20*20的小塊
             Mat tmp;
             gray(Range(offsetRow, offsetRow + b), Range(offsetCol, offsetCol + b)).copyTo(tmp);
             imwrite(ad,tmp);
         }
     }
     return 
 0;
 }

擷取之後每個以數字命名的資料夾內就都有500張圖片了，需要注意的是OpenCV的imwrite是沒有自動建立資料夾功能的，所以路徑應該提前存在。

OpenCV提供的KNN演算法建構函式：

C++: CvKNearest::CvKNearest()  
C++: CvKNearest::CvKNearest(const Mat& trainData, const Mat& responses, const Mat& sam-  
pleIdx=Mat(), bool isRegression=false, int max_k=32 )

訓練函式為：

C++: bool CvKNearest::train(  
    const Mat& trainData, //訓練資料  
    const Mat& responses,//對應的響應值  
    const Mat& sampleIdx=Mat(),//樣本索引  
    bool isRegression=false,//是否是迴歸，否則是分類問題  
    int maxK=32, //最大K值  
    bool updateBase=false//是否更新資料，是，則maxK需要小於原資料大小 )

查詢函式為：

C++: float CvKNearest::find_nearest(  
const Mat& samples,//按行儲存的測試資料  
 int k, //K 值  
Mat* results=0,//預測結果  
const float** neighbors=0, //近鄰指標向量  
Mat* neighborResponses=0, //近鄰值  
Mat* dist=0 //距離矩陣) const  

C++: float CvKNearest::find_nearest(  
const Mat& samples,  
int k,  
Mat& results,  
Mat& neighborResponses,  
Mat& dists) const

但是由於KNN的特點，其實並沒有train的功能，所以train只是相當於儲存下來訓練樣本，而且會在執行建構函式中執行訓練過程。

在之前，我們已經把5000張圖分別放進了10個資料夾裡了，現在我們把其中的每個類別中前400張拿出來做訓練資料，其餘的測試，程式碼如下：

#include <iostream>
#include <opencv2/opencv.hpp>
#include <opencv2/ml/ml.hpp>  
using namespace std;
using namespace cv;

char ad[128]={0};

int main()
{
    Mat traindata ,trainlabel;
    int k=5,testnum=0,truenum=0;
    //讀取訓練資料 4000張
    for (int i = 0; i < 10; i++)
     {
         for (int j =0;j<400;j++)
         {
              sprintf_s(ad, "D:\\data\\%d\\%d.jpg",i,j);
              Mat srcimage = imread(ad);
              srcimage = srcimage.reshape(1,1);
              traindata.push_back(srcimage);
              trainlabel.push_back(i);
         }
     }
       traindata.convertTo(traindata,CV_32F);
      CvKNearest knn( traindata, trainlabel, cv::Mat(), false, k );  
      cv::Mat nearests( 1, k, CV_32F);  
      //讀取測試資料  1000張
      for (int i = 0; i < 10; i++)
      {
          for (int j =400;j<500;j++)
          {
              testnum++;
              sprintf_s(ad, "D:\\data\\%d\\%d.jpg",i,j);
              Mat testdata = imread(ad);
              testdata = testdata.reshape(1,1);
              testdata.convertTo(testdata,CV_32F);
              int  response = knn.find_nearest(testdata,k,0,0,&nearests,0); 
              if (response==i)
              {
                  truenum++;
              }
          }
      }
      cout<<"測試總數"<<testnum<<endl;
      cout<<"正確分類數"<<truenum<<endl;
      cout<<"準確率："<<(float)truenum/testnum*100<<"%"<<endl;
      return 0;
}

在上述程式碼中，用的特徵就是每個位置的畫素值，一個樣本拉成一維後的列是20*20*3=1200。
這裡寫圖片描述
最後是一些個人想法，為什麼KNN在手寫數字的資料庫中表現優異，我覺得主要是因為影象較簡單，數字在影象中的位置很規則，都在中間，這兩個特點非常利於KNN做距離的計算。

學習KNN（二）KNN演算法手寫數字識別的OpenCV實現

基於KNN分類演算法手寫數字識別的實現（二）——構建KD樹

從零開始學caffe（四）：mnist手寫數字識別網路結構模型和超引數檔案的原始碼閱讀

學習KNN（二）KNN演算法手寫數字識別的OpenCV實現

機器學習實戰——KNN演算法手寫數字識別

機器學習使用python+OpenCV實現knn演算法手寫數字識別

機器學習實戰（二）LR演算法：實現簡單的分類模型

語音識別學習筆記（二）【基於向量量化的識別技術】

學習elua（二）--編譯和燒寫

【好玩的計算機視覺】KNN演算法手寫數字識別

Python實現knn演算法手寫數字識別

Keras入門實戰（1）：MNIST手寫數字分類

學習SVM（一） SVM模型訓練與分類的OpenCV實現

Tensorflow深度學習之七：再談mnist手寫數字識別程式

基於感知機的手寫數字識別java實現

Deep Learning-TensorFlow (1) CNN卷積神經網路_MNIST手寫數字識別程式碼實現詳解

機器學習--k-近鄰演算法（kNN）實現手寫數字識別

各種機器學習方法（線性迴歸、支援向量機、決策樹、樸素貝葉斯、KNN演算法、邏輯迴歸）實現手寫數字識別並用準確率、召回率、F1進行評估

opencv 視覺項目學習筆記（二）：基於 svm 和 knn 車牌識別

opencv 視覺專案學習筆記（二）：基於 svm 和 knn 車牌識別

機器學習入門（1）--KNN演算法

學習KNN（二）KNN演算法手寫數字識別的OpenCV實現

相關推薦