1. 程式人生 > 其它 >18例項介紹之手寫識別

18例項介紹之手寫識別

影象識別

  • 影象識別(Image Recognition)是指利用計算機對影象進行處理、分析和理解,以識別各種不同模式的目標和對像的技術。
  • 影象識別的發展經歷了三個階段:文字識別、數字影象處理與識別、物體識別。機器學習領域一般將此類識別問題轉化為分類問題。



手寫識別

  • 手寫識別是常見的影象識別任務。計算機通過手寫體圖片來識別出圖片中的字,與印刷字型不同的是,不同人的手寫體風格迥異,大小不一,造成了計算機對手寫識別任務的一些困難。
  • 數字手寫體識別由於其有限的類別(0~9共10個數字)成為了相對簡單的手寫識別任務。DBRHDMNIST是常用的兩個數字手寫識別資料集

MNIST資料集

MNIST的下載連結:

http://yann.lecun.com/exdb/mnist/

MNIST是一個包含數字0~9的手寫體圖片資料集,圖片已歸一化為以手寫數字為中心的28*28規格的圖片。MNIST由訓練集與測試集兩個

部分組成,各部分規模如下:

  • 訓練集:60,000個手寫體圖片及對應標籤
  • 測試集:10,000個手寫體圖片及對應標籤

MNIST資料集的手寫數字樣例:

  • MNIST資料集中的每一個圖片由28*28個畫素點組成。
  • 每個畫素點的值區間為0-255,0表示白色,255表示黑色。

DBRHD資料集

DBRHD (Pen-Based Recognition of HandwrittenDigits Data Set)是UCI的機器學習中心提供的數字手寫體資料庫:

https://archive.ics.uci.edu/ml/datasets/Pen-Based+Recognition+of+Handwritten+Digits

DBRHD資料集包含大量的數字09的手寫體圖片,這些圖片來源於44位不同的人的手寫數字,圖片已歸一化為以手寫數字為中心的32*32規格的圖片。DBRHD的訓練集與測試集組成如下:

  • 訓練集:7494個手寫體圖片及對應標籤,來源於40位手寫者。
  • 測試集:3498個手寫體圖片及對應標籤,來源於14位手寫者。

DBRHD資料集特點:

  • 去掉了圖片顏色等複雜因素,將手寫體數字圖片轉化為訓練資料為大小32*32的文字矩陣。
  • 空白區域使用0代表,字跡區域使用1表示。



“手寫識別”例項

已有許多模型在MNIST或DBRHD資料集上進行了實驗,有些模型對資料集進行了偏斜矯正,甚至在資料集上進行了人為的扭曲、偏移、縮放及失真等操作以獲取更加多樣性的樣本,使得模型更具有泛化性。

常用於數字手寫體的分類器:

  • 線性分類器

  • K最近鄰分類器

  • 非線性分類器

  • SVM

  • MLP多層感知器

  • 卷積神經網路



後續任務

利用全連線的神經網路實現手寫識別的任務。

個人對於手寫識別還是很感興趣的,雖然這只是最簡單的數字識別,一定好好學!

今天平板修好了,終於可以開始畫畫了,過兩天去貼個膜。