1. 程式人生 > >Kiggle:Digit Recognizer

Kiggle:Digit Recognizer

矩陣 mage get 特征 pixel 步驟 kaggle 題目 a算法

題目鏈接:Kiggle:Digit Recognizer

Each image is 28 pixels in height and 28 pixels in width, for a total of 784 pixels in total.

  給的是28像素的高和寬,所以總共有784像素,在處理的過程中,先用PCA進行降維,對數據進行主要的特征分量;然後通過KNN(K-鄰近算法)進行對測試數據的預測分類。

  對於PCA算法:主成分分析,是通過線性變質將原始數據轉換程一組各維度無關的表示,可以用於提取數據的主要特征分量,用於高維數據的降維。

  步驟:

    1.將原始數據按行組成n行m列的矩陣X

    2.將X的每一行進行零均值化,即減去每一行的均值

    3.求出協方差矩陣

    4.求出協方差矩陣的特征值以及對應的特征向量

    5.將特征向量按對應特征值的大小從上到下按行排序,排列成矩陣,取前K行組成矩陣P

    6.Y=PX,即為降維到K維的數據

Kiggle:Digit Recognizer