1. 程式人生 > >人工智能 tensorflow框架-->MNIST手寫字符數據集 06

人工智能 tensorflow框架-->MNIST手寫字符數據集 06

推廣 x文件 數據集 2.4 mage esx cnblogs -i 向量空間

1.下載MNIST數據集:

技術分享

2.1數據集分成兩部分:60000行的訓練集 trainxxx (包含手寫數字的圖片imagexxx 和 手寫數字對應的標簽labelxxx)

10000行的測試集 t10kxxx (同上)

2.2分成以上兩部分是因為在機器學習模型設計時必須有一個單獨的測試數據集不用於訓練而是用來評估這個模型的性能,從而更加容易把設計的模型推廣到其他數據集上(泛化)。

2.3image每一張圖片包含28X28個像素點,即每張圖是28X28=784維向量空間裏面的點

技術分享784

2.4在MNIST數據集中 trainxxx-imagesxxx文件是一個形狀為【60000,784】的張量,第一個維度用來索引圖片(共有60000個索引),第二個維度數字用來索引每張圖片的像素點(共784個像素點)。在此張量裏的每一個元素都表示某張圖片裏的某個像素的強度值,強度值介於0和1之間。

技術分享

2.5label每一張標簽的數字值對應手寫圖中的值,介於0到9的數字,數字n將表示成一個只有在第n維度(從0開始)數字為1的10維向量,比如標簽0將表示成(【1,0,0,0,0,0,0,0,0,0】),因此trainxxx-labels文件是一個【60000,10】的數字矩陣。

技術分享

人工智能 tensorflow框架-->MNIST手寫字符數據集 06