1. 程式人生 > >K-近鄰算法(KNN)

K-近鄰算法(KNN)

size log col 特征 個數 div 不同 算法 nbsp

1.概述

1.1 原理:(測量不同的特征值之間的距離進行分類)

存在樣本數據集合,即訓練樣本集,並且樣本集中的每個數據都存在多個特征和標簽,即我們知道樣本數據和其所屬分類,在我們輸入沒有標簽的新數據後,將新數據的每個特征和樣本集中的數據對應的特征進行比較,然後根據相應算法(本節選擇的是歐氏距離)提取與樣本集中特征最相近數據得分類標簽。一般選擇與樣本集中最相近的前k個數據,即k-近鄰。最後,選擇k個最相似數據中出現次數最多的分類最為新數據的分類。

1.2 KNN算法

利用一組測試數據:

K-近鄰算法(KNN)