利用無引數的K近鄰分類器KNeighborsClassifier進行三類分類(複習4)

阿新 • • 發佈：2018-12-31

本文是個人學習筆記，內容主要涉及KNN(KNeighborsClassifier)對sklearn內建的Iris資料集進行三類分類。

K近鄰模型的大致決策方式如下圖：
這裡寫圖片描述
尋找與某個待分類樣本在特徵空間中距離最近的K個已標記樣本作為參考，進而幫助做出分類決策。K取不同的值，會得到不同效果的分類器(比如上如K=3時紅色點被分為綠色類，K=7時紅色點被分為藍色類)。

K近鄰演算法沒有引數訓練過程，即沒有通過任何學習演算法分析訓練資料，只是根據測試樣本在訓練資料的分佈直接做出分類決策，因此K近鄰屬於無引數模型，該模型的計算複雜度(平方級)和記憶體消耗非常高。該模型每處理一個測試樣本，都需要對所有預先載入在內村的訓練樣本進行遍歷，逐一計算相似度、排序並且選取K個最近鄰訓練樣本的標記

，進而做出分類決策。

from sklearn.datasets import load_iris
iris=load_iris()
iris.data.shape
#Output:(150,4)

print(iris.DESCR)   #檢視資料說明

這裡寫圖片描述

from distutils.version import LooseVersion as Version  
from sklearn import __version__ as sklearn_version  
from sklearn import datasets  
if Version(sklearn_version) < '0.18' 
:  
    from sklearn.cross_validation import train_test_split  
else:  
    from sklearn.model_selection import train_test_split  
X_train,X_test,y_train,y_test = train_test_split(iris.data, iris.target, test_size=0.25, random_state=33)

from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import 
 KNeighborsClassifier
ss=StandardScaler()
X_train=ss.fit_transform(X_train)
X_test=ss.transform(X_test)

knc=KNeighborsClassifier()
knc.fit(X_train,y_train)
y_predict=knc.predict(X_test)

print('The accuracy of K-Nearest Neighbor Classifier is',knc.score(X_test,y_test))
#Output:The accuracy of K-Nearest Neighbor Classifier is 0.894736842105

from sklearn.metrics import classification_report
print(classification_report(y_test,y_predict,target_names=iris.target_names))

這裡寫圖片描述

利用無引數的K近鄰分類器KNeighborsClassifier進行三類分類(複習4)

利用無引數的K近鄰分類器KNeighborsClassifier進行三類分類(複習4)

機器學習之分類器——Matlab中各種分類器的使用總結（隨機森林、支援向量機、K近鄰分類器、樸素貝葉斯等）

Python中的k—近鄰演算法（處理常見的分類問題）

使用K近鄰（KNN）對鳶尾花分類

ML之分類預測之ElasticNet：利用ElasticNet迴歸對二分類資料集構建二分類器(DIY交叉驗證+分類的兩種度量PK)

分類器設計之線性分類器和線性SVM(含Matlab程式碼)

利用Python實現K-Means聚類並進行圖形化展示

評估分類器效能及提升分類器準確率的組合方法

python資料探勘入門與實踐--------電離層（Ionosphere）, scikit-learn估計器，K近鄰分類器，交叉檢驗，設定引數

機器學習之路: python k近鄰分類器鳶尾花分類預測

Python實現K近鄰演算法_分類器

基於TensorFlow的K近鄰（KNN）分類器實現——以MNIST為例

K近鄰分類器(KNN)手寫數字(MNIST)識別

分類（2）：k-最近鄰、貝葉斯分類器

資料探勘-K-近鄰分類器-Iris資料集分析-使用K-近鄰分類器進行分類預測(四)

圖片分類-K近鄰分類器

利用sklearn包中的k-近鄰演算法進行分類

K近鄰算法——多分類問題

【轉載】用Scikit-Learn構建K-近鄰算法，分類MNIST數據集

機器學習實戰 k-近鄰算法實施kNN分類算法

利用無引數的K近鄰分類器KNeighborsClassifier進行三類分類(複習4)

相關推薦