1. 程式人生 > >2018.11.15 作業十

2018.11.15 作業十

分類與監督學習,樸素貝葉斯分類演算法

1.理解分類與監督學習、聚類與無監督學習。

簡述分類與聚類的聯絡與區別。

聯絡:分類與聚類都是對物件的一種劃分。

分類是我們給物件分為幾個類。聚類是我們把相似的東西集中在一起。

分類要事先定義好類別 ,類別數不變 。聚類的類別是在聚類過程中自動生成的。

分類器的構造方法有統計方法、機器學習方法、神經網路方法等等。

常見的聚類演算法包括:K-均值聚類演算法、K-中心點聚類演算法、CLARANS、 BIRCH、CLIQUE、DBSCAN等。

 

簡述什麼是監督學習與無監督學習。

監督學習可以用於映射出該例項的類別。

無監督學習,我們只知道特徵,並不知道答案,不同的例項具有一定的相似性,把那些相似的聚集在一起。

 

2.樸素貝葉斯分類演算法 例項

利用關於心臟情患者的臨床資料集,建立樸素貝葉斯分類模型。

有六個分類變數(分類因子):性別,年齡、KILLP評分、飲酒、吸菸、住院天數

目標分類變數疾病:–心梗–不穩定性心絞痛

新的例項:–(性別=‘男’,年齡<70, KILLP=‘I',飲酒=‘是’,吸菸≈‘是”,住院天數<7)

最可能是哪個疾病?

上傳演算過程。

 

3.程式設計實現樸素貝葉斯分類演算法

利用訓練資料集,建立分類模型。

輸入待分類項,輸出分類結果。

可以心臟情患者的臨床資料為例,但要對資料預處理。 

from sklearn.datasets import load_iris
iris = load_iris()
iris.data[55]
iris.target[55]
from sklearn.naive_bayes import GaussianNB
gnb = GaussianNB() 
gnb.fit(iris.data,iris.target)  
gnb.predict([iris.data[12]])