2018.11.15 作業十
阿新 • • 發佈:2018-11-19
分類與監督學習,樸素貝葉斯分類演算法
1.理解分類與監督學習、聚類與無監督學習。
簡述分類與聚類的聯絡與區別。
聯絡:分類與聚類都是對物件的一種劃分。
分類是我們給物件分為幾個類。聚類是我們把相似的東西集中在一起。
分類要事先定義好類別 ,類別數不變 。聚類的類別是在聚類過程中自動生成的。
分類器的構造方法有統計方法、機器學習方法、神經網路方法等等。
常見的聚類演算法包括:K-均值聚類演算法、K-中心點聚類演算法、CLARANS、 BIRCH、CLIQUE、DBSCAN等。
簡述什麼是監督學習與無監督學習。
監督學習可以用於映射出該例項的類別。
無監督學習,我們只知道特徵,並不知道答案,不同的例項具有一定的相似性,把那些相似的聚集在一起。
2.樸素貝葉斯分類演算法 例項
利用關於心臟情患者的臨床資料集,建立樸素貝葉斯分類模型。
有六個分類變數(分類因子):性別,年齡、KILLP評分、飲酒、吸菸、住院天數
目標分類變數疾病:–心梗–不穩定性心絞痛
新的例項:–(性別=‘男’,年齡<70, KILLP=‘I',飲酒=‘是’,吸菸≈‘是”,住院天數<7)
最可能是哪個疾病?
上傳演算過程。
3.程式設計實現樸素貝葉斯分類演算法
利用訓練資料集,建立分類模型。
輸入待分類項,輸出分類結果。
可以心臟情患者的臨床資料為例,但要對資料預處理。
from sklearn.datasets import load_iris iris = load_iris() iris.data[55] iris.target[55] from sklearn.naive_bayes import GaussianNB gnb = GaussianNB() gnb.fit(iris.data,iris.target) gnb.predict([iris.data[12]])