mooc機器學習第六天-K近鄰，決策樹，樸素貝葉斯分類器簡單嘗試

阿新 • • 發佈：2020-06-29

1.下面的程式碼是上一篇理論中的小例子

from sklearn.neighbors import KNeighborsClassifier # K近鄰分類器
from sklearn.datasets import load_iris  # 鳶尾花資料
from sklearn.tree import DecisionTreeClassifier  #決策樹分類器
from sklearn.model_selection import cross_val_score #交叉驗證值函式
from sklearn.naive_bayes import GaussianNB #樸素貝葉斯分類器
import  numpy as np #科學計算庫


#小示例實現順序與導包順序相同


X=[[0],[1],[2],[3]]
y=[0,0,1,1]

neigh=KNeighborsClassifier(n_neighbors=3)
neigh.fit(X,y)
print("+++++K近鄰+++++")
print(neigh.predict([[1.2]]))



clf=DecisionTreeClassifier()
irls=load_iris()
re=cross_val_score(clf,irls.data,irls.target,cv=10)
print("+++++交叉驗證+++++")
print(re)

print("+++++決策樹+++++")
clf.fit(X,y)
print(clf.predict([[2.2]]))



A=np.array([[-1,-1],[-2,-1],[-3,-2],[2,1],[1,1],[3,2]])
B=np.array([1,1,1,2,2,2])

clf1=GaussianNB(priors=None)
clf1.fit(A,B)
r=clf1.predict([[-0.8,-1]])
print("+++++樸素畢貝葉斯+++++")
print(r)

2.結果

+++++K近鄰+++++
[0]
+++++交叉驗證+++++
[ 1.          0.93333333  1.          0.93333333  0.93333333  0.86666667
  0.93333333  0.93333333  1.          1.        ]
+++++決策樹+++++
[1]
+++++樸素畢貝葉斯+++++
[1]

3.利用mooc給的feature資料實踐

import  numpy as np
import  pandas as pd

from  sklearn.preprocessing import  Imputer#資料預處理庫
from  sklearn.cross_validation import train_test_split  #打亂訓練資料
from  sklearn.metrics  import  classification_report #計算召回率，F1值，精準度


from sklearn.neighbors import  KNeighborsClassifier
from sklearn.tree import  DecisionTreeClassifier
from sklearn.naive_bayes import GaussianNB


def load_datasets(feature_path,lable_path):
    #設定shape
    feature=np.ndarray(shape=(0,41))
    lable=np.ndarray(shape=(0,1))
    #處理檔案缺失值
    for file in feature_path:
        df=pd.read_table(file,delimiter=',',na_values="?",header=None)
        imp=Imputer(missing_values='NaN',strategy='mean',axis=0)
        imp.fit(df)
        #Impute all missing values in X.
        df=imp.transform(df)
        feature=np.concatenate((feature,df))

    for file in lable_path:
        df=pd.read_table(file,header=None)
        lable=np.concatenate((lable,df))


    lable=np.ravel(lable)
    return feature, lable


if __name__ == '__main__':
   '''資料具體路徑'''
   featurepaths=['/A/A.feature',
                '/B/B.feature',
                '/C/C.feature',
                '/D/D.feature',
                '/E/E.feature'
                ]
   labelPaths=['/A/A.label',
              '/B/B.label',
              '/C/C.label',
              '/D/D.label',
              '/E/E.label']

   '''讀如資料'''
   x_train, y_train = load_datasets(featurepaths[:4], labelPaths[:4])
   x_test, y_test = load_datasets(featurepaths[4:], labelPaths[4:])
   #打亂訓練資料
   x_train, x_, y_train, y_ = train_test_split(x_train, y_train, test_size=0.0)


   #建立三種分類器並預測
   print('Start training knn')
   knn = KNeighborsClassifier().fit(x_train, y_train)
   print('Training done')
   answer_knn = knn.predict(x_test)
   print('Prediction done')

   print('Start training DT')
   dt = DecisionTreeClassifier().fit(x_train, y_train)
   print('Training done')
   answer_dt = dt.predict(x_test)
   print('Prediction done')

   print('Start training Bayes')
   gnb = GaussianNB().fit(x_train, y_train)
   print('Training done')
   answer_gnb = gnb.predict(x_test)
   print('Prediction done')


   #結果展示
   '''
   Build a text report showing the main classification metrics
   classification_report&精確度/召回率/F1值
   '''
   print('\n\nThe classification report for knn:')
   print(classification_report(y_test, answer_knn))
   print('\n\nThe classification report for DT:')
   print(classification_report(y_test, answer_dt))
   print('\n\nThe classification report for Bayes:')
   print(classification_report(y_test, answer_gnb))

mooc機器學習第六天-K近鄰，決策樹，樸素貝葉斯分類器簡單嘗試

1.下面的程式碼是上一篇理論中的小例子 from sklearn.neighbors import KNeighborsClassifier # K近鄰分類器

各種機器學習演算法的應用場景分別是什麼（比如樸素貝葉斯、決策樹、K 近鄰、SVM、邏輯迴歸最大熵模型）？...

連結：https://www.zhihu.com/question/26726794 編輯：深度學習與計算機視覺宣告：僅做學術分享，侵刪

機器學習：樸素貝葉斯分類器實現二分類（伯努利型）程式碼+專案實戰

一、樸素貝葉斯分類器的構建 import numpy as np class BernoulliNavieBayes: def __init__(self, alpha=1.):

機器學習（3）高斯判別分析&樸素貝葉斯分類器

判別模型與生成模型判別模型判別模型是對觀測資料進行直接分類，常見的判別模型有邏輯迴歸和感知機演算法等。此模型僅對資料進行分類，並不能具象化或者量化資料本身的分佈狀態，因此也無法根據分類生成可

機器學習演算法的R語言實現：樸素貝葉斯分類器

1、引子樸素貝葉斯方法是一種使用先驗概率去計算後驗概率的方法，其中樸素的意思實際上指的是一個假設條件，後面在舉例中說明。本人以為，純粹的數學推導固然有其嚴密性、邏輯性的特點，但對我等非數學專業的人來

貝葉斯決策論&樸素貝葉斯分類器學習筆記

技術標籤：機器學習python 學習目標掌握貝葉斯決策論的原理、樸素貝葉斯分類器的推導過程以及實現方法

mooc機器學習第七天-分類支援向量機svm.svc

1.函式簡介 sklearn.svm.SVC(C=1.0,kernel=\'rbf\',degree=3,gamma=\'auto\',coef0=0.0,shrinking=True,probability=False,

機器學習（五）貝葉斯分類器之估算收入階層

技術標籤：機器學習python機器學習樸素貝葉斯演算法人工智慧估算收入階層實驗內容

機器學習-樸素貝葉斯分類演算法（java，判斷西瓜好壞案例）

技術標籤：機器學習java演算法概率論和高中數學都學習過貝葉斯公式來計算條件概率，A發生下B傳送的概率這種題，比較熟悉。樸素貝葉斯分類演算法或許和這個有點關係吧…

機器學習sklearn（86）：演算法例項（43）分類（22）樸素貝葉斯（五）貝葉斯分類器做文字分類

1 文字編碼技術簡介 1.1 單詞計數向量 sample = [\"Machine learning is fascinating, it is wonderful\"

Python資料科學手冊-機器學習：樸素貝葉斯分類

樸素貝葉斯模型樸素貝葉斯模型是一組非常簡單快速的分類方法，通常適用於維度非常高的資料集。因為執行速度快，可調引數少。是一個快速粗糙的分類基本方案。

樸素貝葉斯分類學習總結

寫在前面：還是筆記的總結輸出，大佬看了笑笑就好樸素貝葉斯首先我們在小學二年級就學過先驗概率，百度百科給出的解釋：先驗概率（prior probability）是指根據以往經驗和分析得到的概率，個人理解上來

mooc機器學習第九天-手寫數字分類例項（MLP,K近鄰）

1.mooc資料任務簡介 2.程式碼（1）MLP import numpy as np#匯入numpy工具包 from os import listdir #使用listdir模組，用於訪問本地檔案

java學習第六天2020/7/11

一. 今天先是對昨天的知識進行了練習； package 陣列; import java.util.Random; import java.util.Arrays;

mooc機器學習第九天-多項式迴歸

Mooc上一篇的房屋和價格迴歸預測使用的一元線性迴歸，這次該用多項式看看擬合效果有什麼變化。

Docker的學習第六天

DockerFIle Dockerfile介紹 Dockerfile 是用來構建 docker映象的檔案，命令的引數指令碼

機器學習第三天--程式優化

就第二天對資料處理的程式顯得十分臃腫，語句程式碼複用率差，不便於深刻理解，

大資料機器學習（四）K-近鄰演算法

K-近鄰演算法（K-nearest neighbor，KNN）實質：找k個最近的鄰居，人多取勝（問題是k值該取多少怎麼確定）三個基本要素：

JAVA學習第六天

編譯和解釋編譯：一次性把程式碼翻譯為電腦可以理解的二進位制；（例如：作業系統，C,C++等）

python學習第六天----面向物件

1.建立一個類： class Student(): name = \'\' age = 0 def print_file(self): print(\'name: \' + self.name)

mooc機器學習第六天-K近鄰，決策樹，樸素貝葉斯分類器簡單嘗試

相關推薦