Python 機器學習-鳶尾花分類

阿新 • • 發佈：2019-01-07

'''
#Python 機器學習-鳶尾花分類
'''

#匯入類庫
from pandas import read_csv
from pandas.plotting import scatter_matrix
from matplotlib import pyplot
from sklearn.model_selection import train_test_split
from sklearn.model_selection import KFold
from sklearn.model_selection import cross_val_score
from sklearn.metrics import classification_report
from sklearn.metrics import confusion_matrix
from sklearn.metrics import accuracy_score
from sklearn.linear_model import LogisticRegression
from sklearn.tree import DecisionTreeClassifier
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis
from sklearn.neighbors import KNeighborsClassifier
from sklearn.naive_bayes import GaussianNB
from sklearn.svm import SVC

#匯入資料
filename = 'iris.data.csv'
names = ['separ-length','separ-width','petal-length','petal-width','class']
dataset = read_csv(filename,names=names)

#檢視資料緯度
print('資料緯度:行%s,列%s'%dataset.shape)

#檢視資料前十行
print(dataset.head(10))

#統計描述資料
print(dataset.describe())

#資料分類分佈
print(dataset.groupby('class').size())

#箱線圖
dataset.plot(kind='box',subplots=True,layout=(2,2),sharex=False,sharey=False)
pyplot.show()

#直方圖
dataset.hist()
pyplot.show()

#散點矩陣圖
scatter_matrix(dataset)
pyplot.show()

#分離評估資料集
array=dataset.values
X=array[:,0:4]
Y=array[:,4]
validation_size=0.2
seed=7
X_train,X_validation,Y_train,Y_validation=\
    train_test_split(X,Y,test_size=validation_size,
    random_state=seed)

#演算法審查
models={}
models['LR']=LogisticRegression()
models['LDA']=LinearDiscriminantAnalysis()
models['KNN']=KNeighborsClassifier()
models['CART']=DecisionTreeClassifier()
models['NB']=GaussianNB()
models['SVM']=SVC()
results=[]
for key in models:
    kfold=KFold(n_splits=10,random_state=seed)
    cv_results=cross_val_score(models[key],X_train,
        Y_train,cv=kfold,scoring='accuracy')
    results.append(cv_results)
    print('%s:%f(%f)'%(key,cv_results.mean(),cv_results.std()))

#箱線圖比較演算法    
fig = pyplot.figure()
fig.suptitle('Algorithm Comparison')
ax = fig.add_subplot(111)
pyplot.boxplot(results)
ax.set_xticklabels(models.keys())
pyplot.show()

#使用評估資料集評估演算法
svm = SVC()
svm.fit(X=X_train,y=Y_train)
predictions = svm.predict(X_validation)
print(accuracy_score(Y_validation,predictions))
print(confusion_matrix(Y_validation,predictions))
print(classification_report(Y_validation,predictions))

Python 機器學習-鳶尾花分類

''' #Python 機器學習-鳶尾花分類 ''' #匯入類庫 from pandas import read_csv from pandas.plotting import scatter_matrix from matplotlib import pyplot from sklearn.mo

python機器學習_(1)鳶尾花的分類

鳶尾花的分類是python機器學習中比較經典的一個入門式教學課程，屬於監督學習演算法包括四個方面，訓練，測試，評估，評估此次記錄也適合從這四個方面出發一：訓練利用已知的鳶尾花資料構建機器學習模型，用於預測新測量的鳶尾花的品種。鳶尾花的資料哪裡來呢？有一個開源專案叫做sciket-learn，裡面有鳶尾花的15

2、python機器學習基礎教程——K近鄰演算法鳶尾花分類

一、第一個K近鄰演算法應用：鳶尾花分類 import numpy as np from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.neighbors

Python機器學習：7.2 結合不同的分類算法進行投票

機器學習 div blog 我們 mac .com nts sep section 這一節學習使用sklearn進行投票分類，看一個具體的例子，數據集采用Iris數據集，只使用sepal width和petal length兩個維度特征，類別我們也只是用兩類：Iris-Ve

Python機器學習筆記：利用Keras進行多類分類

名稱 encoder 創建 numeric 種類 deep ast 4.0 允許　　Keras是一個用於深度學習的Python庫，它包含高效的數值庫Theano和TensorFlow。　　本文的目的是學習如何從csv中加載數據並使其可供Keras使用，如何用神經網絡建立

Python機器學習與實戰筆記之樸素貝葉斯分類

1聯合概率分佈 p(x,y)=p(y)P(x|y) 或者p(A交B)=p(A)xp(B) p(A交B)不容易求,假設條件獨立拆分成兩個事件的乘積 2基本假設條件獨立性 3利用貝葉斯定理 p(y|x)=P(x,y)/p(x)=p(y)P(x|y)/sum(y-i)[p(

基於Python的機器學習之分類學習

所有的資料集都可以從sklearn.datasets中獲得在評估時，一般使用F1指標，即使用了調和平均數，除了具備平均功能，還會對那些召回率和精血率更加接近的模型給予更高的分數。分類學習線性分類器（Linear Classifiers）線性分類器通過累加計算每

Python機器學習及實踐——基礎篇7（分類整合模型）

常言道：“一個籬笆三個樁，一個好漢三個幫”。整合分類模型便是綜合考量多個分類器的預測結果，從而做出決策。只是這種“綜合考量”的方式大體上分為兩種：一種是利用相同的訓練資料同時搭建多個獨立的分類模型，然後通過投票的方式，以少數服從多數的原則作出最終的分類決策。比

Python機器學習庫sklearn裡利用感知機進行三分類（多分類）的原理

from IPython.display import Image %matplotlib inline # Added version check for recent scikit-learn 0.18 checks from distutils.vers

python機器學習庫sklearn——樸素貝葉斯分類器

在scikit-learn中，一共有3個樸素貝葉斯的分類演算法類。分別是GaussianNB，MultinomialNB和BernoulliNB。其中GaussianNB就是先驗為高斯分佈的樸素貝葉斯，MultinomialNB就是先驗為多項式分佈的樸素

Python機器學習（二） Logistic迴歸建模分類例項——信用卡欺詐監測（上）

Logistic

python機器學習--分類演算法

#感知器邏輯：一個二值分類問題，分別記為1(正類別)和-1（負類別）.定義激勵函式z=wx (w為權值，x為輸入值)，當Z大於閾值時為1類，否則為-1類 #用Python實現感知器學習演算法。步驟：1、將權重初始化為0或一個極小的隨機數 2、迭代所有訓練樣本，計算出輸出值Y,更新權重。 im

python機器學習庫sklearn——K最近鄰、K最近鄰分類、K最近鄰迴歸

這裡只講述sklearn中如何使用KNN演算法。無監督最近鄰 NearestNeighbors （最近鄰）實現了 unsupervised nearest neighbors learning（無監督的最近鄰學習）。它為三種不同的最近鄰演算法

三十八、100行python程式碼實現機器學習自動分類

現在朋友圈、公眾號、微博資訊應接不暇，以微信公眾號舉例，看技術極客是怎麼自動篩出自己想看的文章的，100行機器學習程式碼就能自動幫你歸好類，要想找出想看的和不想看的，你再也不用刷朋友圈了準備工作 1. 準備一張mysql資料庫表，至少包含這些列：id、title(文章標題)、content(文章內

python機器學習算法系列之初識神經網路分類

下面的例子是區分數字如下圖：在程式中通過下面語句就可以自動下載資料集mnist=input_data.read_data_sets('MNIST_data',one_hot=True) 但是有時候會出錯，那就需要大家手動下載，它包括四個壓縮檔案，下載統一後放在python工作

Python機器學習實戰kNN分類演算法

自學《機器學習實戰》一書，書中的程式碼親自敲一遍，努力搞懂每句程式碼的含義：今天將第一章kNN分類演算法的筆記總結一下。 # -*- coding: utf-8 -*- """ k-近鄰演算法小結: k-近鄰演算法是基於例項的學習，k-近鄰演算法必須儲存全部資料集，

Python機器學習庫sklearn裡利用LR模型進行三分類（多分類）的原理

首先，LR將線性模型利用sigmoid函式進一步做了非線性對映。將分類超平面兩側的正負樣本點，通過壓縮函式轉化成了以0.5為分解的兩類：類別0和類別1。這個轉化過程見下圖：上圖給出的是線性邊界與LR分佈函式（即sigmoid函式）的對映對應關係；同樣，對於非線

8.5 Python機器學習--微博聚類和音樂分類理論記錄

Python機器學習：隆重推出scikit-learn機器學習庫Scikit-Learn是基於python的機器學習模組Scikit-Learn中的機器學習模型非常豐富，包括SVM，決策樹， GBDT，KNN等等，可以根據問題的型別選擇合適的模型Scikit-Learn的安裝

吳裕雄 python 機器學習——集成學習AdaBoost算法分類模型

繪圖 tor git bubuko boost 算法 select enumerate tar import numpy as np import matplotlib.pyplot as plt from sklearn import datasets,ens

吳裕雄 python 機器學習——集成學習隨機森林RandomForestClassifier分類模型

pan spa data ica ima 數據 app ase lower import numpy as np import matplotlib.pyplot as plt from sklearn import datasets,ensemble fro

Python 機器學習-鳶尾花分類

相關推薦