基於SVM的分類器Python實現

阿新 • • 發佈：2018-08-12

比較 sort load 自帶 rain 分析 python實現 see 基於

本文代碼來之《數據分析與挖掘實戰》，在此基礎上補充完善了一下~

代碼是基於SVM的分類器Python實現，原文章節題目和code關系不大，或者說給出已處理好數據的方法缺失、源是圖像數據更是不見蹤影，一句話就是練習分類器（▼?▼メ）

源代碼直接給好了K=30，就試了試怎麽選的，挑選規則設定比較單一，有好主意請不吝賜教喲

 1 # -*- coding: utf-8 -*-
 2 """
 3 Created on Sun Aug 12 12:19:34 2018
 4 
 5 @author: Luove
 6 """
 7 from sklearn import svm
 8 from sklearn import 
 metrics
 9 import pandas as pd 
10 import numpy as np
11 from numpy.random import shuffle
12 #from random import seed
13 #import pickle #保存模型和加載模型
14 import os
15 
16 
17 os.getcwd()
18 os.chdir(‘D:/Analyze/Python Matlab/Python/BookCodes/Python數據分析與挖掘實戰/圖書配套數據、代碼/chapter9/demo/code‘)
19 inputfile = ‘../data/moment.csv 
‘
20 data=pd.read_csv(inputfile)
21 
22 data.head()
23 data=data.as_matrix()
24 #seed(10)
25 shuffle(data) #隨機重排，按列，同列重排，因是隨機的每次運算會導致結果有差異，可在之前設置seed
26 n=0.8
27 train=data[:int(n*len(data)),:]
28 test=data[int(n*len(data)):,:]
29 
30 #建模數據 整理
31 #k=30 
32 m=100
33 record=pd.DataFrame(columns=[‘acurrary_train 
‘,‘acurrary_test‘]) 
34 for k in range(1,m+1):
35     # k特征擴大倍數，特征值在0-1之間，彼此區分度太小，擴大以提高區分度和準確率
36     x_train=train[:,2:]*k
37     y_train=train[:,0].astype(int)
38     x_test=test[:,2:]*k
39     y_test=test[:,0].astype(int)
40     
41     model=svm.SVC()
42     model.fit(x_train,y_train)
43     #pickle.dump(model,open(‘../tmp/svm1.model‘,‘wb‘))#保存模型
44     #model=pickle.load(open(‘../tmp/svm1.model‘,‘rb‘))#加載模型
45     #模型評價 混淆矩陣
46     cm_train=metrics.confusion_matrix(y_train,model.predict(x_train))
47     cm_test=metrics.confusion_matrix(y_test,model.predict(x_test))
48     
49     pd.DataFrame(cm_train,index=range(1,6),columns=range(1,6))
50     accurary_train=np.trace(cm_train)/cm_train.sum()      #準確率計算
51 #    accurary_train=model.score(x_train,y_train)                          #使用model自帶的方法求準確率
52     pd.DataFrame(cm_test,index=range(1,6),columns=range(1,6))
53     accurary_test=np.trace(cm_test)/cm_test.sum()
54     record=record.append(pd.DataFrame([accurary_train,accurary_test],index=[‘accurary_train‘,‘accurary_test‘]).T)
55 
56 record.index=range(1,m+1)
57 find_k=record.sort_values(by=[‘accurary_train‘,‘accurary_test‘],ascending=False) # 生成一個copy 不改變原變量
58 find_k[(find_k[‘accurary_train‘]>0.95) & (find_k[‘accurary_test‘]>0.95) & (find_k[‘accurary_test‘]>=find_k[‘accurary_train‘])]
59 #len(find_k[(find_k[‘accurary_train‘]>0.95) & (find_k[‘accurary_test‘]>0.95)])
60 ‘‘‘ k=33
61     accurary_train  accurary_test
62 33        0.950617        0.95122
63 ‘‘‘
64 ‘‘‘ 計算一下整體 
65  accurary_data
66  0.95073891625615758
67 ‘‘‘
68 k=33
69 x_train=train[:,2:]*k
70 y_train=train[:,0].astype(int)
71 model=svm.SVC()
72 model.fit(x_train,y_train)
73 model.score(x_train,y_train)
74 model.score(datax_train,datay_train)
75 datax_train=data[:,2:]*k
76 datay_train=data[:,0].astype(int)
77 cm_data=metrics.confusion_matrix(datay_train,model.predict(datax_train))
78 pd.DataFrame(cm_data,index=range(1,6),columns=range(1,6))
79 accurary_data=np.trace(cm_data)/cm_data.sum()
80 accurary_data

REF：

《數據分析與挖掘實戰》

源代碼及數據需要可自取：https://github.com/Luove/Data

基於SVM的分類器Python實現

比較 sort load 自帶 rain 分析 python實現 see 基於本文代碼來之《數據分析與挖掘實戰》，在此基礎上補充完善了一下~ 代碼是基於SVM的分類器Python實現，原文章節題目和code關系不大，或者說給出已處理好數據的方法缺失、源是圖像數據更是不見蹤

基於樸素貝葉斯的中文文字分類器(python實現，非呼叫)

本文將用樸素貝葉斯原理做一箇中文文字分類器。樸素貝葉斯完全可以勝任多分類任務。為了方便，這裡就先做個2分類的。理論部分：https://blog.csdn.net/montecarlostyle/article/details/79870860 我們事先準備兩

SVM分類器的實現（包括交叉驗證選擇引數，Dlib，視覺化）

慣例先放結果圖，左側為訓練樣本，右側為訓練完後的分類演示圖 Dlib的支援向量機用起來比Opencv的爽多了，支援交叉驗證，降低支援向量的個數以及兩種方式判別類別（正負以及可能性兩種）然後就是簡單粗暴的程式碼了： //需要配置Opencv以及Dlib的環境

貝葉斯分類器(Python實現+詳細完整原始碼和原理)

在概率和統計學領域，貝葉斯理論基於對某一事件證據的認識來預測該事件的發生概率，由結果推測原因的概率大小首先，理解這個公式的前提是理解條件概率，因此先複習條件概率。 P(A|B)=P(AB)/P(B) 貝葉斯公式：在機器學習領域，貝葉斯分類器是基於貝葉斯

用Python實現一個SVM分類器策略

支援向量機(SVM)是什麼意思？正好最近自己學習機器學習，看到reddit上 Please explain Support Vector Machines (SVM) like I am a 5 year old 的帖子，一個字贊！於是整理一下和大家分享。(如有錯歡迎指教！) 什麼

文字分類的python實現-基於SVM演算法

描述訓練集為評論文字，標籤為 pos,neu,neg三種分類，train.csv的第一列為文字content，第二列為label。可以單獨使用SVC訓練然後預測，也可以使用管道pipeline把訓練和預測放在一塊。 SVC的懲罰引數C：預設值是1.0。C越

【目標檢測】目標檢測原理與實現(五)--基於Cascade分類器的目標檢測

基於Cascade分類器的目標檢測從今天開始進入基於機器學習的目標檢測，前幾節雖然也接觸了一些機器學習的方法，但它主要是做輔助工作，機器學習的方法和非機器學習的方法結合在一起使用，說到這想起來前幾天看到一位博士師兄發的笑話，說的是百度實驗室：

OpenCV機器學習：SVM分類器實現MNIST手寫數字識別

0. 開發環境最近機器學習隨著AI人工智慧的興起越來越火，博主想找一些ML的庫來練手。突然想起之前在看Opencv的doc時發現有ML的component，於是心血來潮就開始寫程式碼試試。話不多說，直接進正題。以下我的開發環境配置： -Windows7

基於樸素貝葉斯的關於網際網路金融新聞分類（python實現）

中國網際網路金融發展迅速，2014年是中國網際網路金融起步的一年，但在短短的一年時間內，網際網路金融創業者們融資額度一再創高，雨後春筍般湧現出各類網際網路金融產品讓使用者眼花繚亂，隨著創業門檻的降低，在即將到來的2015年，網際網路金融必將在中國掀起熱潮。

Python構建SVM分類器（線性）

1.SVM建立線性分類器SVM用來構建分類器和迴歸器的監督學習模型，SVM通過對數學方程組的求解，可以找出兩組資料之間的最佳分割邊界。2.準備工作我們首先對資料進行視覺化，使用的檔案來自學習書籍配套管網。首先增加以下程式碼：import numpy as np import

[tensorflow應用之路]10行程式碼實現一個完整的SVM分類器

SVM是一種常用的機器學習分類器模型，其原理為最大化類間隔（被稱為支援向量），來達到分類的目的。它是一種有監督的模型。 SVM原理簡述 SVM通過預測值y′=wx+by′=wx+b與真實值yy之間的差值實現最大間隔分類。即 wx+b⩾1,y=1wx+b

基於影象識別的分類器的實現

最近做了一些影象處理的工作，故想著有時間時候整理一下，隨著人工智慧的發展，智慧化的影象識別也越來越受到重視。以肝病的影象分類器為例，通過對每一位肝病患者的CT影象的特徵部位提取，解算其相關的紋理特徵，再利用機器學習的相關演算法在紋理特徵的基礎上生成分類器，從而對

《Python神經網路程式設計》1.4節蟲子分類器的實現

最近在看這本書，覺得裡面蟲子分類器也值得試試實現，因為這個方法已經包含了神經網路的核心思想。以下是實現的過程。按照《Python神經網路程式設計》(非同步圖書出版)第一章蟲子分類器訓練的過程，模仿書中第二章的3層神經網路的實現過程，來構建一個可執行的蟲子分類器。首

【機器學習算法-python實現】掃黃神器-樸素貝葉斯分類器的實現

『科學計算』從Logistic回歸到SVM分類器

zoom ram edi 情況下投影導出 bmp 幾何 sig 轉自：http://blog.csdn.net/v_july_v/article/details/7624837 前言動筆寫這個支持向量機(support vector machine)是費了不少

最簡單的神經網絡-感知器-python實現

nbsp ges mat lob date def global pytho .com import numpy as np import matplotlib.pyplot as plt X=np.array([[1,3,3], [1,4,3],

利用Hog特徵和SVM分類器進行行人檢測

https://blog.csdn.net/qianqing13579/article/details/46509037 梯度直方圖特徵(HOG) 是一種對影象區域性重疊區域的密集型描述符, 它通過計算區域性區域的梯度方向直方圖來構成特徵。Hog特徵結合SVM分類器已經被廣

利用 sklearn SVM 分類器對 IRIS 資料集分類

利用 sklearn SVM 分類器對 IRIS 資料集分類支援向量機（SVM）是一種最大化分類間隔的線性分類器（如果不考慮核函式）。通過使用核函式可以用於非線性分類。SVM 是一種判別模型，既適用於分類也適用於迴歸問題，標準的 SVM 是二分類器，可以採用 “one vs one”

【深度學習】基於im2col的展開Python實現卷積層和池化層

一、回顧上一篇我們介紹了，卷積神經網的卷積計算和池化計算，計算過程中視窗一直在移動，那麼我們如何準確的取到視窗內的元素，並進行正確的計算呢？另外，以上我們只考慮的單個輸入資料，如果是批量資料呢？首先，我們先來看看批量資料，是如何計算的二、批處理在神經網路的

支援向量機（SVM）和python實現（三）

6. python實現根據前面的一步步推導獲得的結果，我們就可以使用python來實現SVM了這裡我們使用iris資料集進行驗證，由於該資料集有4維，不容易在二維平面上表示，我們先使用LDA對其進行降維，又因為該資料集有3類樣本，我們編寫的SVM是二分類的，所以我們將

基於SVM的分類器Python實現

相關推薦