基於SVM的數據分類預測——意大利葡萄酒種類識別

阿新 • • 發佈：2017-06-06

div num 自帶 ack xpl ict 意大利 -- src

update：把程序源代碼和數據集也附上http://download.csdn.net/detail/zjccoder/8832699

2015.6.24

-------------------------------------------------------------------------------------------------------------------------------------------------------------------------

wine數據來自於UCI數據庫。記錄的是意大利同一地區3中不同品種的葡萄酒13中化學成分含量，以期通過科學的方法，達到自己主動分類葡萄酒的目的。

本次分類的數據共同擁有178個樣本，每一個樣本有13個屬性，並提供每一個樣本的正確分類，用於檢驗SVM分類的準確定。

首先我們畫出數據的可視化圖：

% 加載測試數據wine,當中包括的數據為classnumber = 3,wine:178*13的矩陣,wine_labes:178*1的列向量
load chapter_WineClass.mat;

% 畫出測試數據的box可視化圖
figure;
boxplot(wine,‘orientation‘,‘horizontal‘,‘labels‘,categories);
title(‘wine數據的box可視化圖‘,‘FontSize‘,12);
xlabel(‘屬性值‘,‘FontSize‘,12);
grid on;

% 畫出測試數據的分維可視化圖
figure
subplot(3,5,1);
hold on
for run = 1:178
    plot(run,wine_labels(run),‘*‘);
end
xlabel(‘樣本‘,‘FontSize‘,10);
ylabel(‘類別標簽‘,‘FontSize‘,10);
title(‘class‘,‘FontSize‘,10);
for run = 2:14
    subplot(3,5,run);
    hold on;
    str = [‘attrib ‘,num2str(run-1)];
    for i = 1:178
        plot(i,wine(i,run-1),‘*‘);
    end
    xlabel(‘樣本‘,‘FontSize‘,10);
    ylabel(‘屬性值‘,‘FontSize‘,10);
    title(str,‘FontSize‘,10);
end

技術分享

（圖1）

技術分享

（圖2）

圖1是wine數據的box可視化圖。圖2是wine的箱式圖。從圖上我們非常難分出每一種葡萄酒是哪種類型。以下我們嘗試用SVM來分類。

數據的預處理

% 選定訓練集和測試集

% 將第一類的1-30,第二類的60-95,第三類的131-153做為訓練集
train_wine = [wine(1:30,:);wine(60:95,:);wine(131:153,:)];
% 對應的訓練集的標簽也要分離出來
train_wine_labels = [wine_labels(1:30);wine_labels(60:95);wine_labels(131:153)];
% 將第一類的31-59,第二類的96-130,第三類的154-178做為測試集
test_wine = [wine(31:59,:);wine(96:130,:);wine(154:178,:)];
% 對應的測試集的標簽也要分離出來
test_wine_labels = [wine_labels(31:59);wine_labels(96:130);wine_labels(154:178)];

<strong>%% 數據預處理</strong>
% 數據預處理,將訓練集和測試集歸一化到[0,1]區間

[mtrain,ntrain] = size(train_wine);
[mtest,ntest] = size(test_wine);

dataset = [train_wine;test_wine];
% mapminmax為MATLAB自帶的歸一化函數
[dataset_scale,ps] = mapminmax(dataset‘,0,1);
dataset_scale = dataset_scale‘;

train_wine = dataset_scale(1:mtrain,:);
test_wine = dataset_scale( (mtrain+1):(mtrain+mtest),: );

SVM網絡建立、訓練和預測

<span style="font-size:12px;">%% SVM網絡訓練
model = svmtrain(train_wine_labels, train_wine, ‘-c 2 -g 1‘);

%% SVM網絡預測
[predict_label, accuracy,dec_value1] = svmpredict(test_wine_labels, test_wine, model);</span>

結果分析

%% 結果分析

% 測試集的實際分類和預測分類圖
% 通過圖能夠看出僅僅有一個測試樣本是被錯分的
figure;
hold on;
plot(test_wine_labels,‘o‘);
plot(predict_label,‘r*‘);
xlabel(‘測試集樣本‘,‘FontSize‘,12);
ylabel(‘類別標簽‘,‘FontSize‘,12);
legend(‘實際測試集分類‘,‘預測測試集分類‘);
title(‘測試集的實際分類和預測分類圖‘,‘FontSize‘,12);
grid on;

技術分享

利用svm分類的準確率達到了98.8764%，在89個測試樣本中僅有一個被分類錯誤。可見SVM在數據分類方面的強大！

END

基於SVM的數據分類預測——意大利葡萄酒種類識別

div num 自帶 ack xpl ict 意大利 -- src update：把程序源代碼和數據集也附上http://download.csdn.net/detail/zjccoder/8832699 2015.6.24 ----------------------

圖數據庫與關系數據庫的實驗對比——意大利商會 InfoCamere 案例

一個問題 data 一次支持圖表相關 invest 限制摘要: InfoCamere是附屬於意大利商會的IT公司，主要設計和開發最新和創新的IT解決方案和服務，它通過一個公眾也可以訪問的網絡連接商會及其數據庫。借助InfoCamere，意大利和國外的企業，公共機

Neural Networks and Deep Learning（week3）Planar data classification with one hidden layer(基於單隱層的平面數據分類)

one hid 線性 deep with ica ural 神經網絡二分 Planar data classification with one hidden layer 你會學習到如何：用單隱層實現一個二分類神經網絡使用一個非線性激勵函數，如

Python基本數據分類方式

python 數據類型一、內存模型依據變量在內存中的組織分類 Python的類型，就象絕大多數其它語言一樣，能容納一個或多個值。一個能保存單個字面對象的類型我們稱它為原子或標量存儲，那些可容納多個對象的類型，我們稱之為容器存儲。（容器對象有時會在文檔中被稱為復合

關於客戶端設計之數據分類和存儲的思考

service his defaults def sqli href 思想 number fault 一、關於數據的分類在Android 客戶端設計過程中，我將數據分為未知，已知（本地），臨時，三者之間根據需求相互轉化。未知主要來自用戶輸入和服務端輸入。已知主

JS 循環遍歷JSON數據分類： JS技術 JS JQuery 2010-12-01 13:56 43646人閱讀評論(5) 收藏舉報 jsonc JSON數據如：{"options":"[{

ros json 12px details style position none -i ide JS 循環遍歷JSON數據分類： JS技術 JS JQuery2010-12-01 13:56 43646人閱讀評論(5) 收藏舉報 jsonc

數據庫終期大作業報告

編寫負責 pan sql 坦克大戰 cte 建議 frame 開發環境需求分析現代社會，心血管疾病成為了老年人群體中高發的慢性病，一個社區醫生往往需要負責多位患者的診斷工作，如果每位患者都要頻繁上門問診，會給醫生帶來過大的工作壓力，也很難顧及到全部患者。在信息技

基於json數據格式實現的簡單數據庫——jsonDB

codec fun msl 定義 target insert break html dbn 已在github上建立項目：https://github.com/ThinkerCodeChina/jsonDB/** +-------------------------

20170617xlVBA銷售數據分類匯總

tin object pda address class otto 防止 nec arr Public Sub SubtotalData() AppSettings ‘On Error GoTo ErrHandler Dim StartTime,

ip代理池-基於mongodb數據庫

url upd tostring mls from path ida request protocol 代碼用的python2.7，抓取xici免費代理，檢測放入數據庫中，為以後爬蟲做準備。下面直接上代碼 1 #-*-encoding=utf-8-*- 2 3 i

js的數據分類

fine 影響 function 基本值 eof 布爾值存在傳參數布爾 >原始數據類型 > >>1,簡單的數據段 >>2，存放的值(棧) >>引用數據類型 > >

基於XCK325T數據處理PXIE板FMC載板

PXIE板卡、FMC載板、數據處理板、PXIE301http://www.tsingetech.com/index.phpty=product&cl=12&info=2&third=20&detail=86#content是一款基於PXI Express總線

數據庫SQL優化大總結之百萬級數據庫優化方案

存儲過程語句數字運行 eat 小型明顯 where 不能 1.對查詢進行優化，要盡量避免全表掃描，首先應考慮在 where 及 order by 涉及的列上建立索引。 2.應盡量避免在 where 子句中對字段進行 null 值判斷，否則將導致引擎放棄使用索引而

數據庫SQL優化大總結之百萬級數據庫優化方案

打開一個否則 table html 處理必須 substr ext 作者：雲霏霏網上關於SQL優化的教程很多，但是比較雜亂。近日有空整理了一下，寫出來跟大家分享一下，其中有錯誤和不足的地方，還請大家糾正補充。這篇文章我花費了大量的時間查找資料、修改、

ScalarHandler對象獲取數據庫中的數據是註意轉換

span sel exceptio data utils scalar ndt tro todo /** * 獲取數據庫總數據條數 * @return * @throws SQLException */ public int FindTotalCount() t

轉:// LINUX下為ORACLE數據庫設置大頁--hugepage

參數設置 let target == 頁交換 rom 使用 sysctl onf 在Linux中配置hugepage可以提高oracle的性能，減少oracle sga的頁交換，類似於aix中的lagepage。為什麽使用大頁？ LINUX內存的默認塊大小是4K如果S

從一組集合中獲取，分多次取集合中的每段數據中的最大值，重組成一個新的集合。

clas pub 處理 oat private color andro sublist roi 一個項目中偶遇的簡單算法，個人覺得還不錯，雖不常用，也記錄在此吧。 1 package huolongluo.qihuo.util; 2 3 import androi

AdaBoost對實際數據分類的Julia實現

概念 post ble 20M 給定加權 ani eat 存儲寫在前面 AdaBoost是機器學習領域一個很重要很流行的算法，而Julia是一門新興的發展迅速的科學計算語言。本文將從一個實際例子出發，展示如何用Julia語言實現AdaBoost算法。什麽是AdaBoo

【Java知識點專項練習】之數據類型兩大類

char ger ava 練習類型包裝類 java 進行 cte Java的數據類型分為兩大類：基本類型和引用類型；基本類型只能保存一些常量數據，引用類型除了可以保存數據，還能提供操作這些數據的功能；為了操作基本類型的數據，java也對它們進行了封裝，得到八個類，

Confluence 6 基於 Confluence 數據中心的 SAML 單點登錄

Confluence安全申明標記語言（Security Assertion Markup Language (SAML)）是一個基於 XML 的數據格式，允許各個軟件平臺通過identity provider （IdP）交換授權信息。最常用的情況是允許用戶使用相同的的用戶登錄信息在不同的軟件平臺之間進行登錄。

基於SVM的數據分類預測——意大利葡萄酒種類識別

相關推薦