Java 機器學習庫Smile實戰（一）SVM

阿新 • • 發佈：2022-05-03

本文不會介紹SVM的基本原理，如果想了解SVM基本原理，請參閱相關書籍。

要使用Java機器學習庫Smile，需首先在專案的Maven配置檔案pom.xml中新增如下的maven依賴項：

<dependency>
    <groupId>com.github.haifengl</groupId>
    <artifactId>smile-core</artifactId>
    <version>1.4.0</version>
</dependency>

Smile中的SVM是一個泛型類，他可以支援二分類和多分類兩種使用方法，而且這兩種使用方法差異較大，所以分開介紹。

1. 二分類

Smile 庫的SVM類是一個泛型型別，預設情況下進行二分類，選擇引數為核函式型別和懲罰項引數。

import smile.classification.SVM;
import smile.math.kernel.GaussianKernel;

public class Demo {
    public static void main(String[]args){

        double gamma = 1.0;
        double C = 1.0;

        //通過某種方式獲取訓練資料及其類標
        double[][] data = ...
        int[] label = ...

        SVM<double[]> svm = new SVM<double[]>(
           new GaussianKernel(gamma), C);
        
        svm.learn(data, label); //訓練模型
        svm.finish();

        //獲取測試資料
        double[][] testData = ...
        int[] result = new int[testData.length];
        for(int i=0; i < testData.length; i++){
            result[i] = svm.predict(testData[i]);
        }
    }
}

2. 多分類

接下來是我利用SVM對iris資料集進行分類的程式。首先我們將iris資料儲存iris.txt檔案，如下結構：

5.1 3.5 1.4 0.2 0

4.9 3 1.4 0.2 0

...

每一行代表一個測試資料項，前4列是屬性向量，最後一列是類標（在Smile中類標不能為負數，並且只能是從0開始的正整數，所以上述類標為：0、1、2）。檢測的完整的原始碼如下：

import smile.classification.SVM;
import smile.math.kernel.GaussianKernel;

import java.io.BufferedReader;
import java.io.File;
import java.io.FileReader;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.List;

/**
 * Created by zhanghuayan on 2017/1/16.
 */
public class ClassificationTest {

    public static void main(String[] args) throws Exception {

        List<List<Double>> datas = 
            new ArrayList<List<Double>>();
        List<Double> data = new ArrayList<Double>();
        List<Integer> labels = new ArrayList<Integer>();

        String line;
        List<String> lines;
        File file = new File("iris.txt");
        BufferedReader reader = 
        new BufferedReader(new FileReader(file));
        
        while ((line = reader.readLine()) != null) {
            lines = Arrays.asList(line.trim().split("t"));
            for (int i = 0; i < lines.size() - 1; i++) {
                data.add(Double.parseDouble(lines.get(i)));
            }
            labels.add(Integer.parseInt(
                  lines.get(lines.size() - 1)));

            datas.add(data);
            data = new ArrayList<Double>();

        }

        //轉換label
        int[] label = new int[labels.size()];
        for (int i = 0; i < label.length; i++) {
            label[i] = labels.get(i);
        }

        //轉換屬性
        int rows = datas.size();
        int cols = datas.get(0).size();
        double[][] srcData = new double[rows][cols];
        for (int i = 0; i < rows; i++) {
            for (int j = 0; j < cols; j++) {
                srcData[i][j] = datas.get(i).get(j);
            }
        }

        SVM<double[]> svm = new SVM<double[]>(
           new GaussianKernel(1.0), 1.0, 3, 
           SVM.Multiclass.ONE_VS_ALL);

        svm.learn(srcData, label);
        svm.finish();

        double right = 0;
        for (int i = 0; i < srcData.length; i++) {
            int tag = svm.predict(srcData[i]);
            if (tag == label[i]) {
                right += 1;
            }
        }
        right = right / srcData.length;

        System.out.println(
        "Accrurate: " + right * 100 + "%");
    }
}

Java 機器學習庫Smile實戰（一）SVM

本文不會介紹SVM的基本原理，如果想了解SVM基本原理，請參閱相關書籍。要使用Java機器學習庫Smile，需首先在專案的Maven配置檔案pom.xml中新增如下的maven依賴項：

Java 機器學習庫Smile實戰（二）AdaBoost

1. AdaBoost演算法簡介 Boost 算法系列的起源來自於PAC Learnability(PAC 可學習性)。這套理論主要研究的是什麼時候一個問題是可被學習的，當然也會探討針對可學習的問題的具體的學習演算法。這套理論是由Valiant提

機器學習Sklearn系列：（一）基礎線性模型

本文介紹了一些基礎的線性模型。線性迴歸線性迴歸是最簡單的線性模型，公式如下：

Java學習筆記-Day46 JavaScript（一）

技術標籤：筆記js Java學習筆記-Day46 JavaScript 一、JavaScript的簡介1、ECMAScript與JavaScript 的關係2、JavaScript的基本特點3、JavaScript的使用場景

Kotlin版本的WanAndroid專案實戰（一）：Kotlin基礎語法（與Java不同的地方）

技術標籤：Android程式語言javakotlin Kotlin在今年5月份獲得了Android官方的支援，被指定為Android開發一級語言，一個月之內進入了程式語言排行榜的前50(。而Android Studio也有外掛支援Kotlin，Kotlin可以和J

深度學習loss值變為0_TF2.0深度學習實戰（一）：分類問題之手寫數字識別

技術標籤：深度學習loss值變為0 點選上面“藍字”關注我們本專輯持續更新，歡迎關注。本著學習的心，希望和大家相互交流，一起進步！

Java學習——類與物件（一）

　1.類　類：是具有相同行為和特徵物體的一個抽象的集合。　類的建立：　1.類的屬性 ——通過宣告變數來定義即類的特徵。

Spring Boot實戰（一）：只需兩步！Eclipse+Maven快速構建第一個Spring Boot專案

隨著使用Spring進行開發的個人和企業越來越多，Spring從一個單一簡潔的框架變成了一個大而全的開源軟體，最直觀的變化就是Spring需要引入的配置也越來越多。配置繁瑣，容易出錯，讓人無比頭疼，簡化Spring配置簡直可

【機器學習】數值分析（1）—— 任意方程求根

任意方程求根簡介方程和函式是代數數學中最為重要的內容之一，從初中直到大學，我們都在研究著方程與函式，甚至我們將圖形代數化，從而發展出了代數幾何、解析幾何的內容。而在方程與函式中，我們研究其性質最多的

從0開始的機器學習——knn演算法篇（4）

本次實驗採用另一個數據集——手寫字母資料集首先引入必要的庫： import numpy as npimport matplotlibimport matplotlib.pyplot as pltfrom sklearn import datasets

虛擬機器位元組碼執行引擎（一）

執行時棧幀結構 Java虛擬機器以方法作為最基本的執行單元，“棧幀”（Stack Frame）則是用於支援虛擬機器進行方法呼叫和方法執行背後的資料結構，它也是虛擬機器執行時資料區中的虛擬機器棧（Virtual Mach

【學習筆記】Pytorch深度學習——Tensorboard的使用（一）

本節筆記內容具體是學習tensorboard中的兩個方法分別是scalar和histogram，一共分為3個部分：（1）首先學習SummaryWriter類；（2）其次，學習兩個基本方法記錄標量add_scalar和直方圖視覺化add_histogram；（3）最後

Java基礎學習之面向物件（4）

目錄1.面向物件概述1.1.類與物件的關係1.2.類的具體描述2.面向物件的三大特性2.1.繼承2.2.多型2.3.封裝

Java基礎學習之異常處理（6）

@目錄1.異常是什麼1.1.Error1.2.Exception2.異常處理機制2.1.捕獲異常2.2.丟擲異常3.自定義異常3.1.自定義檢查性異常3.2.自定義執行時異常

Jmeter 全程實戰（一）簡介

一、Jmeter 介紹 Apache JMeter 是100%純 JAVA 桌面應用程式，被設計為用於測試客戶端/服務端結構的軟體(例如 web 應用程式)。它可以用來測試靜態和動態資源的效能，例如：靜態檔案，Java Servlet,CGI Scripts,Java

Jmeter 全程實戰（一）簡介與安裝

go 學習筆記基礎篇（一）

golang 變數宣告 var 宣告單個變數 var 變數名稱型別變數名稱命名： a. 字母、數字、下劃線組成，首字母不能為數字

機器學習筆記—模式分類（四）引數判別估計法3（貝葉斯引數估計）

前序文章：機器學習筆記—模式分類（一）緒論&貝葉斯決策論機器學習筆記—模式分類（二）引數判別估計法（最大似然估計和貝葉斯引數估計）1

機器學習中的數學（六）：線性判別分析（LDA）, 主成分分析(PCA)

前言如果學習分類演算法，最好從線性的入手，線性分類器最簡單的就是LDA，它可以看做是簡化版的SVM，如果想理解SVM這種分類器，那理解LDA就是很有必要的了。談到LDA，就不得不談談PCA，PCA是一個和LDA非

Flink實戰（一）：監控（一）Metrics監控原理與實戰

本文主要講解 Metrics、如何使用 Metrics 分析問題並解決問題，並對 Metrics 監控實戰進行解釋說明。

Java 機器學習庫Smile實戰（一）SVM

Smile中的SVM是一個泛型類，他可以支援二分類和多分類兩種使用方法，而且這兩種使用方法差異較大，所以分開介紹。

1. 二分類

2. 多分類

相關推薦