1. 程式人生 > >Weka Knowledge Flow(知識流介面) 詳解

Weka Knowledge Flow(知識流介面) 詳解

在探索者介面詳解的系列中我們提到,探索者介面簡單易用但有一個缺點:它將樣本資料全部載入到記憶體中,所以樣本的大小受限於記憶體的大小。而本篇介紹的知識流介面正好彌補了這一缺陷。

知識流介面的主體是一個設計畫布。使用者從工具條中選擇 Weka 元件,並將其置於設計畫布上,連線成一個處理和分析資料的具有方向性的流程圖。比如使用者可以先使用 屬性選擇 元件找出樣本中重要的屬性,然後再使用分類器,基於重要的屬性進行挖掘。

知識流介面共有標籤8個:

DataSources:選擇資料來源

DataSinks:儲存結果,注意在linux下一定要儲存在當前使用者有權寫的目錄中

Filters:過濾器選擇

Classifiers:分類器選擇

Clusterers:聚類器選擇

Associations:關聯規則演算法選擇

Evaluation:評估器

Visualization:用於將結果視覺化的元件選擇

一般操作知識流介面的順序是:

選擇一個數據源元件,置於畫板上。

再到評估器標籤中找到 ClassAssigner ,這個評估器用於指明樣本中決定分類的屬性,將其置於畫板上。

然後右鍵資料來源元件來連線資料來源元件和ClassAssigner元件,連線方式有兩種:dataset 和 instance(只能選一種)。dataset指批量傳遞資料,而 instance 一個一個地傳遞例項,用於像貝葉斯網路這樣增量更新的分類器。

然後繼續在評估器標籤中找到 訓練集和測試集的分配方案 ,比如 CrossValidationFoldMaker元件(交叉驗證)。

接著就可以到分類器選擇標籤中找相應演算法的分類器元件。

最後在視覺化標籤中找到 可以顯示結果的元件(有文字式的,樹狀的,顯示ROC曲線的,矩陣式的)

確保連線好所有的元件,最後右鍵資料來源元件,選擇 Start Loading,開始挖掘。

所有的元件都可以通過右鍵選擇 Configure 來配置引數。

最後上兩張截圖:

這是一個對樣本屬性進行離散化過濾後再分類的方案:


這是部分元件的說明:


相關推薦

Weka Knowledge Flow(知識介面)

在探索者介面詳解的系列中我們提到,探索者介面簡單易用但有一個缺點:它將樣本資料全部載入到記憶體中,所以樣本的大小受限於記憶體的大小。而本篇介紹的知識流介面正好彌補了這一缺陷。 知識流介面的主體是一個設

java Io

修改 文件目錄 != exe [] 深入 clas one fileinput 關於java 流類的復習;習慣性的復習按照圖結構一層層往下深入去了解去復習,最後通過代碼來實現感覺印象會更深刻一些; 關於 I/O流:IO可以理解為JAVA用來傳遞數據的管道

Java 常用IO操作

字符集 -s fileinput 顯式 print OS 數值 重寫 目錄 1.基本概念 IO:Java對數據的操作是通過流的方式,IO流用來處理設備之間的數據傳輸,上傳文件和下載文件,Java用於操作流的對象都在IO包中。 2.IO流的分類 圖示:(主要IO流)

音頻基礎知識參數

技術分享 .com alt http 樣本 nbsp info 通道 bubuko 1.采樣率 2.通道 3.采樣格式(大小) 4.樣本存儲方式(大端 小端) 數據格式僅有在雙通道模式才才考慮,單通道是不考慮這個模式 音頻基礎知識參數詳解

知識儲備:Spring中AOP原理(基於註解版)2

接著上一篇部落格講,上一篇部落格地址:https://blog.csdn.net/qq_36625757/article/details/83652173 8.之前我們說過,測試方法在執行時new了一個AnnotationConfigApplicationContext傳入一個配置類,呼叫了re

FastDFS的配置、部署與API使用解讀(8)FastDFS多種檔案上傳介面

《Poechant的FastDFS的配置、部署與API使用教程》 FastDFS的配置、部署與API使用解讀——(1)入門使用教程 FastDFS的配置、部署與API使用解讀——(2)Java API:根據InputStream、檔名、檔案長度上傳檔案 FastDFS的配置、部署與API

呼叫支付寶第三方支付介面(沙箱環境)

首發地址:Java知音 注:這裡的支付是沙箱模擬支付 註冊螞蟻金服開放平臺 螞蟻金服開放平臺註冊地址 支付寶掃碼登陸 -> 註冊為自主研發者 2. 配置你的沙箱支付寶 支付寶提供一鍵生成工具便於開發者生成一對RSA2金鑰:https:

Type的子介面(原始碼解析)

以下是原始碼中對Type的註釋:Type是Java中所有型別的常見的超介面,在程式語言中這些包括原始型別,引數化的型別,陣列型別,型別變數和原始型別。 Class在一定程度上挽救了擦除的型別資訊,我們就可以通過這幾個介面來獲取被擦除的型別引數資訊,這幾個介面無非就是對型別引數的一個

JDK1.8 java.io.Serializable介面

java.io.Serializable介面是一個標誌性介面,在介面內部沒有定義任何屬性與方法。只是用於標識此介面的實現類可以被序列化與反序列化。但是它的奧祕並非像它表現的這樣簡單。現在從以下幾個問題入手來考慮。 希望物件的某些屬性不參與序列化應該怎麼處理? 物件序列化之後,如果類的屬性

微信傳送永久圖片素材介面----

本文采用倒敘模式. 我寫這個主要是因為微信開發文件的說明實在太坑了,為了更多.NET 開發人員能順利上傳微信圖片素材,分享一下: 先看看最後的呼叫成功的方法:  /// <summary>         ///

C++中抽象類和介面

1.抽象類 在面向物件程式設計中,抽象類是一種只能定義型別,不能生成物件的類,它是對一系列看上去不同,但是本質相同的具體概念的抽象。最典型的抽象類就是“圖形”,三角形、矩形、圓都是圖形,它們都有邊長、面積屬性,“圖形”類就是對這系列的抽象。 程式設計中,我們可以定義一個表

Java中的IO

在介紹IO流之前,需要首先給大家介紹一下File的使用,及一些常用的方法。 File類 :檔案和目錄路徑名的抽象表示形式。 通俗一點說,例項化File類的一個物件,其傳入的引數就是一個路徑名(可以是絕對路徑名,也可以是相對路徑名) 例:File  file=new   

Selenium-WebDriverApi介面

一:# 重新整理 (AppiumDriver) driver.refresh() # 前進 driver.forward() # 後退 driver.back() # 通過ID定位目標元素 driver.find_element_by_id('i1') # 通過classNa

微信小程式登入Java後臺介面(,附示例程式碼)

首先看一下官方文件 我們先對官方給的時序圖進行簡單的分析 1.當小程式呼叫wx.login()時,會獲得一個code(臨時登入憑證),然後我們需要用wx.request()將code傳送到自己的伺服器. 2.在伺服器的介面中,呼叫登入憑證校檢介面,將appid(

JDBC元資料操作-- DatabaseMetaData介面

package com.util;   import java.sql.CallableStatement;   import java.sql.Connection;   import java.sql.DatabaseMetaData;   import java.sql.DriverMana

bat 指令碼基礎知識、命令

在window下.bat為批處理檔案。我們今天來一起學習一下bat批處理的一些命令 不區分大小寫 使用::註釋。 例如::這是一條註釋 修飾符@ :修飾命令,經過@修飾的命令,不在輸出原始命

Java初級起步---介面

Java初級起步 介面 什麼是介面 抽象方法的集合,它是一個定義(龍骨),是一個規範,一般不去實現方法內容,介面的關鍵字是interface,它需要實現這個介面,需要去實現這個介面中的所有方法,一個類可以實現多個介面(java中的多繼承) 如何定義一個介

java字元緩衝區

1. 為什麼要緩衝區? 程式頻繁地操作一個資源(如檔案),則效能會很低,此時為了提升效能,就可以將一部分資料暫時讀入到記憶體的一塊區域中,以後直接從此區域中讀取資料即可,因為讀記憶體速度比較快,這樣提高效能。在IO中引入緩衝區,主要是提高流的讀寫效率。 2. 緩衝技術的原理? 總的來說,

Juniper SSG5(bgroupx介面及刪除bgroupx自定義)

從console口登陸檢視介面,標紅部分預設從eth0/2-6都屬於Trust介面 ssg5-serial-> get interface A - Active, I - Inactive, U -Up, D - Down, R - Ready Interfa

Java中 Cloneable 、Serializable 介面

Cloneable介面 clone:它允許在堆中克隆出一塊和原物件一樣的物件,並將這個物件的地址賦予新的引用。 Java 中 一個類要實現clone功能 必須實現 Cloneable介面,否則在呼叫 clone() 時會報 CloneNotSupported