Xgboost: 自帶介面與sklearn介面的簡單使用及對比

阿新 • • 發佈：2018-12-14

眾所周知，Xgboost有兩個介面，分別是自帶的介面和sklearn介面。在Xgboost的官方文件中，我們可以看到其詳細的使用方法。

接下來，我們通過程式碼的方式對這兩種介面進行對比。

第一步：資料集的準備

from sklearn.model_selection import train_test_split
from pandas import DataFrame
from sklearn import metrics
from sklearn.datasets  import  make_hastie_10_2
from xgboost.sklearn import XGBClassifier
import xgboost as xgb
import pandas as pd

#準備資料，y本來是[-1:1],xgboost自帶介面邀請標籤是[0:1],把-1的轉成1了。
X, y = make_hastie_10_2(random_state=0)
X = DataFrame(X)
y = DataFrame(y)
y.columns={"label"}
label={-1:0,1:1}
y.label=y.label.map(label)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)#劃分資料集

第二步：分別使用兩個介面進行訓練和預測。兩種介面的引數完全一樣。

#XGBoost自帶介面
params={
    'eta': 0.3,
    'max_depth':3,   
    'min_child_weight':1,
    'gamma':0.3, 
    'subsample':0.8,
    'colsample_bytree':0.8,
    'booster':'gbtree',
    'objective': 'binary:logistic',
    'nthread':12,
    'scale_pos_weight': 1,
    'lambda':1,  
    'seed':27,
    'silent':0 ,
    'eval_metric': 'auc'
}
d_train = xgb.DMatrix(X_train, label=y_train)
d_valid = xgb.DMatrix(X_test, label=y_test)
d_test = xgb.DMatrix(X_test)
watchlist = [(d_train, 'train'), (d_valid, 'valid')]

#sklearn介面
clf = XGBClassifier(
    n_estimators=30,#三十棵樹
    learning_rate =0.3,
    max_depth=3,
    min_child_weight=1,
    gamma=0.3,
    subsample=0.8,
    colsample_bytree=0.8,
    objective= 'binary:logistic',
    nthread=12,
    scale_pos_weight=1,
    reg_lambda=1,
    seed=27)

print("XGBoost_自帶介面進行訓練：")
model_bst = xgb.train(params, d_train, 30, watchlist, early_stopping_rounds=500, verbose_eval=10)
print("XGBoost_sklearn介面進行訓練：")
model_sklearn=clf.fit(X_train, y_train)

y_bst= model_bst.predict(d_test)
y_sklearn= clf.predict_proba(X_test)[:,1]

第三步：評估結果

print("XGBoost_自帶介面    AUC Score : %f" % metrics.roc_auc_score(y_test, y_bst))
print("XGBoost_sklearn介面 AUC Score : %f" % metrics.roc_auc_score(y_test, y_sklearn))

# 將概率值轉化為0和1
y_bst = pd.DataFrame(y_bst).apply(lambda row: 1 if row[0]>=0.5 else 0, axis=1)
y_sklearn = pd.DataFrame(y_sklearn).apply(lambda row: 1 if row[0]>=0.5 else 0, axis=1)
print("XGBoost_自帶介面    AUC Score : %f" % metrics.accuracy_score(y_test, y_bst))
print("XGBoost_sklearn介面 AUC Score : %f" % metrics.accuracy_score(y_test, y_sklearn))
'''
XGBoost_自帶介面    AUC Score : 0.970292
XGBoost_sklearn介面 AUC Score : 0.970292
XGBoost_自帶介面    AUC Score : 0.897917
XGBoost_sklearn介面 AUC Score : 0.897917
'''

我們可以看到，在兩種介面的引數完全一樣的情況下，無論是評估AUC還是準確率，自帶的介面和sklearn介面的結果完全一樣！這說明，在我們平常實踐中，使用哪個介面都是可以的。

Xgboost: 自帶介面與sklearn介面的簡單使用及對比

眾所周知，Xgboost有兩個介面，分別是自帶的介面和sklearn介面。在Xgboost的官方文件中，我們可以看到其詳細的使用方法。接下來，我們通過程式碼的方式對這兩種介面進行對比。第一步：資料集的準備 from sklearn.model_selection i

RDIFramework.NET ━ .NET快速資訊化系統開發框架 V3.2->Web版本工作流部分業務處理介面與檢視介面全新展示

　　RDIFramework.NET工作流程元件是以RDIFramework.NET框架為支撐，根據我們多年的專案經驗和專案實踐，結合國內各大工作流產品的特點研發的一套流程管理元件。該元件不僅考慮到從零搭建業務系統，也考慮到與現有業務系統的整合。從零搭建系統我們可以使用RDIFramework.

利用Java自帶的SimpleDateFormat類實現簡單的日期校驗功能原始碼

package com.wk import java.awt.EventQueue; import java.awt.Font; import java.awt.GridLayout; import java.awt.ev

iOS原生介面與RN介面互調及傳值

文章目錄 3. iOS原生與RN互調及傳值 3.1 RN跳轉原生介面 3.2 RN跳轉原生介面並傳值 3.3 RN跳轉原生介面並傳值後,原生介面再回調給RN介面相關資訊 3. 4. 原生頁面向RN頁面傳值

python 基礎之 socket介面與web介面

python 網路程式設計主要有socket模組、BaseHTTPServer模組。socket屬於更底層次，方便在日常運維工作中使用， http web介面更適合開放給外部人員使用，畢竟大多數語言都很方便支援http請求。首先看最基本socket客戶端與服務端例項: #!

Java中類的比較與排序方法(應用Comparable介面與Comparator介面)

引言在平時寫Java的程式的時候，如果要進行一些基本型別的變數的比較，可以很方便得呼叫’Math.max()’、Math.min()等方法，如果要對陣列或者列表進行排序，也可以用Arrays.sort()和Collections.sort()等已經封裝好的方法來進行。但是，如果是一個自

撩課-JavaWeb之Statement介面與預編譯語句及呼叫儲存過程

Statement介面介面 Statement介面作用用於進行Java程式和資料庫之間的資料傳輸具體類有3個實現 Statement 用於對資料庫進行通用訪問，使用的是靜態sql PreparedStatement PreparedSta

Java Callable介面與Future介面的兩種使用方式

Java Callable、Future的兩種使用方式Callable+Futurepublic class Test { public static void main(String[] args) { ExecutorService executor = Executors.newCachedThread

java中外部介面與內部介面的使用

晚上寫連連看排行榜的時候，檢視SharedPreferences原始碼時發現了一個驚天的祕密。為什麼一個介面中可以再定義介面呢？後來自己網上查找了下資料，然後自己操作了一遍。這個內部類真好用，推薦大家開發中可以用。具體來說，就是你只實現了外部介面，那麼就必須實現外部介面

RDIFramework.NET ━ .NET快速資訊化系統開發框架 V3.2->Web版本工作流部分業務處理介面與檢視介面全新展示

　　RDIFramework.NET工作流程元件是以RDIFramework.NET框架為支撐，根據我們多年的專案經驗和專案實踐，結合國內各大工作流產品的特點研發的一套流程管理元件。該元件不僅考慮到從零搭建業務系統，也考慮到與現有業務系統的整合。從零搭建系統我們可以使用RDIFramework.NET框架以基

Comparable介面與Camparator介面區別

package 使用Comparator介面; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; class Person{ private String name;

液晶屏MIPI介面與LVDS介面區別（總結）

液晶屏介面型別有LVDS介面、MIPI DSIDSI介面（下文只討論液晶屏LVDS介面，不討論其它應用的LVDS介面，因此說到LVDS介面時無特殊說明都是指液晶屏LVDS介面），它們的主要訊號成分都是5組差分對，其中1組時鐘CLK，4組DATA（MIPI DSI介面中稱之

ArrayList容器排序 comparator介面與comparable介面的使用

1、實體類實現comparable介面，重寫compareTo方法 package io; import java.text.DateFormat; import java.text.ParseException; import java.text.SimpleDate

windows下使用php自帶的mail函式實現簡單的郵件傳送例項（QQ親試成功）

問題：初學php，打算實現一下找回密碼功能。當然這涉及到不少的問題，我直接想到的是怎麼發郵件的問題，這便是今天要解決的問題了。查資料：為解決這個問題，到網上查了很多資料，也看到網上有很多相關的資料，可能是由於鄙人比較笨，試了很多前人的方法，也總還是出現這樣那樣的問題，

讀書筆記--C語言介面與實現--介面與實現

介面實現重點內容在本書中的第二章中，介紹了介面的封裝例子。 1. 介面定義 C語言中可將介面封裝好，讓後以.h檔案作文擴充套件，簡單例子： extern int Arith_max(int x, int y); extern int Ari

PHP標準規範之-composer 自帶autoload使用【最簡單、最底層的用法】

文章目錄一、手冊、參考檔案二、composer下載、安裝、初始化、下載composer自帶autoload 三、如何使用這個autoload 重點：注意：

ubuntu開機進入命令列介面與圖形介面之間的切換

本人比較喜歡的選擇開機進入介面方法：（1）sudo gedit /etc/default/grub （2）找到這一行文字：GRUB_CMDLINE_LINUX_DEFAULT="quie

繼承介面與實現介面的理解

在我學習的過程中發現對兩個相似的概念很難理解，就是實現介面和繼承介面，我在網上也查了查答案，發現不是我想要的回答。我就是想弄清楚一個類實現一個介面和繼承一個介面有什麼區別，因為我發現就沒有區別，繼承和實現了之後都得重寫所有的抽象方法。現在，

List介面與Set介面及其子類的詳細用法。Collection介面簡介。ArraList，LinkedList，Vector

（一）連結串列的特點：（1）這種節點關係的處理操作，核心需要一個Node類（儲存資料，設定引用）（2）在進行連結串列資料的查詢，刪除的時候需要equals（）方法的支援。在實際的開發中對於這些資料的使用都有一些共性的特點：儲存進去而後取。（二）Jav

CentOS命令列介面與圖形介面切換（圖文詳解）

　　不多說，直接上乾貨！　 Ctrl + Alt +F1，到圖形介面 Ctrl + Alt +F2，到命令列介面歡迎大家，加入我的微信公眾號：大資料躺過的坑人工智慧躺過的坑同時，大家可以關注我的個人部落格： ht

Xgboost: 自帶介面與sklearn介面的簡單使用及對比

相關推薦