機器學習常用模板—（XGB）

阿新 • • 發佈：2019-01-29

XGB分為原生介面和Sklearn介面，下面是基於Sklearn的介面

基於Sklearn介面

分類


from sklearn.datasets import load_iris
import xgboost as xgb
from xgboost import plot_importance
from matplotlib import pyplot as plt
from sklearn.model_selection import train_test_split

# read in the iris data
iris = load_iris()

X = iris.data
y = iris.target

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)

# 訓練模型
model = xgb.XGBClassifier(max_depth=5, learning_rate=0.1, n_estimators=160, silent=True, objective='multi:softmax')
model.fit(X_train, y_train)

# 對測試集進行預測
ans = model.predict(X_test)

# 計算準確率
cnt1 = 0
cnt2 = 0
for i in range(len(y_test)):
    if ans[i] == y_test[i]:
        cnt1 += 1
    else:
        cnt2 += 1

print("Accuracy: %.2f %% " % (100 * cnt1 / (cnt1 + cnt2)))

# 顯示重要特徵
plot_importance(model)
plt.show()

迴歸


import xgboost as xgb
from xgboost import plot_importance
from matplotlib import pyplot as plt
from sklearn.model_selection import train_test_split

# 讀取檔案原始資料
data = []
labels = []
labels2 = []
with open("lppz5.csv", encoding='UTF-8') as fileObject:
    for line in fileObject:
        line_split = line.split(',')
        data.append(line_split[10:])
        labels.append(line_split[8])

X = []
for row in data:
    row = [float(x) for x in row]
    X.append(row)

y = [float(x) for x in labels]

# XGBoost訓練過程
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)

model = xgb.XGBRegressor(max_depth=5, learning_rate=0.1, n_estimators=160, silent=True, objective='reg:gamma')
model.fit(X_train, y_train)

# 對測試集進行預測
ans = model.predict(X_test)

# 顯示重要特徵
plot_importance(model)
plt.show()

注：轉自與知乎作者：章華燕

機器學習常用模板—（XGB）

XGB分為原生介面和Sklearn介面，下面是基於Sklearn的介面基於Sklearn介面分類 from sklearn.datasets import load_iris import xgboos

機器學習常用演算法（LDA,CNN,LR）原理簡述

1.LDA LDA是一種三層貝葉斯模型，三層分別為：文件層、主題層和詞層。該模型基於如下假設：1）整個文件集合中存在k個互相獨立的主題；2）每一個主題是詞上的多項分佈；3）每一個文件由k個主題隨機混合組成；4）每一個文件是k個主題上的多項分佈；5）每一個文件的主題概率分佈的

中國mooc北京理工大學機器學習第一周（一）

lib odi pen 運行 numpy 聚類準則 ++ mooc 從今天開始跟著北理工的老師走一遍sklearn，在這裏做筆記。一、聚類 1、K-Means方法先貼代碼，所有數據的下載地址：http://pan.baidu.com/s/1hrO5NW4

中國mooc北京理工大學機器學習第二周（一）：分類

kmeans 方法輸入 nump arr mod 理工大學 each orm 一、K近鄰方法（KNeighborsClassifier）使用方法同kmeans方法，先構造分類器，再進行擬合。區別是Kmeans聚類是無監督學習，KNN是監督學習，因此需要劃分出訓練集和測試

Andrew Ng機器學習課程筆記（四）之神經網絡

機器學習入門點滴（一）（待補充完整）

arr intro 統計 int ica nts 機器學習算法 .com 場景 Step1-知識準備： 1. 數學：線性代數，概率論和統計，高數 2. 程序語言：Matlab R 或 Python（只用於學習入門，不是實現的最佳語言） 3. 推薦書籍：選擇一到兩本公式較少、

機器學習實戰一（kNN）

.com block 個數 indices 操作來看空間計算機 python3 機器學習實戰一（kNN）跟著老師做一個項目，關於行車記錄儀識別前方車輛，並判斷車距，不太好做。本來是用OpenCV，做著做著，突然發現需要補習一下機器學習的內容。《機器學習實戰（mach

《Python 機器學習》筆記（一）

環境成功設定相關 reward 能力學習一定的 env 賦予計算機學習數據的能力涵蓋：1.機器學習的一般概念2.機器學習方法的三種類型和基本術語3.成功構建機器學習系統所需的模塊機器學習的三種不同方法1.監督學習2.無監督學習3.強化學習通過監督學習對未來事件進行

《Python 機器學習》筆記（四）

構造 split logs pos 不支持虛擬訓練樣本字符 cal 數據預處理——構建好的訓練數據集機器學習算法最終學習結果的優劣取決於兩個主要因素：數據的質量和數據中蘊含的有用信息的數量。缺失數據的處理在實際應用過程中，樣本由於各種原因缺少一個或多個值得情況並不少見

《Python機器學習》筆記（六）

後者 mean 子空間 otl 計算模型 lencod pytho 兩個 show 模型評估與參數調優實戰基於流水線的工作流一個方便使用的工具：scikit-learn中的Pipline類。它使得我們可以擬合出包含任意多個處理步驟的模型，並將模型用於新數據的預測。加載威斯康

我的機器學習之旅（四）：回歸與工程應用

多個算法 ati function RR numpy pen 圖片 bsp 內容:線性回歸；邏輯回歸，應用場景。一、線性回歸有監督學習，根據學習樣本{x->y},學習一個映射f：X->Y(線性相關),輸出預測結果y_i。最簡單的例子：y=ax+b 重要組成

我的機器學習之旅（六）：決策樹

family 分配根據 drop chrom labels arch ntp -o 決策樹概念：分類決策樹模型是一種描述對實例進行分類的樹形結構。決策樹由結點和有向邊組成。結點有兩種類型：內部節點和葉節點，內部節點表示一個特征或屬性，葉節點表示一個類。分類的時候，從根

機器學習實戰教程（一）：線性回歸基礎篇（上）

學習 reg style spa 目標 pub auto 機器輸入一什麽是回歸？　　回歸的目的是預測數值型的目標值，最直接的辦法是依據輸入，寫入一個目標值的計算公式。　　假如你想預測小姐姐男友汽車的功率，可能會這麽計算：　　　　　　　　　　　　　　Ho

機器學習升級版（VII）——第1課機器學習與數學分析

矩陣分解變化回歸分析兩個例如處理 fff mage 我們參考：鄒博《機器學習升級版》 1. 機器學習概論 1. 什麽是機器學習定義：對於某給定的任務T，在合理的性能度量方案P的前提下，某計算機程序可以自主學習任務T的經驗E；隨著提供合適、

機器學習讀書筆記（四）樸素貝葉斯基礎篇之網站賬號分類

pan 技巧 nbsp 增強就是使用分類問題預測結果一、條件概率在學習計算p1和p2概率之前，我們需要了解什麽是條件概率，就是指在事件B發生的情況下，事件A發生的概率，用P(A|B)來表示。根據文氏圖，可以很清楚地看到在事件B發生的情況下，事件A發

機器學習讀書筆記（三）決策樹基礎篇之從相親說起

方法事務家裏分類筆記判斷都是 rom tro 一、決策樹決策樹是什麽？決策樹(decision tree)是一種基本的分類與回歸方法。舉個通俗易懂的例子，如下圖所示的流程圖就是一個決策樹，長方形代表判斷模塊(decision block)，橢圓形成代

機器學習簡要筆記（二）——常見學習任務及算法

bubuko 屬性。 src 沒有數據數量類別降維筆記 1、分類從標識數據中學習分類特征，利用學習的分類特征，識別某個對象屬於哪個類別。 2、回歸預測與對象相關聯的連續性屬性。 3、聚類從沒有標記的數據中發現類似特征的分組，即將對象自動分組。

機器學習筆記之（7）——聚類演算法

對於監督學習，訓練資料都是事先已知預測結果的，即訓練資料中已提供了資料的類標。無監督學習則是在事先不知道正確結果（即無類標資訊或預期輸出值）的情況下，發現數據本身所蘊含的結構等資訊。無監督學習通過對無標記訓練樣本的學習來尋找這些資料的內在性質。聚類的目標是發現數據中自然形成的分組，使得每

吳恩達老師機器學習筆記SVM（二）

今天的部分是利用高斯核函式對分佈稍微複雜一點的資料進行分類這裡的高斯核函式是構建新的特徵，該特徵是關於到其餘所有樣點的歐式距離。下面放出程式碼： load('ex6data2.mat'); [m n]=size(X); f=zeros(m,m); a=0.005 for i=

吳恩達老師機器學習筆記SVM（一）

時隔好久沒有再拾起機器學習了，今日抽空接著學今天是從最簡單的二維資料分類開始學習SVM~ （上圖為原始資料） SVM的代價函式這裡套用以前logistic迴歸的模板改一下下。。 load('ex6data1.mat'); theta=rand(3,1); [

機器學習常用模板—（XGB）

XGB分為原生介面和Sklearn介面，下面是基於Sklearn的介面

基於Sklearn介面

分類

相關推薦