整合學習：bagging、 boosting、stacking

阿新 • • 發佈：2020-10-23

一、什麼是整合學習

整合學習通過構建並結合多個學習器來完成學習任務。要獲得好的整合，學習器之間要具有差異性。

一. 整合學習的三大類：

個體學習器間不存在強依賴關係、可同時生成的，用於減少方差的 bagging，如 Random Forest
個體學習器間存在強依賴關係、必須序列生成的，用於減少偏差的 boosting，如 Adaboosting
用於提升預測結果的stacking，投票機制

1. Bagging – 降低方差

Bagging使用裝袋取樣來獲取資料子集訓練基礎學習器。最常用的整合演算法原模型是隨機森林。
演算法過程如下：

從原始樣本集中抽取訓練集。每輪從原始樣本集中有放回的抽樣（可能抽到重複的樣本），抽取n個訓練樣本（在訓練集中，有些樣本可能被多次抽取到，而有些樣本可能一次都沒有被抽中）.共進行k輪抽取，得到k個訓練集.（k個訓練集相互獨立

）
每次使用一個訓練集得到一個模型，k個訓練集共得到k個模型，所有弱分類器的權重相等
對分類任務使用投票的方式整合，而回歸任務通過平均的方式整合。

在隨機森林中，每個樹模型都是裝袋取樣訓練的。另外，特徵也是隨機選擇的，最後對於訓練好的樹也是隨機選擇的。這種處理的結果是隨機森林的偏差增加的很少，而由於弱相關樹模型的平均，方差也得以降低，最終得到一個方差小，偏差也小的模型。

在這裡插入圖片描述

2. boosting – 降低偏差

Boosting指的是通過演算法集合將弱學習器轉換為強學習器。主要原則是訓練一系列的弱學習器，訓練的方式是利用加權的資料。對於錯分資料給予較大的權重。每一輪的訓練集不變
加法模型將弱分類器進行線性組合，比如AdaBoost通過加權多數表決的方式，即增大錯誤率小的分類器的權值，同時減小錯誤率較大的分類器的權值

對於訓練好的弱分類器，如果是分類任務按照權重進行投票，而對於迴歸任務進行加權，然後再進行預測。
在這裡插入圖片描述

3. stacking

Stacking是通過一個元分類器或者元迴歸器來整合多個分類模型或迴歸模型的整合學習技術。
基礎模型利用整個訓練集做訓練，元模型將基礎模型的特徵作為特徵進行訓練。
在這裡插入圖片描述

整合學習：bagging、 boosting、stacking

一、什麼是整合學習整合學習通過構建並結合多個學習器來完成學習任務。要獲得好的整合，學習器之間要具有差異性。

機器學習——整合學習(Bagging、Boosting、Stacking)

1 前言整合學習的思想是將若干個學習器(分類器&迴歸器)組合之後產生一個新學習器。弱分類器(weak learner)指那些分類準確率只稍微好於隨機猜測的分類器(errorrate < 0.5)。

C++網路程式設計學習：跨平臺支援Windows、Linux系統

技術標籤：網路程式設計C/C++網路linuxsocketc++tcpip 網路程式設計學習記錄使用的語言為C/C++

009java學習：多維陣列、不規則陣列

（一）多維陣列（原博文地址：http://c.biancheng.net/view/917.html）除了一維陣列和二維陣列外，Java中還支援更多維的陣列，如三維陣列、四維陣列和五維陣列等，它們都屬於多維陣列。經過前面一維，二維的練習後

《整合學習：XGBoost, lightGBM》[1]

《整合學習：XGBoost, lightGBM》[1] 視訊選集 5/19 P101.內容簡介 P202.分類樹-資訊熵_bilibili

拓端tecdat：Python整合學習：自己編寫構建AdaBoost分類模型視覺化決策邊界及sklearn包呼叫比較

原文連結：http://tecdat.cn/?p=24421 原文出處：拓端資料部落公眾號 AdaBoost是？ Boosting指的是機器學習元算法系列，它將許多 \"弱 \"分類器的輸出合併成一個強大的 \"集合\"，其中每個弱分類器單獨的錯誤率可能

拓端tecdat：Python整合機器學習：用AdaBoost、決策樹、邏輯迴歸整合模型分類和迴歸和網格搜尋超引數優化

原文連結：http://tecdat.cn/?p=24231 原文出處：拓端資料部落公眾號 Boosting 是一類整合機器學習演算法，涉及結合許多弱學習器的預測。

SpringMVC學習[01]：【介紹、工作流程、搭建、值傳遞】

內容 1.SpringMVC的介紹 2.SpringMVC的工作流程 3.SpringMVC的搭建以及配置檔案說明 4.SpringMVC值傳遞的方式

學習筆記163—理解模型正則化：L1正則、L2正則（理論+程式碼）

理解模型正則化：L1正則、L2正則（理論+程式碼） 0 前言我們已經知道了模型誤差 = 偏差 + 方差 + 不可避免的誤差，且在機器學習領域中最重要就是解決過擬合的問題，也就是降低模型的方差。在上一篇文章《ML/DL重要

前端入職學習筆記-第二週第三天（vue元件傳值：Bus傳值、路由傳值、Vuex傳值）

Bus匯流排 1 定義Bus匯流排　　在main.js中定義Bus匯流排　　　　constBus=newVue() 　　然後將Bus新增到new Vue中的data裡面　　

[機器學習]評價指標：召回率(Recall)、準確率(Precision)、f1-score、Hit Ratio(HR)、NDCG、MAP(MARR)

目錄召回率(Recall)精確率(Precision)F1-scoreHit Ratio(HR)Normalized Discounted Cummulative Gain(NDCG)平均精度均值MAP（Mean Average Precision）

圖解3種常見的深度學習網路結構：FC、CNN、RNN

導讀：深度學習可以應用在各大領域中，根據應用情況的不同，深度神經網路的形態也各不相同。

solaris學習2：網路、路由、防火牆、包監控

1、網絡卡驅動安裝solaris後就是如何確定網絡卡有沒有安裝驅動和配置啟用。對於初步接觸solaris的人來說這確實是個問題，我就是如此，所以分兩個問題來說明。

Java Springboot學習(三) 整合springmvc、jdbc、mybatis

1.整合SpringMVC 剛才案例已經能實現mvc自動配置，這裡我們主要解決以下3個問題

（C++11/14/17學習筆記）：互斥量概念、用法、死鎖演示及解決詳解

技術標籤：C++11/14/17 目錄互斥量概念、用法、死鎖演示及解決詳解互斥量(mutex)的基本概念

（C++11/14/17學習筆記）：std::atomic續、std::async與std::thread對比

技術標籤：C++11/14/17 目錄 std::atomic續、std::async與std::thread對比原子操作std::atomic續談

Python語言程式設計學習：sklearn.manifold的TSNE函式的簡介、使用方法、程式碼實現之詳細攻略

技術標籤：Python程式設計(初級+進階) Python語言程式設計學習：sklearn.manifold的TSNE函式的簡介、使用方法、程式碼實現之詳細攻略

操作手冊2：建數倉，從ODS到DWD層——日誌的清洗、轉換、整合

技術標籤：專案實戰需求：用spark來進行資料ETL：清洗：去除json資料中的廢棄欄位過濾json格式不正確的髒資料過濾日誌中的account及deviceid全為空的記錄過濾日誌中缺少關鍵欄位（properties/eventid/sess

C++學習：第六章Linux高階程式設計 - （十三）執行緒的訊號量、鎖、私有資料

技術標籤：C++ 回顧：執行緒與程序 1. 程序由於資源獨立，程序的主要關注是解決資源共享

sigmoid函式_機器學習第33集：什麼是sign函式？什麼是sigmoid函式？( 含有筆記、程式碼、註釋 )...

技術標籤：sigmoid函式什麼是sign函式？什麼是sigmoid函式？ ① sign(x)將大於0的分為1，小於0的分為-1。

整合學習：bagging、 boosting、stacking

一、什麼是整合學習

一. 整合學習的三大類：

1. Bagging – 降低方差

2. boosting – 降低偏差

3. stacking

相關推薦