提升方法：Adaboost演算法與證明

阿新 • • 發佈：2019-01-13

這基本就是關於《統計學習方法》的筆記，當然自己會記的讓人容易讀懂，為了加深記憶，證明都證了兩遍，便於加深理解還是打算寫在部落格裡好了。接下來會先介紹什麼是提示方法，再介紹Adaboost演算法，接著會給個書上的例子，最後再給出一些推導（由於之前是寫過的但是沒儲存好，所以這次有的部分就貼上了）。

1、提升方法

定義：在分類問題中，該方法會改變訓練樣本的權重，學習到多個弱分類器，最後將這些分類器進行線性組合形成一個強分類器，從而提高分類的能力。

關於弱分類器可以簡單理解為該模型可以分類但是分類能力不強，而強分類器則能很好的進行分類。
如此一來，對於提升方法我們需要考慮兩個問題

每次迭代的時候如何改變樣本的權重
如何將這些弱分類器組合成一個強分類器。

ps:如何獲得弱分類器（或者說基本分類器）是根據需要的來決定的，與提升方法沒有必然聯絡，比如可以是決策樹模型，然後學習到一個強的決策樹模型。

2、Adaboost

Adaboost就是一個典型的提升方法，那麼它如何解決上面的兩個問題呢？

每次迭代過程中，會提高上一輪誤分類樣本點（使用上一輪分類器不能進行正確分類的樣本）的權重，使它在本輪中獲得更多的關注；相反，上一輪正確分類的樣本的權重則會降低；
提升方法中已經說了會對弱分類器進行線性組合形成強分類器，Adaboost的做法是採用加權多數表決的方法，具體的，增大分類誤差率低的弱分類器的係數，降低分類誤差率高的弱分類器的係數。

下面關於二分類問題給出該演算法流程（昨天寫了沒儲存好，所以不想寫了就直接貼上了）

Adaboost
輸入：二分類樣本集 $T = {(x_{1},$

y 1 ) , ( x 2 , y 2 ) , . . . , ( x N , y N ) } T=\{(x_1,y_1),(x_2,y_2),...,(x_N,y_N)\}

T = {(x_{1}, y_{1}), (x_{2}, y_{2}), . . ., (x_{N}, y_{N})}

,其中

y=\{+1,-1\}

；弱學習演算法（來獲得弱分類器）；
輸出：最終強分類器

G(x)

在這裡插入圖片描述

這裡做一些必要的說明

演算法最開始的時候，沒有別的要求的話，設定每個樣本的權重是一樣的即 $\frac{1}{N}$ ；
針對每個m我們是從 $(a)$ 計算到 $(3)$ ，如果發現此時的最終分類器還是不能進行正確分類，那麼設定 $m=m+1$ 進行下一輪
$(b)$ 步的分類誤差率 $e_m=\sum\limits_{i=1}^{N}w_{mi}I(G(x_i)\neq y_i)$ ，其中 $I$ 是指示函式 $I(true)=1,I(false)=0$ ，所以實際上分類誤差率就是被錯誤分類的樣本的權重之和。和一般所認識的分類誤差率 $e_m=\frac{1}{N}\sum\limits_{i=1}^{N}I(G(x_i)\neq y_i)$ 很類似。顯然值越小那麼該分類器 $G_m(x)$ 的分類能力更好
對於 $(c)$ 步的分類器係數 $\alpha_m=\frac{1}{2}log(\frac{1}{e_m}-1)$ ，當 $e_m<1/2$ 的時候， $e_m$ 越小（分類器 $G_m(x)$ 的分類能力更好）則係數越大，中一點在 $2$ 中已經提到過。
對於 $(d)$ 步，該步驟是更新樣本權重的，如何更新？被錯誤分類的樣本會增大權重從而會在下一輪引起重視，被正確分類的則減少權重。如果看的不清楚，因為是二分類問題所以 $G_m(x_i)=1$ 或者 $-1$ ，所以下一輪的權重 $w_{m+1,i}$ 可以寫成下面的形式（寫在了最後面）。這也是上面1所說的
在第 $(3)$ 步，則是對弱分了器進行線性組合，比如第一輪得到的是 $G_1(x)$ ，那麼這輪 $f(x)=\alpha_1G_1(x)$ ，第二輪得到的是 $G_2(x)$ ，那麼這輪會進行疊加，即 $f(x)=\alpha_aG_1(x)+\alpha_2G_2(x)$ 。其中 $f(x)$ 的正負號表示分類結果，比如有樣本 $(x_4,1)$ ，將 $x_4$ 作為輸出，如果有

提升方法：Adaboost演算法與證明

這基本就是關於《統計學習方法》的筆記，當然自己會記的讓人容易讀懂，為了加深記憶，證明都證了兩遍，便於加深理解還是打算寫在部落格裡好了。接下來會先介紹什麼是提示方法，再介紹Adaboost演算法，接著會給個書上的例子，最後再給出一些推導（由於之前是寫過的但是沒儲存好，所以這次有的部分就貼上

提升方法：前向分步演算法與提升樹

這篇內容為《統計學習方法》的學習筆記，也看過其他書和培訓班的視訊ppt等，但是感覺都是離不開《統計學習方法》這本書，還是這本書讀起來乾淨利落（雖然有很少的地方有點暈）。接下來首先介紹加法模型和前向分步演算法，接著介紹提升樹，最後補充梯度提升方法。 1、加法模型和前向分步演算法

提升方法：GBDT、XGBOOST、AdaBoost

提升 (boosting) 方法是一種常用的統計學習方法，應用廣泛且有效，在分類問題中，它通過改變訓練樣本的權重，學習多個分類器，並將這些分類器進行線性組合，提高分類器效能。 GBDT 我們知道隨機森林的決策樹分別取樣建立, 相對獨立。那

遞進分析：Paxos演算法與Zookeeper分析

轉載：https://blog.csdn.net/xhh198781/article/details/10949697 Paxos演算法與Zookeeper分析 1 Paxos演算法 1.1 基本定義演算法中的參與者主要分為三個角色，同時每個參與者又可兼領多

機器學習：AdaBoost演算法及其實現

文章目錄楔子演算法描述： adaboost裡的樣本權重和話語權演算法描述 AdaBoost的實現：數學基礎(瞭解）楔子前面提到boosting演算法為一類演算法，這一類演算法框架分為3步

提升方法（Adaboost）

提升(boosting)方法是一種常用的統計學習方法，應用廣泛且有效。在分類問題中，它通過改變訓練樣本的權重，學習多個分類器，並將這些分類器進行線性組合，提高分類的效能。基本思想：對於分類問題而言，給定一個訓練樣本集，求比較粗糙的分類規則(弱分類器)

神經網路聚類方法：SOM演算法原理

一個神經網路接收外界輸入模式時，將會分為不同的對應區域，各區域對輸入模式有不同的響應特徵，而這個過程是自動完成的。其特點與人腦的自組織特性類似。SOM的目標是用低維（通常是二維或三維）目標空間的點來表

聚類方法：DBSCAN演算法研究（1）--DBSCAN原理、流程、引數設定、優缺點以及演算法

DBSCAN聚類演算法三部分： 1、 DBSCAN原理、流程、引數設定、優缺點以及演算法； 2、 matlab程式碼實現； 3、 C++程式碼實現及與matlab例項結果比較。 DBSCAN(Density-based

python機器學習庫scikit-learn簡明教程之：AdaBoost演算法

1.AdaBoost簡介及原理 Adaboost是一種迭代演算法，其核心思想是針對同一個訓練集訓練不同的分類器(弱分類器)，然後把這些弱分類器集合起來，構成一個更強的最終分類器（強分類器）。 Adab

強化學習(五)：Sarsa演算法與Q-Learning演算法

上一節主要講了Monte-Carlo learning，TD learning，TD(λ)。這三個方法都是為了在給定策略下來估計價值函式V(s)。只不過Monte-Carlo learning需要得到一個完整的episode才能進行一次v值更新，而TD lear

python中的路徑表示方法：原始字串與普通字串

路徑表示中，會有很多的反斜槓“\”，說實話我第一次碰到的時候很難受。這種情況下推薦使用原始字串表示，其表示方法如下： r"C:\Users\DongLi\Desktop\last.txt" 就是在普通字串的引號前面緊貼一個小寫的“r”，看看效果 prin

聚類方法：DBSCAN演算法研究（2）--matlab程式碼實現

DBSCAN聚類演算法三部分： 1、 DBSCAN原理、流程、引數設定、優缺點以及演算法； 2、 matlab程式碼實現； 3、 C++程式碼實現及與matlab例項結果比較。摘要：介紹DBSCAN原理、流程、引數設

【經典演算法】：Dijskstra演算法與Floyd演算法

Dijkstra演算法利用的是一個經典的東西，叫做保持好的最短路徑，目的就是為了在尋找最短路徑的時候的保持最短化的過程 Floyd演算法利用的是一個經典的公式 D[I,J]>D[I,K] + D[K,J] 則 D[I J] = D[I K] + D[K J]

Boosting(提升方法)和AdaBoost

發現更新這樣的做的 stat element 操作 for 簡單集成學習（ensemble learning）通過構建並結合多個個體學習器來完成學習任務，也被稱為基於委員會的學習。集成學習構建多個個體學習器時分兩種情況：一種情況是所有的個體學習器都是同一種類型的

演算法導論第四章：遞迴式筆記（代換法、遞迴樹方法、主方法、主定理的證明）

三種解遞迴式的方法：代換法、遞迴樹方法、主方法。代換法：用代換法解遞迴式需要兩個步驟：猜測解的形式；用數學歸納法找出使解真正有效的常數。如： T(n) = 2T(n/2) + n，這個是合併排序的執行時間的遞迴表示式。歸併排序法的執行時間是O(nlgn)，那麼我

提升方法AdaBoost演算法

1、提升方法提升方法就是從弱學習演算法出發，反覆學習，得到一系列弱分類器(又稱為基本分類器)，然後組合弱分類器，構成一個強分類器。大多數提升的方法都是改變訓練資料的的概率分佈(訓練資料的權值分佈)。 2、提升方法相關問題（1）在每一輪如何改變訓

機器學習sklearn19.0——整合學習——boosting與梯度提升演算法（GBDT）、Adaboost演算法

一、boosting演算法原理二、梯度提升演算法關於提升梯度演算法的詳細介紹，參照部落格：http://www.cnblogs.com/pinard/p/6140514.html 對該演算法的sklearn的類庫介紹和調參，參照網址：http://

組合方法(ensemble method) 與adaboost提升方法

組合方法：我們分類中用到很多經典分類演算法如：SVM、logistic 等，我們很自然的想到一個方法，我們是否能夠整合多個演算法優勢到解決某一個特定分類問題中去，答案是肯定的！通過聚合多個分類器的預測來提高分類的準確率。這種技術稱為組合方法(ensemble metho

機器學習——提升方法AdaBoost演算法，推導過程

0提升的基本方法　　對於分類的問題，給定一個訓練樣本集，求比較粗糙的分類規則（弱分類器）要比求精確的分類的分類規則（強分類器）容易的多。提升的方法就是從弱分類器演算法出發，反覆學習，得到一系列弱分類器（又稱為基本分類器），然後組合這些弱分類器，構成一個強分類器。大多數的提升方法都是改變訓練資料集的概率分佈

Azure Stack技術深入淺出系列1：Azure Stack與Azure的有QoS保證的網絡聯通實現方法和對比測試

azure stack 雲計算微軟 azure源自Azure的Azure stack作為一款業界唯一的和領先的公有雲平臺一致的混合雲平臺，能夠幫助企業客戶從自有數據中心交付Azure雲服務。它作為微軟混合雲戰略中的重頭戲，官方宣稱其將在今年年中GA了。上海儀電集團高度重視這一產品，同時成立了一個專門的團隊來

提升方法：Adaboost演算法與證明

1、提升方法

2、Adaboost

相關推薦