【模式識別】Boosting

阿新 • • 發佈：2019-01-06

Boosting簡介

分類中通常使用將多個弱分類器組合成強分類器進行分類的方法，統稱為整合分類方法（Ensemble Method）。比較簡單的如在Boosting之前出現Bagging的方法，首先從從整體樣本集合中抽樣採取不同的訓練集訓練弱分類器，然後使用多個弱分類器進行voting，最終的結果是分類器投票的優勝結果。這種簡單的voting策略通常難以有很好的效果。直到後來的Boosting方法問世，組合弱分類器的威力才被髮揮出來。Boosting意為加強、提升，也就是說將弱分類器提升為強分類器。而我們常聽到的AdaBoost是Boosting發展到後來最為代表性的一類。所謂AdaBoost，即Adaptive Boosting，是指弱分類器根據學習的結果反饋Adaptively調整假設的錯誤率，所以也不需要任何的先驗知識就可以自主訓練。Breiman在他的論文裡讚揚AdaBoost是最好的off-the-shelf方法。

兩類Discrete AdaBoos演算法流程

AdaBoosting方法大致有：Discrete Adaboost, Real AdaBoost, LogitBoost, 和Gentle AdaBoost。所有的方法訓練的框架的都是相似的。以Discrete Adaboost為例，其訓練流程如下：

首先初始化每個樣本相同的權重（步驟2）；之後使用加權的樣本訓練每個弱分類器（步驟3.1）；分類後得到加權的訓練錯誤率和比例因子（步驟3.2）；將被錯誤分類的樣本的權重加大，並將修改後的權重再次歸一化（步驟3.3）；迴圈訓練過程，最終使用比例因子組合組合弱分類器構成最終的強分類器。
下面看一個更形象的圖，多個弱分類器的組合過程和結果大致為：

訓練的迴圈過程，加重被錯誤分類的樣本的權重是一種有效的加速訓練的方法。由於訓練中正確率高的弱分類器權重較大，新一輪的訓練中正確分類的樣本會越來越多，權重較小的訓練樣本對在新一輪的訓練中起作用較小，也就是，每一輪新的訓練都著重訓練被錯誤分類的樣本。

實際訓練中弱分類器是一樣的，但弱分類器實際使用的訓練資料不同，通常使用特徵向量的每一維分別構成一個弱分類器。而後來大名鼎鼎的Haar+Adaboost人臉檢測方法是使用每種Haar特徵構成一個弱分類器，基於Block的Haar特徵比簡單的基於pixel的特徵有帶有更多的資訊，通常能得到更好的檢測效果，而積分圖Integral的方法使其在計算速度上也有很大優勢。有興趣可參考《

基於Adaboost和Haar-like特徵人臉識別》。

Real AdaBoost和Gentle AdaBoost

Discrete Adaboost是最簡單的兩類Boosting分類結果，而後續的Real AdaBoost（也稱為AdaBoost.MH）可以看做Discrete Adaboost的泛化形式，弱分類器可以輸出多個分類結果,並輸出這幾個分類結果的可能性，可以看成每個弱分類器都更不“武斷”。而Gentle AdaBoost則是修改了迭代訓練過程中錯誤樣本權重調整的方法，較少地強調難以分類的樣本，從而避免了原本AdaBoost對”非典型”的正樣本權值調整很高而導致了分類器的效率下降的情況。,而產生的變種演算法。AdaBoost的Matlabe工具箱GML_AdaBoost_Matlab_Toolbox實現了Real AdaBoost, Gentle AdaBoost和Modest AdaBoost，且有個概況明瞭的介紹（工具箱的使用內部用手冊，也可以參考下一篇《CART和GML AdaBoost Matlab Toolbox》）：

【模式識別】Boosting

Boosting簡介分類中通常使用將多個弱分類器組合成強分類器進行分類的方法，統稱為整合分類方法（Ensemble Method）。比較簡單的如在Boosting之前出現Bagging的方法，首先從從整體樣本集合中抽樣採取不同的訓練集訓練弱分類器，然後使用多個弱分類器進行vo

【模式識別】SVM核函式

以下是幾種常用的核函式表示：線性核（Linear Kernel）多項式核（Polynomial Kernel）徑向基核函式（Radial Basis Function）也叫高斯核（Gaussian Kernel），因為可以看成如下核函式的領一個種形式：徑向基函式是指取值僅僅依

【模式識別】Fisher線性判別

Fisher是一種將高維空間對映到低維空間降維後進行分類的方法 1.投影: 對xn→的分量作線性組合可得標量 yn=w⃗ Txn→ 什麼樣的對映方法是好的，我們需要設計一個定量的標準去找w⃗ 來

【模式識別】模式識別的概述（一）

本節主要內容：模式和模式識別的概念模式識別的發展簡史和應用模式識別的主要方法模式識別的系統和例項幾個相關的數學概念1、模式和模式識別的概念什麼是模式（Pattern)？廣義地說，存在於時間和空間中可觀察的事物，如果我們可以區別他們是否相同或是否相似，都可以稱之為

【模式識別】K-近鄰分類演算法KNN

K-近鄰（K-Nearest Neighbors, KNN）是一種很好理解的分類演算法，簡單說來就是從訓練樣本中找出K個與其最相近的樣本，然後看這K個樣本中哪個類別的樣本多，則待判定的值（或說抽樣）就屬於這個類別。KNN演算法的步驟計算已知類別資料集中每個點與當前點的距離；選

【模式識別】感知器 Perceptron

基本概念線性可分：在特徵空間中可以用一個線性分介面正確無誤地分開兩類樣本；採用增廣樣本向量，即存在合適的增廣權向量 a 使得：則稱樣本是線性可分的。如下圖中左圖線性可分，右圖不可分。所有滿足條件的權向量稱為解向量。權值空間中所有解向量組成的區域稱為解區。通常對解區限制：引

【模式識別】MPL,MIL和MCL

Multi-Instance Learning (MIL) 和Multi-Pose Learning (MPL)是CV的大牛Boris Babenko at UC San Diego提出來的，其思想可以用下面一幅圖概況。MIL是指一個物件的學習例項可能有很多種情況，學習的時候

【模式識別與機器學習】——判別式和產生式模型

（1）判別式模型（Discriminative Model）是直接對條件概率p(y|x;θ)建模。常見的判別式模型有線性迴歸模型、線性判別分析、支援向量機SVM、神經網路、boosting、條件隨機場等。　　舉例：要確定一個羊是山羊還是綿羊，用判別模型的方法是從歷史資料中學習到模型，然後通過提取這隻羊的特

【模式識別與機器學習】——3.9勢函式法：一種確定性的非線性分類方法

目的　　用勢函式的概念來確定判別函式和劃分類別介面。基本思想　　假設要劃分屬於兩種類別ω1和ω2的模式樣本，這些樣本可看成是分佈在n維模式空間中的點xk。把屬於ω1的點比擬為某種能源點，在點上，電位達到峰值。隨著與該點距離的增大，電位分佈迅速減小，即把樣本xk附近空間x點上的電位分佈，看

【模式識別與機器學習】——PCA主成分分析

基本思想其基本思想就是設法提取資料的主成分（或者說是主要資訊），然後摒棄冗餘資訊（或次要資訊），從而達到壓縮的目的。本文將從更深的層次上討論PCA的原理，以及Kernel化的PCA。引子首先我們來考察一下，這裡的資訊冗餘是如何體現的。如下圖所示，我們有一組二維資料點，從圖上不難發現

【模式識別與機器學習】——PCA與Kernel PCA介紹與對比

PCA與Kernel PCA介紹與對比 1. 理論介紹　　PCA：是常用的提取資料的手段，其功能為提取主成分（主要資訊），摒棄冗餘資訊（次要資訊），從而得到壓縮後的資料，實現維度的下降。其設想通過投影矩陣將高維資訊轉換到另一個座標系下，並通過平移將資料均值變為零。PCA認為，在變換過後的

【模式識別與機器學習】——最大似然估計（MLE）最大後驗概率（MAP）

1）極/最大似然估計 MLE 給定一堆資料，假如我們知道它是從某一種分佈中隨機取出來的，可是我們並不知道這個分佈具體的參，即“模型已定，引數未知”。例如，我們知道這個分佈是正態分佈，但是不知道均值和方差；或者是二項分佈，但是不知道均值。最大似然估計（MLE，Maximum Likelihood Esti

基於開源專案OpenCV的人臉識別Demo版整理（不僅可以識別人臉，還可以識別眼睛鼻子嘴等）【模式識別中的翹楚】

最近對人臉識別的程式非常感興趣，但是苦於沒有選修多媒體方向，看了幾篇關於人臉識別的論文，大概也沒看懂多少，什麼灰度處理啊，切割識別啊，雲裡霧裡，傻傻看不明白啊。各種苦惱。於是就在網上找找，看有木有神馬開原始碼啊，要是有個現成的原始碼就更好了，百度it ,那些原始碼都憂傷的躲在CSDN中，老衲還

PHP PC端微信掃碼支付【模式二】詳細教程-附帶源碼（轉）

idt class pid 方法按鈕 -c 商戶開源玩意兒博主寫這破玩意兒的時候花了大概快兩天時間才整體的弄懂邏輯，考慮了一下~還是把所有代碼都放出來給大家~抱著開源大無私的精神！誰叫我擅長拍黃片呢？同時也感謝我剛入行時候那些無私幫過我的程序員們！首先還是

【模式分解】無損連線&保持函式依賴

首先引入定義　　無損分解指的是對關係模式分解時，原關係模型下任一合法的關係值在分解之後應能通過自然聯接運算恢復起來。反之，則稱為有損分解。保持函式依賴的分解指的是對關係分解時，原關係的閉包與分解後關係閉包的並集相等。

【人臉識別】解析MS-Celeb-1M人臉資料集中的FaceImageCroppedWithAlignment.tsv檔案

版權宣告：本文為博主原創文章，轉載請給出出處。如果錯誤，請指正！ https://blog.csdn.net/wuqingshan2010/article/details/72081898 下載並解壓微軟的大型人臉資料集MS-Celeb-1M後，將FaceImageCrop

人臉識別，解析MS-Celeb-1M人臉資料集及FaceImageCroppedWithAlignment.tsv檔案提取【人臉識別】解析MS-Celeb-1M人臉資料集及FaceImageCroppedWithAlignment.tsv檔案提取

原【人臉識別】解析MS-Celeb-1M人臉資料集及FaceImageCroppedWithAlignment.tsv檔案提取 2018年09月19日 13:11:54

【模式識別】Boosting

Boosting簡介

兩類Discrete AdaBoos演算法流程

Real AdaBoost和Gentle AdaBoost

【模式識別】Boosting

【模式識別】SVM核函式

【模式識別】Fisher線性判別

【模式識別】模式識別的概述（一）

【模式識別】K-近鄰分類演算法KNN

【模式識別】感知器 Perceptron

【模式識別】MPL,MIL和MCL

【模式識別與機器學習】——判別式和產生式模型

【模式識別與機器學習】——3.9勢函式法：一種確定性的非線性分類方法

【模式識別與機器學習】——PCA主成分分析

【模式識別與機器學習】——PCA與Kernel PCA介紹與對比

【模式識別與機器學習】——最大似然估計（MLE）最大後驗概率（MAP）

基於開源專案OpenCV的人臉識別Demo版整理（不僅可以識別人臉，還可以識別眼睛鼻子嘴等）【模式識別中的翹楚】

PHP PC端微信掃碼支付【模式二】詳細教程-附帶源碼（轉）

【模式分解】無損連線&保持函式依賴

【人臉識別】解析MS-Celeb-1M人臉資料集中的FaceImageCroppedWithAlignment.tsv檔案

人臉識別，解析MS-Celeb-1M人臉資料集及FaceImageCroppedWithAlignment.tsv檔案提取【人臉識別】解析MS-Celeb-1M人臉資料集及FaceImageCroppedWithAlignment.tsv檔案提取

【人臉識別】FaceNet: A Unified Embedding for Face Recognition and Clustering 翻譯

【人臉識別】A Discriminative Feature Learning Approach for Deep Face Recognition

【人臉識別】OpenFace

【模式識別】Boosting

Boosting簡介

兩類Discrete AdaBoos演算法流程

Real AdaBoost和Gentle AdaBoost

相關推薦