臺大機器學習聽課筆記---Bagging 7-4
阿新 • • 發佈:2019-02-03
目的:
用同一份資料製造出很多不同的小矩。
用手上的資料生出長的像“新鮮”的資料。
------------------------------------------------------------------------------------------------------------------------------------------
做法:
從手上有限的資料裡去模擬不一樣的資料。
每次取一部分資料出來,作記錄,然後放回。重複以上操作。一種有放回的抽樣方法。
Bagging:bootstrap aggregating的縮寫
- PS:Boosting類似Bagging方法,但是Boosting訓練是序列進行的,第k個分類器訓練時關注對前k-1分類器中錯分的文件,即不是隨機取,而是加大取這些文件的概率。
-----------------------------------------------------------------------------------------------------------------------
例項:
Pocket演算法:給pocket不同的資料,會生成不一樣的線。
25條pocket演算法生出來的線----這些線怎麼生成的:把原來的資料作bootstrapping,再丟到pocket演算法裡,每個pocket演算法跑1000輪。
把這25條線合起來,就得到黑色的線---非線性的邊界。
基礎演算法對資料的隨機性比較敏感,則通過Bagging效果會越好。
---------------------------------------------------------------------------------------
FunTime
Q:
從D中取一個子集N,有多大概率取到原集合?
A:3.