1. 程式人生 > >臺大機器學習聽課筆記---Bagging 7-4

臺大機器學習聽課筆記---Bagging 7-4

目的:


用同一份資料製造出很多不同的小矩。

用手上的資料生出長的像“新鮮”的資料。

------------------------------------------------------------------------------------------------------------------------------------------

做法:


從手上有限的資料裡去模擬不一樣的資料。


每次取一部分資料出來,作記錄,然後放回。重複以上操作。一種有放回的抽樣方法。


Bagging:bootstrap aggregating的縮寫

  • PS:Boosting類似Bagging方法,但是Boosting訓練是序列進行的,第k個分類器訓練時關注對前k-1分類器中錯分的文件,即不是隨機取,而是加大取這些文件的概率。

-----------------------------------------------------------------------------------------------------------------------

例項:



Pocket演算法:給pocket不同的資料,會生成不一樣的線。

25條pocket演算法生出來的線----這些線怎麼生成的:把原來的資料作bootstrapping,再丟到pocket演算法裡,每個pocket演算法跑1000輪。

把這25條線合起來,就得到黑色的線---非線性的邊界。


基礎演算法對資料的隨機性比較敏感,則通過Bagging效果會越好。


---------------------------------------------------------------------------------------

FunTime

Q:


從D中取一個子集N,有多大概率取到原集合?

A:3.