1. 程式人生 > >隨機森林和決策樹調參

隨機森林和決策樹調參

blog 每次 抽樣 單獨的數 回歸 函數 現在 推薦 訓練

隨機森林

隨機森林的“隨機”體現在兩個部分:

  • 使用boostrap隨機抽樣(通俗點說就是有放回的隨機抽樣),假設原先數據集有N個樣本,每次仍然抽出來N個樣本,進行M次抽樣,組成M個數據集(也就是抽M次,每次抽N個),每個單獨的數據集都用來訓練一顆單獨的決策樹T
  • 選取特征進行分裂的時候,隨機選取 k 個特征(k是一個小於所有特征總數 P 的值),進行分裂

選取k值的時候,發明隨機森林的人推薦如下的取值:

  • 回歸: k = √p
  • 分類: k = p/3

決策樹

決策樹停止分裂的常用條件:

1.樹的深度到達指定最大值

2.損失函數已經到達指定的最小值

3.節點包含的樣本數量已經到達指定的最小值

  • 回歸: 5個
  • 分類: 1個

隨機森林和決策樹調參