1. 程式人生 > 資訊 >科技行業股票拋售蔓延至創業公司,投資者愈發謹慎

科技行業股票拋售蔓延至創業公司,投資者愈發謹慎

1.什麼是決策樹:

  決策樹表示基於特徵對例項進行分類的樹形結構,從給定的訓練資料集中,遞迴選擇最優劃分特徵,依據此特徵對訓練資料集進行劃分,直到結點符合停止條件。

2.決策樹分類:

  以標籤型別分為迴歸樹和分類樹,分別處理連續標籤和離散標籤

3.決策樹常用概念:

    

 4.決策樹的退出條件:子類特徵值全部相同、結果的標籤全部相同、子類中不含特徵、樹的深度達到最大值、葉子樣本數達到最小

 5.分類依據:連續標籤的依據:擬定幾種分類方式,對分類結果分別求方差再求和得到mse,取mse最小的情況做分類

 

 

      離散標籤的依據:ID3按資訊增益或條件熵(一般情況用條件熵)、C4.5按資訊增益比最小的情況做劃分,CART按基尼係數最小情況劃分

 6.輸出值:連續標籤以葉子節點的均值作為輸出,

      離散標籤以多數票的方式決定輸出標籤

 

 

 

 

------------恢復內容結束------------