科技行業股票拋售蔓延至創業公司,投資者愈發謹慎
阿新 • • 發佈:2022-04-18
1.什麼是決策樹:
決策樹表示基於特徵對例項進行分類的樹形結構,從給定的訓練資料集中,遞迴選擇最優劃分特徵,依據此特徵對訓練資料集進行劃分,直到結點符合停止條件。
2.決策樹分類:
以標籤型別分為迴歸樹和分類樹,分別處理連續標籤和離散標籤
3.決策樹常用概念:
4.決策樹的退出條件:子類特徵值全部相同、結果的標籤全部相同、子類中不含特徵、樹的深度達到最大值、葉子樣本數達到最小
5.分類依據:連續標籤的依據:擬定幾種分類方式,對分類結果分別求方差再求和得到mse,取mse最小的情況做分類
離散標籤的依據:ID3按資訊增益或條件熵(一般情況用條件熵)、C4.5按資訊增益比最小的情況做劃分,CART按基尼係數最小情況劃分
6.輸出值:連續標籤以葉子節點的均值作為輸出,
離散標籤以多數票的方式決定輸出標籤
------------恢復內容結束------------