R語言決策樹演算法
阿新 • • 發佈:2019-01-27
1,生成樹:rpart()函式raprt(formular,data,weight,subset,na.action=na.rpart,method,model=FALSE,x=FALSE,y=TRUE,parms,control,cost,...) fomula
:模型格式形如outcome~predictor1+predictor2+predictor3+ect。
data :資料。 na.action:缺失資料的處理辦法,預設為刪除因變數缺失的觀測而保留自變數缺失的觀測。 method:樹的末端資料型別選擇相應的變數分割方法,連續性method=“anova”,離散型使用method=“class”,,計數型method=“poisson”,生存分析型method=“exp”。 parms:設定三個引數,先驗概率,損失矩陣,分類矩陣的度量方法。 control:控制每個節點上的最小樣本量,交叉驗證的次數,複雜性參量:cp:complexity
pamemeter。 2,剪枝使用 prune(tree,cp,....) tree常是rpart()的結果物件,cp 複雜性參量 3 顯示結果的語句 printcp(fit)顯示覆雜性表plotcp(fit)畫交叉驗證結果圖rsq.rpart(fit)R-squared
和 relative error for different splits (2 plots). labels are only appropriate for "anova" method.print(fit)列印結果summary(fit)基本資訊plot(fit)畫決策樹text(fit)給樹新增標籤post(fit,file=)儲存結果ps,pdf,等格式 #
Classification Tree with rpart