ML之預測:以某個資料集為例從0到1深入理解科學預測之分類問題的思路框架
阿新 • • 發佈:2018-11-30
ML之預測:以某個資料集為例從0到1深入理解科學預測之分類問題的思路框架
總體思路設計框架
1、獲取資料集,並確定新資料集的規模
資料集規模為(208*61)
2、確定資料集每個屬性的型別
3、對資料集統計特徵
Mean = 0.053892307692307684 Standard Deviation = 0.04641598322260027 Boundaries for 4 Equal Percentiles [0.0058, 0.024375, 0.04405, 0.0645, 0.4264] Boundaries for 10 Equal Percentiles [0.0058, 0.0141, 0.022740000000000003, 0.027869999999999995, 0.03622, 0.04405, 0.05071999999999999, 0.059959999999999986, 0.07794000000000001, 0.10836, 0.4264] Unique Label Values {'M', 'R'} Counts for Each Value of Categorical Label ['M', 'R'] [111, 97]
4、篩查資料集中的異常值:用分位數圖展示異常點