1. 程式人生 > >daidingdaiding——篩查資料集中的異常值

daidingdaiding——篩查資料集中的異常值

 

 

1)、打印出頭尾部分資料,並輸出每列的七個統計量。

(2)、篩查資料集中的異常值,比如非常特殊(明顯)的值。

 

T1、用分位數圖展示異常點

#畫出資料的分佈圖,然後與可能的分佈進行比較,判斷相關的資料是否匹配。

 

 

T2、利用Pandas工具包儲存列印並分析資料:能夠查找出異常值。比如輸出均值、標準差,四分位數、十分位數,標籤M是111、R是97。

1)、列表[0.1,0.15,0.2,0.25,0.3,0.35,0.4,4] 中確定是否有異常值,顯然最後一個數“4”是異常值。

2)、Pandas輸出頭部、尾部資料進行觀察分析,Pandas可自動計算出均值、方差、分位數。