1. 程式人生 > >如何判斷異常值

如何判斷異常值

使用Z標準化得到的閾值作為判斷標準,標準化後的得分超過閾值則為正常:

import pandas as pd

#生成異常資料
df = pd.DataFrame({'col1':[1,120,3,5,2,12,13],
                   'col2':[12,17,31,53,22,32,43]})
print(df)#列印輸出

#通過Z-Score方法判斷異常值
df_zscore = df.copy()#複製一個來儲存Z-score得分的資料框
cols = df.columns #獲得資料框的列名
for col in cols:#迴圈讀取每列
    df_col = df[col]#
得到每列的值 z-score = (df_col-df_col.mean())/df_col.std()#計算每列的Z-score得分 df-zscore[col] = z_score.abs() > 2.2 #判斷Z-score得分是否大於2.2,如果得分為Ture,否則為False print(df_zscore)