1. 程式人生 > >python pandas處理缺失值

python pandas處理缺失值

缺失值:python中顯示為NaN,python用np.nan,None表示

在簡單的運算+-*/中,有缺失值的畫,運算結果在相應的位置上也是缺失值

在描述性統計sum,mean,min.max等中,NaN都是作為0進行運算

操作:

判斷

返回一個含有布林值的物件,True表示是缺失值:data.isnull()

刪除

刪除含有空缺值的行:data=data.dropna()

刪除全為NaN的行:data=data.dropna(how='all')

刪除全為NaN的列:data=data.dropna(axis=1,how='all')

填充

將缺失值替換為常數值0:data=data.fillna(0)或fata.fillna(0,inplace=True),不產生新的副本,直接修改源資料

用字典不同列填充不同的值:data=data.fillna({1:0.1,2:3}) #1列填充0.1,2列填充3