Pandas處理缺失數據
阿新 • • 發佈:2018-03-08
HR dataframe AC print 改變 進行 post 參數 解釋
利用pandas.DataFrame.dropna處理含有缺失值的數據
1.使用形式:
DataFrame.dropna(axis=0, how=‘any‘, thresh=None, subset=None, inplace=False)
功能:處理含有缺失值的dataframe,將缺失值的行列過濾
2.參數解釋:
參數:axis : 確定過濾行還是列,默認為0,可取值為:{0 or ‘index’, 1 or ‘columns’}
how : 確定過濾的標準,可選值為{}‘any’, ‘all’}。any : 存在NA就過濾,all:某一行或者某一列全為NA就過濾
thresh : 確定過濾的敏感程度int,取值為num,表示保留至少有num個非NA值得行、列
inplace : boolean, 默認值 False。
inplace=False,默認該刪除操作不改變原數據,返回一個執行刪除操作後的新dataframe;
inplace=True,則會直接在原數據上進行刪除操作
3.測試
測試一個過濾過缺失值的dataframe時候還有缺失值:
print(data[data.isnull().any(axis=1)].size) #輸出data中含有NA值得列的數目,輸出為0
Pandas處理缺失數據