1. 程式人生 > >Pandas處理缺失數據

Pandas處理缺失數據

HR dataframe AC print 改變 進行 post 參數 解釋

利用pandas.DataFrame.dropna處理含有缺失值的數據

1.使用形式:
DataFrame.dropna(axis=0, how=‘any‘, thresh=None, subset=None, inplace=False)

功能:處理含有缺失值的dataframe,將缺失值的行列過濾

2.參數解釋:

參數:axis : 確定過濾行還是列,默認為0,可取值為:{0 or ‘index’, 1 or ‘columns’}

   how : 確定過濾的標準,可選值為{}‘any’, ‘all’}。any : 存在NA就過濾,all:某一行或者某一列全為NA就過濾

   thresh : 確定過濾的敏感程度int,取值為num,表示保留至少有num個非NA值得行、列

   inplace : boolean, 默認值 False。

    inplace=False,默認該刪除操作不改變原數據,返回一個執行刪除操作後的新dataframe;

    inplace=True,則會直接在原數據上進行刪除操作

3.測試

測試一個過濾過缺失值的dataframe時候還有缺失值:

print(data[data.isnull().any(axis=1)].size)
#輸出data中含有NA值得列的數目,輸出為0

      

Pandas處理缺失數據