1. 程式人生 > >pandas 自定義函式

pandas 自定義函式

雖然說pandas裡面確實有很多內建的函數了,但是也不可能滿足所有的需求,所以有些時候我們也需要

自己定義一些函式來滿足自己的需求:

那麼該如何定義呢:定義之後又該如何用呢:

對於函式的定義就很簡單了,python自定義函式一樣,但是在使用他的時候就需要用到apply了:

如:算出每一列空值的個數:

def null_count(column):

    column_null = pd.isnull(column)

    null = column[column_null]

    return len(null)

column_null_count = object(DataFrame).apply(null_count)

print(column_null_count)


當然不只是這些:

通過apply可以定義很多操作:

還可以將連續值離散化,比如年齡,小於18為未成年,大於18為成年等等