python資料結構:pandas(3)
阿新 • • 發佈:2019-01-05
一、pandas資料操作:
1.處理缺失資料
(1)判斷是否存在缺失值
ser_obj.isnull(),df_obj.isnull()
(2)dropna:丟棄缺失資料
(3)fillna:填充缺失值
2.常用的統計計算
import numpy as np import pandas as pd df1 =pd.DataFrame(np.random.randn(5,4),columns=['a','b','c','d']) print(df1)
(1)sum,mean,max,min.......
(2)axis=0按照列統計,axis=0按照行進行統計
#求和,求出各列的最大值,預設是axis=的方向 print('df1.sum=\n',df1.sum()) #打印出df1的最大值,求出df1各列的最大值 print('df1.max()=\n',df1.max())
求出水平方向各列的最大值
print('水平方向的最大值=\n',df1.max(axis=1))
#求出水平方向各行的和
print('水平方向各行的和',df1.sum(axis=1))
print('各個值的描述為:\n',df1.describe())
(3)skipna排除缺失值,預設為True
(4)idmax,idmin,cumsum
(5)describe()描述多個數據
二、pandas層級索引