1. 程式人生 > >pandas常用函式筆記

pandas常用函式筆記

1.   .groupby()

以一種自然的方式對資料集進行切片、切塊、摘要等操作。根據一個或多個鍵(可以是函式、陣列或DataFrame列名)拆分pandas物件。

>>>import pandas as pd
>>>df=pd.DataFrame({'key1':['a','a','b','b','a'],
    'key2':['one','two','one','two','one'],
    'data1':np.random.randn(5),
    'data2':np.random.randn(5)})
>>>df
            data1    data2    key1    key2
0        -0.410673  0.519378   a      one
1        -2.120793  0.199074   a      two
2        0.642216   -0.143671  b      one
3        0.975133   -0.592994  b      two
4        -1.017495  -0.530459  a      one

#按key1分組,並計算data1列的平均值
>>>grouped=df['data1'].groupby(df['key1'])
>>>grouped.mean()
key1
a    -1.182987
b    0.808674

>>>means=df['data1'].groupby(df['key1'],df['key2']).means()
key1  key2
a     one    -0.714084
      two    -2.120793
b     one     0.642216
      two     0.975133

2. .groupby().apply()

先分組,再對每個分組應用apply函式中的操作

3. .loc() 與 .iloc()

loc——通過行標籤索引行資料
iloc——通過行號索引行資料

具體參考下面的博文

https://blog.csdn.net/hecongqing/article/details/61927615

未完待續