pandas常用函式筆記
阿新 • • 發佈:2018-11-11
1. .groupby()
以一種自然的方式對資料集進行切片、切塊、摘要等操作。根據一個或多個鍵(可以是函式、陣列或DataFrame列名)拆分pandas物件。
>>>import pandas as pd >>>df=pd.DataFrame({'key1':['a','a','b','b','a'], 'key2':['one','two','one','two','one'], 'data1':np.random.randn(5), 'data2':np.random.randn(5)}) >>>df data1 data2 key1 key2 0 -0.410673 0.519378 a one 1 -2.120793 0.199074 a two 2 0.642216 -0.143671 b one 3 0.975133 -0.592994 b two 4 -1.017495 -0.530459 a one #按key1分組,並計算data1列的平均值 >>>grouped=df['data1'].groupby(df['key1']) >>>grouped.mean() key1 a -1.182987 b 0.808674 >>>means=df['data1'].groupby(df['key1'],df['key2']).means() key1 key2 a one -0.714084 two -2.120793 b one 0.642216 two 0.975133
2. .groupby().apply()
先分組,再對每個分組應用apply函式中的操作
3. .loc() 與 .iloc()
loc——通過行標籤索引行資料
iloc——通過行號索引行資料
具體參考下面的博文
https://blog.csdn.net/hecongqing/article/details/61927615
未完待續