1. 程式人生 > >24、python對資料框進行分組統計簡單操作

24、python對資料框進行分組統計簡單操作

分組分析:是指根據分組欄位,將分析物件劃分成不同的部分,已進行對比分析各組之間的差異性的一種分析方法

常見的統計指標:

計數
求和
平均值

1 函式
01 分組統計函式:
groupby(by=[分組列1,分組列2,...])[統計列1,統計列2,。。。]
.agg({統計列名1:統計函式1,統計列名2:統計函式2,。。。})

引數說明:

by: 用於分組的列
中括號:用於統計的列
agg: 統計別名顯示統計值的名稱,統計函式用於統計資料

02 常用統計函式    註釋
size           計數
sum            求和
mean           均值

2 案例說明

import pandas

data=pandas.read_csv(
        'D:\\DATA\\pycase\\5.2分組分析\\data.csv',
            engine='python',
            sep=',',
            encoding='utf8'
            )

# 分組進行統計
# by 後邊是分組列,score是統計列

import numpy

aggResule=data.groupby(
        by=['class']
        )['score'].agg({
                '總分': numpy.sum,
                '人數': numpy.size,
                '平均值': numpy.mean
                })