pandas 的groupby()

阿新 • • 發佈：2020-07-16

groupby():

groupby函式可以將一個df根據某一列或者某幾列分組又或者是函式分組，經過groupby後悔生成一個groupby物件，該物件本身不會返回任何內容，只有當相應的方法被呼叫時才會起作用

我們使用iris資料做例子

from sklearn.datasets import load_iris
import pandas as pd 
import numpy as np
iris=load_iris()
df=pd.DataFrame(iris.data,columns=iris.feature_names)
df['sample']=iris.target

1.根據某一列分組

#根據sample分組
group_sample=df.groupby('sample')

#get_group()是檢視某一分組，比如說上面的sample有三種類別，我們可以使用get_group()檢視某一類別
group_sample.get_group(0).head()

2.根據某幾列分組，和根據某列分組用法基本一致

#列名需要以list形式傳入
group_n=df.groupby(['petal width (cm)', 'sample'])

group_n.get_group((0.1,0))

3.檢視組容量和組數（size）

#呼叫get_group時可以先檢視一個有幾種分組，組內的容量是怎麼樣的 

group_n.size()

4.組的遍歷，得到的組內資料分別是一個個df

#name,group 分別是組名和組內資料
for name,group in group_n:
    print(name)
    print(group.head())

5.head()和first()

#head()返回的是每個組的前某幾行，而不是資料集的前幾行
group_n.head(2)

#first()返回的每個分組的第一行資訊，組成了一個df 
group_n.first()

6.[col].數學統計變數，即是計算每個分組該列的數學統計值

#計算每個分組的某列的平均值
group_n[' 
sepal length (cm)'].mean()

#返回的布林型的值
group_n['sepal length (cm)'].mean()>5

7.聚合函式（mean/sum/size/count/std/var/sem/describe/first/last/nth/min/max），用法上面例子有，就不贅述了，

下面主要說一下agg()同時使用多個聚合函式

#計算每組每個特徵的平均值
group_n.mean()

#同時使用多個聚合函式
group_n.agg(('sum','mean'))
group_n.agg(['sum','mean'])

#和上面一樣，只不過是重新命名了
group_n.agg([('rename_sum','sum'),('rename_mean','mean')])

#指定某一列使用某些函式,以字典形式傳入
group_n.agg({'sepal length (cm)':['mean','max'],'sepal width (cm)':'var'})

#使用匿名函式或者自定義函式
group_n.agg(lambda x:x.max()-x.min())

使用Pandas groupby連線來自多行的字串

PandasDataframe.groupby（）方法用於根據某些條件將資料分為幾組。分組的抽象定義是提供標籤到組名的對映。

Python科學計算之Pandas groupby、字串、索引高階操作

(2條訊息) Python科學計算之Pandas groupby、字串、索引高階操作_小叮噹的部落格-CSDN部落格

pandas之分組groupby()的使用整理與總結

前言在使用pandas的時候，有些場景需要對資料內部進行分組處理，如一組全校學生成績的資料，我們想通過班級進行分組，或者再對班級分組後的性別進行分組來進行分析，這時通過pandas下的groupby()函式就可以解決。在

pandas 的groupby()

groupby(): groupby函式可以將一個df根據某一列或者某幾列分組又或者是函式分組，經過groupby後悔生成一個groupby物件，該物件本身不會返回任何內容，只有當相應的方法被呼叫時才會起作用

pandas分組統計 - groupby詳解

資料分組分組統計 - groupby功能 ① 根據某些條件將資料拆分成組 ② 對每個組獨立應用函式 ③ 將結果合併到一個數據結構中

pandas DataFrame.groupby()所見的各種用法詳解

這篇文章主要介紹了DataFrame.groupby()所見的各種用法詳解，文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧

pandas之分組groupby學習筆記

技術標籤：pandas問題python 分組 In [1]: import numpy as np In [2]: import pandas as pd 一、分組模式及其物件

利用Pandas的groupby求站點氣溫月均值

技術標籤：pythonpandas 利用Pandas的groupby求站點氣溫月均值 # -*- coding: utf-8 -*- """

讀書記錄——pandas中的分組方法groupby（一）

技術標籤：人工智慧pythonpandas資料分析 pandas的group分組 1、第一個簡單案例 1）資料和依賴包準別

Pandas之groupby分組

釋義 groupby用來分組，呼叫groupby 之後返回pandas.core.groupby.generic.DataFrameGroupBy，其實就是由一個個格式為(key, 分組後的dataframe)的元組，組成的列表：

pandas中groupby的使用

pandas中groupby的使用一、緣由　　在爬取大量的資料之後，需要對資料進行分組的處理，於是就使用了groupby，但是我需要的並不是分組之後資料的聚合分析，我需要的是原生的某些資料。但是卻找不到網上的相關案例。

Pandas教程 | 超好用的Groupby用法詳解

在日常的資料分析中，經常需要將資料根據某個（多個）欄位劃分為不同的群體（group）進行分析，如電商領域將全國的總銷售額根據省份進行劃分，分析各省銷售額的變化情況，社交領域將使用者根據畫像（性別、年齡）進

深入理解和運用Pandas的GroupBy機制——理解篇

GroupBy是Pandas提供的強大的資料聚合處理機制，可以對大量級的多維資料進行透視，同時GroupBy還提供強大的apply函式，使得在多維資料中應用複雜函式得到複雜結果成為可能(這也是個人認為在實際業務分析中，資料量沒

✍ Pandas分組（GroupBy）- 轉載@初生不惑

概要任何分組(groupby)操作都涉及原始物件的以下操作之一。它們是分割物件應用一個函式

pandas速成筆記(3)-join/groupby操作

接上篇繼續，這回看下一些常用的操作：一、join 聯表查詢有資料庫開發經驗的同學，一定對sql中的join ... on 聯表查詢不陌生，pandas也有類似操作

盤點一道Pandas中分組聚合groupby()函式用法的基礎題

大家好，我是皮皮。一、前言前幾天在Python最強王者交流群有個叫【Chloé】的粉絲問了一個關於Pandas中groupby函式的問題，這裡拿出來給大家分享下，一起學習。

Python量化交易基礎講堂-用Pandas庫處理時間序列

《Python實戰-構建基於股票的量化交易系統》小冊子，雖然主要側重於 Python 實戰講解，但在內容設計上提供了前置基礎章節幫助讀者快速掌握基礎工具的使用，因此小冊適合的人群僅具備Python最基礎程式設計經驗即可。

JAVA8 STREAM COLLECT GROUPBY分組例項解析

這篇文章主要介紹了JAVA8 STREAM COLLECT GROUPBY分組例項解析,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

Python使用Pandas庫實現MySQL資料庫的讀寫

本次分享將介紹如何在Python中使用Pandas庫實現MySQL資料庫的讀寫。首先我們需要了解點ORM方面的知識

Python操作MySQL資料庫的兩種方式例項分析【pymysql和pandas】

本文例項講述了Python操作MySQL資料庫的兩種方式。分享給大家供大家參考，具體如下：

pandas 的groupby()

相關推薦