1. 程式人生 > 其它 >pandas查詢某個欄位下的基本資訊

pandas查詢某個欄位下的基本資訊

技術標籤:pandas資料分析

以一個music表為例,查詢音樂類別分別有多少個,佔比是多少,有哪幾種genre,總共有幾種

1.首先查詢每中音樂類別的數量

方法一:以一個music的表格為例,values_count()是series的argument

import pandas as pd
music=pd.read_csv('music.csv')
music['music genre'].value_counts()

結果如下
在這裡插入圖片描述

方法二:用groupby把資料按照gender分類,輸出count()

不推薦 沒有必要這時候用

import pandas as pd
music=
pd.read_csv('music.csv') music.groupby('music genre')['music genre'].count()

效果一樣:
在這裡插入圖片描述

這裡相當與sql中的

select music_genre,count(*from music
group by music_genre

grouppby的正確使用場合:根據genre分類 查詢每個分類下的最大年齡

import pandas as pd
music=pd.read_csv('music.csv')
music.groupby('music genre')['age'].max()

輸出結果如下:
在這裡插入圖片描述

2.查詢每個genre的佔比

import pandas as pd
music=pd.read_csv('music.csv')
music['music genre'].value_counts(normalize=True)

輸出結果(結果為float64):在這裡插入圖片描述

3.查詢有哪幾種genre

unique()
在這裡插入圖片描述

4.查詢總共有多少genre

nuinque()
在這裡插入圖片描述

5. crosstab

相每種音樂風格下 各個年齡段的人的個數
相當於透視表的row是genre,col是age

pd.crosstab(music['music genre'],music.age)

在這裡插入圖片描述