pandas查詢某個欄位下的基本資訊
阿新 • • 發佈:2021-01-07
以一個music表為例,查詢音樂類別分別有多少個,佔比是多少,有哪幾種genre,總共有幾種
1.首先查詢每中音樂類別的數量
方法一:以一個music的表格為例,values_count()是series的argument
import pandas as pd
music=pd.read_csv('music.csv')
music['music genre'].value_counts()
結果如下
方法二:用groupby把資料按照gender分類,輸出count()
不推薦 沒有必要這時候用
import pandas as pd
music= pd.read_csv('music.csv')
music.groupby('music genre')['music genre'].count()
效果一樣:
這裡相當與sql中的
select music_genre,count(*)
from music
group by music_genre
grouppby的正確使用場合:根據genre分類 查詢每個分類下的最大年齡
import pandas as pd
music=pd.read_csv('music.csv')
music.groupby('music genre')['age'].max()
輸出結果如下:
2.查詢每個genre的佔比
import pandas as pd
music=pd.read_csv('music.csv')
music['music genre'].value_counts(normalize=True)
輸出結果(結果為float64):
3.查詢有哪幾種genre
unique()
4.查詢總共有多少genre
nuinque()
5. crosstab
相每種音樂風格下 各個年齡段的人的個數
相當於透視表的row是genre,col是age
pd.crosstab(music['music genre'],music.age)