1. 程式人生 > >DataFrame.groupby()函式

DataFrame.groupby()函式

  • 用二維列表構造原始資料
1 import pandas as pd
2 
3 data = [['li', 'math', 100], ['bob', 'pe', 99], ['sar', 'english', 98], ['li', 'pe', 89]]
  • 將資料轉換成DataFrame型別
1 import pandas as pd
2 
3 dataFrame = pd.DataFrame(dada, columns = ['name', 'course', 'score']) # columns 為列名
  • 列印dataFrame物件

  • 此時不能根據行號索引,但是可以根據列名索引
1 import pandas as pd
2 
3 print(dataFrame[0])

1 import pandas as pd
2 
3 print(dataFrame["name"]) 

  • 此時的dataFrame["name"] 是一個類似於一位陣列的series物件,可根據下標索引
1 import pandas as pd
2 
3 print(dataFrame["name"])
4 print(type(dataFrame["name"]))
5 print(dataFrame["
name"][0])

 

  • 像字典一樣用索引建立新列 dataFrame["age"]
1 import pandas as pd
2 
3 dataFrame["age"] = [23, 24, 25, 23]
4 print(dataFrame)

 

  • 重點來了,dataFrame.groupby("name")根據name屬性分組,name列資料項預設成為索引
1 import pandas as pd
2 
3 dataFrame = dataFrame.groupby(["name", "course"])["score
"].sum() # 可以通過as_index指定分組項要不要成為索引, 預設為True 4 print(dataFrame)
5 print(dataFrame["li"])