Pandas基礎 -- 1. 資料結構 Series
阿新 • • 發佈:2019-02-12
常用命名:
from pandas import Series, DataFrame
import pandas as pd
Series是一種類似於一維陣列的物件:
它由一組陣列(各種NumPy資料型別),以及一組與之相關的資料標籤組成。
1. 建立 Series
obj = Series([4,7,-5,3])
obj
表現為:索引在左邊,值在右邊。
如果沒有指定索引,會自動從0開始。
2. Series 屬性, values, index
可以通過Series的values和index屬性獲取其陣列表示形式和索引物件:
obj.values
obj.index
3. 建立Series, 帶有標記索引:
obj2 = Series([4,7,-5,3], index=['d','b','a','c'])
obj2
4. 通過索引的方式選取Series中的單個或一組值:
obj2['a']
obj2[['c','a','d']]
5. NumPy陣列運算會保留索引和值之間的連結
obj2[obj2 > 0]
obj2 * 2
6. 建立Series, 通過字典引數
如果只傳入一個字典,則結果Series中的索引就是原字典的鍵。
sdata = {'Ohio':35000, 'Texas':71000 , 'Oregon':16000, 'Utah':5000}
obj3 = Series(sdata)
當然也可以定義索引,但是如果不能匹配,所顯示結果為NaN
states = ['California', 'Ohio', 'Oregon', 'Texas']
obj4 = Series(sdata, index=states)
7. 算術運算,計算中會自動對齊不同索引的資料
obj3 + obj4
8. Series物件本身及其索引都有一個name屬性
obj4.name = 'population'
obj4.index.name = 'state'
obj4
9. Series的索引可以通過賦值的方式修改
obj.index = ['Bob', 'Steve', 'Jeff', 'Ryan']
obj