1. 程式人生 > >Pandas基礎 -- 1. 資料結構 Series

Pandas基礎 -- 1. 資料結構 Series

常用命名:

from pandas import Series, DataFrame
import pandas as pd

Series是一種類似於一維陣列的物件:
它由一組陣列(各種NumPy資料型別),以及一組與之相關的資料標籤組成。

1. 建立 Series

obj = Series([4,7,-5,3])
obj

這裡寫圖片描述
表現為:索引在左邊,值在右邊。
如果沒有指定索引,會自動從0開始。

2. Series 屬性, values, index
可以通過Series的values和index屬性獲取其陣列表示形式和索引物件:

obj.values
obj.index

這裡寫圖片描述

3. 建立Series, 帶有標記索引:

obj2 = Series([4,7,-5,3], index=['d','b','a','c'])
obj2

這裡寫圖片描述

4. 通過索引的方式選取Series中的單個或一組值:

obj2['a']
obj2[['c','a','d']]

5. NumPy陣列運算會保留索引和值之間的連結

obj2[obj2 > 0]
obj2 * 2

這裡寫圖片描述

6. 建立Series, 通過字典引數
如果只傳入一個字典,則結果Series中的索引就是原字典的鍵。

sdata = {'Ohio':35000, 'Texas':71000
, 'Oregon':16000, 'Utah':5000} obj3 = Series(sdata)

這裡寫圖片描述

當然也可以定義索引,但是如果不能匹配,所顯示結果為NaN

states = ['California', 'Ohio', 'Oregon', 'Texas']
obj4 = Series(sdata, index=states)

這裡寫圖片描述

7. 算術運算,計算中會自動對齊不同索引的資料

obj3 + obj4

這裡寫圖片描述

8. Series物件本身及其索引都有一個name屬性

obj4.name = 'population'
obj4.index.name = 'state'
obj4

這裡寫圖片描述

9. Series的索引可以通過賦值的方式修改

obj.index = ['Bob', 'Steve', 'Jeff', 'Ryan']
obj

這裡寫圖片描述