1. 程式人生 > 其它 >爬蟲與Python:(四)爬蟲進階擴充套件之Pandas——3.資料結構Series

爬蟲與Python:(四)爬蟲進階擴充套件之Pandas——3.資料結構Series

1. 定義

Pandas Series 類似表格中的一個列(column),類似於一維陣列,可以儲存任何資料型別。

Series 由索引(index)和列組成,函式如下:

pandas.Series( data, index, dtype, name, copy)

2. 引數

引數 說明
data 一組資料(ndarray 型別)
index 資料索引標籤,如果不指定,預設從 0 開始
dtype 資料型別,預設會自己判斷
name 設定名稱
False 拷貝資料,預設為 False

3. 例項

3.1 簡單例項方法

1 import pandas as pd
2 3 a = [1, 2, 3] 4 myvar = pd.Series(a) 5 print(myvar)

輸出結果如下:

從上圖可知,如果沒有指定索引,索引值就從 0 開始,我們可以根據索引值讀取資料:

1 import pandas as pd
2 
3 a = [1, 2, 3]
4 myvar = pd.Series(a)
5 print(myvar[1])

輸出結果為: 2

3.2 指定索引值

我們可以指定索引值。例如,將原例子的[1,2,3]替換為[x,y,z]。

1 import pandas as pd
2 
3 a = ["Google", "Runoob"
, "Wiki"] 4 myvar = pd.Series(a, index = ["x", "y", "z"]) 5 print(myvar)

只是,可以根據索引來讀取:

1 import pandas as pd
2 
3 a = ["Google", "Runoob", "Wiki"]
4 myvar = pd.Series(a, index = ["x", "y", "z"])
5 print(myvar["y"])

輸出結果為:Runoob

3.3 用物件來建立Series

我們也可以使用 key/value 物件,類似字典來建立 Series。

1 import pandas as pd
2 3 sites = {1: "Google", 2: "Runoob", 3: "Wiki"} 4 myvar = pd.Series(sites) 5 print(myvar)

輸出結果如下:

從以上圖可知,字典的“key”變成了索引值。

如果我們只需要字典中的一部分資料,只需要指定需要資料的索引即可,如下例項:

1 import pandas as pd
2 
3 sites = {1: "Google", 2: "Runoob", 3: "Wiki"}
4 myvar = pd.Series(sites, index = [1, 2])
5 print(myvar)

輸出結果為:

3.4 設定Series引數名稱

1 import pandas as pd
2 
3 sites = {1: "Google", 2: "Runoob", 3: "Wiki"}
4 myvar = pd.Series(sites, index = [1, 2], name="RUNOOB-Series-TEST" )
5 print(myvar)

執行結果如下:

4. 參考網址

有志者,事竟成,破釜沉舟,百二秦關終屬楚; 苦心人,天不負,臥薪嚐膽,三千越甲可吞吳。