pandas中Series的多級索引

阿新 • • 發佈：2018-11-03

假設我們想分析2017年和2018年廣東，廣西，湖南的人口數。如果使用Series進行儲存的話，比較直接的方法如下：

In[1]index = [('廣東',2017),('廣東',2018),('廣西', 2017),('廣西', 2018),('湖
南',2017),('湖南', 2018)]

In[2]populations = [3387964,658964,
                458752,698256,
                125874,658963]

In[3]pop = pd.Series(populations, index=index)
In[4]pop
out[0]
(廣東, 2017)    3387964
(廣東, 2018)     658964
(廣西, 2017)     458752
(廣西, 2018)     698256
(湖南, 2017)     125874
(湖南, 2018)     658963
dtype: int64

通過切片獲取資料：

In [9]: pop[('廣東',2017):('廣西', 2017)]
Out[9]:
(廣東, 2017)    3387964
(廣東, 2018)     658964
(廣西, 2017)     458752
dtype: int64

但是這種做法不方便，假設我想獲取2017年這三個省份的人口數，不得不採用複雜的辦法：

In [12]: pop[[i for i in pop.index if i[1]==2017]]
Out[12]:
(廣東, 2017)    3387964
(廣西, 2017)     458752
(湖南, 2017)     125874
dtype: int64

這麼做雖然也能達到所要的結果，但是與pandas讓人崇拜又喜歡的切片相比，這種做法不夠簡潔、直觀。而多級索引可以解決這個問題：

我們使用pandas中MultiIndex建立多級索引：

In [13]: index = pd.MultiIndex.from_tuples(index)

In [14]: index
Out[14]:
MultiIndex(levels=[['廣東', '廣西', '湖南'], [2017, 2018]],
           labels=[[0, 0, 1, 1, 2, 2], [0, 1, 0, 1, 0, 1]])

MultiIndex裡有一個標籤表示索引的等級，

於是我們將前面建立的pop的索引重置：

In [15]: pop = pop.reindex(index)

In [16]: pop
Out[16]:
廣東  2017    3387964
    2018     658964
廣西  2017     458752
    2018     698256
湖南  2017     125874
    2018     658963
dtype: int64

如上圖所示，其中前兩列表示多級索引，第三列是資料。此時，我們可以通過切片很方便的獲取2017的人口數：

In [17]: pop[:,2017]
Out[17]:
廣東    3387964
廣西     458752
湖南     125874
dtype: int64

注意到沒有，其實上面的pop完全可以用一個表格來表示，也就是轉換成一個DataFrame：

In [18]: pop_df = pop.unstack()
Out[18]:pop_df
       2017    2018
廣東  3387964  658964
廣西   458752  698256
湖南   125874  658963

與unstack()相反的操作是stack()：

In [22]: pop_df.stack()
Out[22]:
廣東  2017    3387964
    2018     658964
廣西  2017     458752
    2018     698256
湖南  2017     125874
    2018     658963
dtype: int64

pandas中建立多級索引的方法

（1）方法一：使用pandas.MultiIndex.from_arrays() In [25]: pd.MultiIndex.from_arrays([['a', 'a', 'b', 'b'],[1, 2, 1, 2]]) Out[25]: MultiIndex(levels=[['a',

pandas中Series的多級索引

假設我們想分析2017年和2018年廣東，廣西，湖南的人口數。如果使用Series進行儲存的話，比較直接的方法如下： In[1]index = [('廣東',2017),('廣東',2018),('廣西', 2017),('廣西', 2018),('湖南',2017),('湖南', 201

pandas中的多級index操作

在pandas中可以為series和dataframe設定多個index，也就是說可以有多級index和column。這樣可以對pandas的操作更加靈活。 import numpy as np import pandas as pd from pandas import Serie

pandas中Series()和DataFrame()的區別與聯絡

區別： series，只是一個一維資料結構，它由index和value組成。 dataframe，是一個二維結構，除了擁有index和value之外，還擁有column。聯絡： dataframe由多個series組成，無論是行還是列，單獨拆分出來都是一個series。程式碼演示：

pandas中Series和Dataframe的排序操作

對pandas中的Series和Dataframe進行排序，主要使用sort_values()和sort_index()。 DataFrame.sort_values(by, axis=0, ascending=True, inplace=False, kind=‘quicksort’,

pandas中dataframe的索引使用和轉換為array

#!/usr/bin/env python3 # -*- coding: utf-8 -*- """ Created on Tue Nov 6 23:44:54 2018 @author: lilong """ import pandas as pd import numpy as

Pandas中Series用法總結

Series：帶標籤的陣列本文對Pandas包中的一維資料型別Series特點及用法進行了總結歸納。 2.1 如何建立Sereis #匯入Pandas包 import pandas as pd #建立Series #1.1.1 通過列表List listSer=pd.Se

Pandas 中的四中索引方式詳解

Pandas 中的四中索引方式詳解總結 Pandas 中的四中索引方式詳解第一次使用pandas 對於其中的Series 和DataFrame 的索引弄暈了

python pandas中series與dataframe資料型別屬性及操作基礎

一）屬性 series ：.index,.values, .name,.index.name dataframe ：.columns, .index,.values 二）建立方法 ser

pandas中Series陣列建立方法

import numpy as np import pandas as pd ar = np.random.rand(5) # s = pd.Series(ar) s = pd.Series(ar, index = list("abcde")) print(s) print(type(s)

numpy中的ndarray與pandas的Series和DataFrame之間的區別

在資料分析中，經常涉及numpy中的ndarray物件與pandas的Series和DataFrame物件之間的轉換，讓大家產生困惑。本文將簡單介紹這三種資料型別，並以股票資訊為例，給出相關物件之間轉換的具體示例。 ndarray陣列物件 NumPy中的ndarray是一個多維陣列物件，該物

03 -1 pandas 中 DataFrame理解與建立、索引、運算的詳解以及例項

DataFrame DataFrame是一個【表格型】的資料結構，可以看做是【由Series組成的字典】（共用同一個索引）。DataFrame由按一定順序排列的多列資料組成。設計初衷是將Series的使用場景從一維拓展到多維。DataFrame既有行索引，也有列索引。行索引

Cris 的 Python 資料分析筆記 07：Pandas 中的 Series 資料結構

文章目錄 1. DataFrame 和 Series 關係 2. 新建 Series 資料結構（key 和 value） 3. Series 的排序 4. 區間求值 5. 根據 in

pandas中的資料物件Series

pandas 的資料物件 Series 概要用pandas 有一段時間，很少去總結，這篇文章簡單總結一些 pandas 中series 的一些常用方法，如果有更多的需要，可以查詢官方文件. series官方文件構造一個series 物件 import nu

pandas中層次化索引與切片

Pandas層次化索引 1. 建立多層索引隱式索引：常見的方式是給dataframe建構函式的index引數傳遞兩個或是多個數組 Series也可以建立多層索引 Series多層索引 B =Series(np.random.randint(0,150,

Pandas：多級索引的操作--調整順序、排序、彙總、指定列為索引

import numpy as np import pandas as pd from pandas import Series,DataFrame df = DataFrame(np.arange(1

python中pandas的series合併

1234567891011121314In [3]: import pandas as pdIn [4]: a = pd.Series([1,2,3])In [5]: b = pd.Series([2,3,4])In [6]: c = pd.DataFrame([a,b])I

mysql中查看索引是否被使用到

and 索引沒有 object format mysq count perf type http://blog.sina.com.cn/s/blog_5037eacb0102vm5c.html 官方MySQL中查看索引是否被使用到：在percona版本或marida

pandas中pd.read_excel()方法中的converters參數

exc 對象實現編碼類型 div spa 方法情況最近用pandas的pd.read_excel()方法讀取excel文件時，遇到某一列的數據前面包含0（如010101）的時候，pd.read_excel()方法返回的DataFrame會將這一列視為int類型，即

mysql中能夠使用索引的典型場景

from select bsp 字段 -1 mysq and cnblogs 前綴 mysql 演示數據庫：http://downloads.mysql.com/docs/sakila-db.zip 匹配全值 explain select * from rental

pandas中Series的多級索引

相關推薦