pandas中的多級index操作

阿新 • • 發佈：2018-11-10

在pandas中可以為series和dataframe設定多個index，也就是說可以有多級index和column。這樣可以對pandas的操作更加靈活。

import numpy as np
import pandas as pd
from pandas import Series, DataFrame

np.random.seed(666)
# series 中的 index
s1 = Series(np.random.randn(6), index=[['1', '1', '1', '2', '2', '2'], ['a', 'b', 'c', 'a', 'b', 'c' 
]])
print(s1)
'''
1  a    0.824188
   b    0.479966
   c    1.173468
2  a    0.909048
   b   -0.571721
   c   -0.109497
dtype: float64
'''

print(s1['1']) # 可以 獲取 index 為 1 的 series
'''
a    0.824188
b    0.479966
c    1.173468
dtype: float64
'''

print(s1['1']['a']) # 0.8241880833175302

print(s1[:, 'a'])
''' 同樣是一個 series
1    0.824188
2    0.909048
dtype: float64
''' 


# 多級的Series， 可以轉化為一個 dataframe
df1 = s1.unstack() # 二級series 可以轉化dataframe
print(df1)
'''
          a         b         c
1  0.824188  0.479966  1.173468
2  0.909048 -0.571721 -0.109497
'''

df2 = DataFrame([s1['1'], s1['2']])
print(df2)
'''
          a         b         c
0  0.824188  0.479966  1.173468
1  0.909048 -0.571721 -0.109497
''' 


# dataframe 轉化為 series
s2 = df1.unstack()
print(s2)
'''
a  1    0.824188
   2    0.909048
b  1    0.479966
   2   -0.571721
c  1    1.173468
   2   -0.109497
dtype: float64
'''
s2 = df1.T.unstack()
print(s2)
'''
1  a    0.824188
   b    0.479966
   c    1.173468
2  a    0.909048
   b   -0.571721
   c   -0.109497
dtype: float64
'''

# 建立 一個 多級的 dataframe
df = DataFrame(np.arange(16).reshape(4, 4), index=[['a', 'a', 'b', 'b'], [1, 2, 1, 2]], \
               columns=[['beijing', 'beijing', 'shanghai', 'shanghai'], [8, 9, 8, 9]]
               )
print(df)
'''
    beijing     shanghai    
          8   9        8   9
a 1       0   1        2   3
  2       4   5        6   7
b 1       8   9       10  11
  2      12  13       14  15
'''

# 訪問 多級 dataframe 的元素
print(df['beijing']) # 返回 也是一個 dataframe
'''
      8   9
a 1   0   1
  2   4   5
b 1   8   9
  2  12  13
'''

print(df['beijing'][8]) # 訪問dataframe和訪問Series的方法一樣
'''
a  1     0
   2     4
b  1     8
   2    12
Name: 8, dtype: int64
'''

pandas中的多級index操作

在pandas中可以為series和dataframe設定多個index，也就是說可以有多級index和column。這樣可以對pandas的操作更加靈活。 import numpy as np import pandas as pd from pandas import Serie

python下的Pandas中DataFrame基本操作（一），基本函式整理

pandas作者Wes McKinney 在【PYTHON FOR DATA ANALYSIS】中對pandas的方方面面都有了一個權威簡明的入門級的介紹，但在實際使用過程中，我發現書中的內容還只是冰山一角。談到pandas資料的行更新、表合併等操作，一般用到的

機器學習三劍客之Pandas中DataFrame基本操作

com sys.path int del mean 基於絕對路徑 and bsp Pandas 是基於Numpy 的一種工具，是為了解決數據分析任務而創建的。Pandas 納入了大量庫和一些標準的數據模型，提供了高效地操作大型數據集所需的工具。Pandas提供了大量能使我

pandas中建立多級索引的方法

（1）方法一：使用pandas.MultiIndex.from_arrays() In [25]: pd.MultiIndex.from_arrays([['a', 'a', 'b', 'b'],[1, 2, 1, 2]]) Out[25]: MultiIndex(levels=[['a',

pandas中Series的多級索引

假設我們想分析2017年和2018年廣東，廣西，湖南的人口數。如果使用Series進行儲存的話，比較直接的方法如下： In[1]index = [('廣東',2017),('廣東',2018),('廣西', 2017),('廣西', 2018),('湖南',2017),('湖南', 201

pandas中DataFrame修改index、columns名的方法

一般常用的有兩個方法： 1、使用DataFrame.index = [newName]，DataFrame.columns = [newName]，這兩種方法可以輕鬆實現。 2、使用rename方法（推薦）： DataFrame.rename（mapper = None，index =

pandas中Series和Dataframe的排序操作

對pandas中的Series和Dataframe進行排序，主要使用sort_values()和sort_index()。 DataFrame.sort_values(by, axis=0, ascending=True, inplace=False, kind=‘quicksort’,

pandas中的map和replace操作

map可以做一個對映，對於操作大型的dataframe來說就非常方便了，而且也不容易出錯。replace的作用是替換，這個很好理解。 import numpy as np import pandas as pd from pandas import Series, DataFrame

【python學習筆記】39：認識SQLAlchemy,簡單操作Pandas中的DataFrame

學習《Python3爬蟲、資料清洗與視覺化實戰》時自己的一些實踐。認識SQLAlchemy SQLAlchemy是Python的ORM工具，就像Java有Hibernate一樣，實現關係型資料庫中的記錄與Python自定義Class的物件的轉化，實現操作之間的對映。

Python3學習（三十四）：python從mongo中取資料，使用pandas.DataFrame進行列操作並轉字典

使用該操作的具體場景（一般與mongo相結合）：比如mongo中存了幾萬條資料，需要將mongo中的資料取出來，並對其中的一列進行相關操作，最後轉化為字典格式。具體程式碼實現如下： import pandas as pd import pymongo import

python—pandas中DataFrame型別資料操作函式

python資料分析工具pandas中DataFrame和Series作為主要的資料結構. 本文主要是介紹如何對DataFrame資料進行操作並結合一個例項測試操作函式。 1）檢視DataFrame資料及屬性 df_obj = DataFrame() #建

python pandas中series與dataframe資料型別屬性及操作基礎

一）屬性 series ：.index,.values, .name,.index.name dataframe ：.columns, .index,.values 二）建立方法 ser

pandas中的apply函式對dataFrame操作

apply函式可以對dataFrame中的資料進行操作原始資料data：為了區分是對行操作的還是對列操作的，所以將index設定成了字母，將column是設定成了數字reshape（4,4）重新構造成4*4的矩陣對指定列元素進行操作：對指定行元素進行操作：對所有列進行操作：對

Pandas入門系列（八) -- 多級index

資料分析彙總學習 import numpy as np import pandas as pd from pandas import Series, DataFrame # 多級Series s

Pandas：多級索引的操作--調整順序、排序、彙總、指定列為索引

import numpy as np import pandas as pd from pandas import Series,DataFrame df = DataFrame(np.arange(1

pandas中基本操作——如缺失值處理。等

# =====替換缺失值=== data[data.isnull()] = 0 data.fillna(0,inplace=True) #====25% 和75%=== sta = data['A_sale'].describe() #.describe(

pandas中pd.read_excel()方法中的converters參數

exc 對象實現編碼類型 div spa 方法情況最近用pandas的pd.read_excel()方法讀取excel文件時，遇到某一列的數據前面包含0（如010101）的時候，pd.read_excel()方法返回的DataFrame會將這一列視為int類型，即

【Oracle】Oracle中的常用操作

轉換成 sql查詢語句 sub 備份關系 %d des 統計分析 put 一、ORACLE的啟動和關閉 1、在單機環境下要想啟動或關閉ORACLE系統必須首先切換到ORACLE用戶，如下 su - oracle a、啟動ORACLE系統 oracle>svrmgr

數據框中的基本操作

sta http mage wan img 一行 ati 技術 cnblogs 1.加列名 2.subset某一列 subset函數的應用：http://blog.163.com/jiaqiang_wang/blog/static/1188961532015830018

JQuery中的Dom操作和事件

表單 lba app 選擇 ava return server pen log （一）JQuery中的事件 1.常規事件，把js事件中的on去掉　　復合事件：hover(function(){},function(){}) ---- 相當於把鼠標移入移出事件和在一起執行

pandas中的多級index操作

相關推薦