pandas20 層次化索引與切片- 選擇(tcy)

阿新 • • 發佈：2018-12-15

層次化索引選擇 2018/12/15

1.總結：以2個層次標籤為例說明

obj[(label,label)]/obj.loc[(label,label)] #label為單個標籤，標籤切片，標籤列表；注1
obj[(loc,loc)]/obj.iloc[(loc,loc)]        #loc為int,int切片； 注1
obj[bool_vec] #bool陣列選擇
s.a1.b1       #注2
df.C1.D1
s.get(label)  #label為最外層標籤，為單標籤或標籤列表
df.get(label) #label為最外層列標籤，為單標籤或標籤列表

注1：有幾層就有幾個引數，從前向後依次為第一層，第二層，...
注2：從最外層依次向內取，有幾層就有幾個'.'

2.例項：序列

iterables = [['a1', 'a2', 'a3'], ['b1', 'b2','b3']]
index=pd.MultiIndex.from_product(iterables2, names=['N1', 'N2'])
s = pd.Series(np.arange(9), index=index2)

s['a1'] , s.loc['a1']     #選擇第1,2,3行資料
s['a1':'a2']              #選擇第1...6行資料
s[['a1','a2']]            #選擇第1...6行資料
s[('a1','b1'):('a1','b1')]#0
s[('a1','b1'):('a1','b2')]#選擇第1,2行資料
s[2],s.iloc[2]      #2
s[2:5]              #2,3,4#選擇第3,4,5行資料
s[s<3] , s.loc[s<3] #選擇第1,2,3行資料
s.a1                #選擇第1,2,3行資料
s.a1.b1             #0
s.get('[a1','a2'])  #選擇第1...6行資料
s[:,'b1']           #0,3,6

# 層次化索引在資料重塑和基於分組的操作（如透視表生成）中扮演重要角色。

(s.unstack().stack()==s).all()#True
s.unstack()

# b1 b2 b3
# a1 0 1 2
# a2 3 4 5
# a3 6 7 8

3.資料幀：

iter_rows = [['a1', 'a2', 'a3'], ['b1', 'b2','b3']]
iter_columns = [['C1', 'C2', 'C3'], ['D1', 'D2','D3']]
index_row=pd.MultiIndex.from_product(iter_rows, names=['RN1', 'RN2'])
index_col =pd.MultiIndex.from_product(iter_columns, names=['CN1', 'CN2'])

df = pd.DataFrame(np.arange(81).reshape((9,9)), index=index_row, columns=index_col)

# CN1      C1       C2       C3
# CN2      D1 D2 D3 D1 D2 D3 D1 D2 D3
# RN1 RN2
# a1 b1    0 1  2   3  4  5  6  7  8
#    b2    9 10 11  12 13 14 15 16 17
#    b3   18 19 20  21 22 23 24 25 26
# a2 b1   27 28 29  30 31 32 33 34 35
#    b2   36 37 38  39 40 41 42 43 44
#    b3   45 46 47  48 49 50 51 52 53
# a3 b1   54 55 56  57 58 59 60 61 62
#    b2   63 64 65  66 67 68 69 70 71
#    b3   72 73 74  75 76 77 78 79 80

例項1：

df[0:2]                       #選取第1,2行
df['a2':'a2']                 #選取(a2,b1- b3) 3行
df[('a2','b1'):('a2','b1')]   #選取(a2,b1) 1行
df[('a2','b1'):('a2','b2')]   #選取(a2,b1) , (a2,b2) 2行
df[('C2','D1')]               #選取(C2,D1) 1列
df[[('C2','D1'),('C2','D2')]] #選取(C2,D1),(C2,D2) 2列

df[('a2','b3'):('a3','b2')][[('C2','D1'),('C3','D2')]]#選取行列

# CN1     C2 C3
# CN2     D1 D2
# RN1 RN2
# a2 b3   48 52
# a3 b1   57 61
#    b2   66 70

例項2：

df.loc['a2']                       #選取(a2,b1- b3) 3行
df.loc[('a2','b1')]                #選取(a2,b1) 1行
df.loc[[('a2','b1'),('a2','b2')]]  #選取(a2,b1) , (a2,b2) 2行
df.loc[:,'C2']                     #選取(C2,D1-D3) 3列
df.loc[:,[('C2','D1'),('C2','D2')]]#選取(C2,D1-D2) 2列
df.loc[:,('C2','D1')]              #選取(C2,D1) 1列
df.loc[('a1','b1'),('C2','D1')]    #選取行列 =3
df.loc[[('a1','b1'),('a1','b2')],('C2','D1')]#選取行列

# RN1  RN2
# a1     b1      3
#        b2     12
# Name: (C2, D1), dtype: int32

例項3：

df.iloc[1]          #選取(a1,b2) 1行
df.iloc[[1,2]]      #選取(a1,b2-b3) 2行
df.iloc[:,1]        #選取(C1,D2) 1列
df.iloc[:,[1,2]]    #選取(C1,D2-D3) 2列
df.iloc[[1,2],[1,2]]#選取行列

# CN1    C1
# CN2    D2 D3
# RN1 RN2
# a1 b2  10 11
#    b3  19 20

例項4：

df.iat[1,2]        #選取第2行第3列數值=11
df.C1.D1           #選取第一列
df.get(('C1','D1'))#選取第一列
df.get('C1')       #選取第1,2,3列

pandas20 層次化索引與切片- 選擇(tcy)

層次化索引選擇 2018/12/15 1.總結：以2個層次標籤為例說明 obj[(label,label)]/obj.loc[(label,label)] #label為單個標籤，標籤切片，標籤列表；注1 obj[(loc,loc)]/obj.iloc[(loc,loc)]

pandas中層次化索引與切片

Pandas層次化索引 1. 建立多層索引隱式索引：常見的方式是給dataframe建構函式的index引數傳遞兩個或是多個數組 Series也可以建立多層索引 Series多層索引 B =Series(np.random.randint(0,150,

03 -3 pandas 層次化索引（隱式構造，顯示構造）、多層列索引、多層索引物件的索引與切片操作（Series的操作，DataFrame的操作）

pandas層次化索引多級索引包括: 多級行索引和多級列索引 1. 建立多層行索引 1) 隱式構造最常見的方法是給DataFrame建構函式的index引數傳遞兩個或更多的陣列 Series也可以建立多層索引 import numpy as np

pandas 6 - 索引切片選擇( tcy)

索引切片選擇 2018/12/3 2018/12/14 1.Series選擇：操作句法例項結果說明

列表(索引與切片，增刪改查) ，計數，排序，元祖和元祖的嵌套

元素 col 切片 ack list 升序不能 height pen 1.列表 1.列表相比於字符串. 不限制數據類型. 而且可以存放大量的數據　 2.表示方式： [] 方括號中的每一項都要逗號隔開　　3.列表和字符串一樣，也有索引與切片常用功

索引與切片運算符重載

作用 col get 屬性 pan () tar 定義 code 索引和切片運算符的重載　　方法名運算符和表達式說明　　__getitem__(self, i) x = self[i] 索引/切片取值　　_

02 ndarray的屬性、ndarray的基本操作（索引、切片、變形、連線、切分、副本）、聚合操作、矩陣操作、排序、Panda資料結構、Series建立、索引與切片、屬性與方法、運算

二、ndarray的屬性 4個必記引數： ndim：維度 shape：形狀（各維度的長度） size：總長度 dtype：元素型別 import matplotlib.pyplot as plt ndarr = plt.imread("./jin.png") plt.

str及list的索引與切片

#------------字串的索引與切片---------------# s = 'ABCDLSESRE' #索引 s1 = s[1] #正向取，從0開始計數 print(s1) s2 = s[-1] #負向取，從-1開始倒數 print(s2) # 切片，前閉後開區間 s3 = s[0:

python -- 序列索引與切片的一些問題

python核心程式設計，第六章6.1.2中有一節是切片的更多內容，有這樣一個例子：有這麼一個問題：有一個字串，我們想通過一個迴圈按照這樣的形式顯示它：每次都把位於最後的一個字元砍掉，這個問題的核心在於，如何在迴圈切片操作的第一次，把最後一個元素保留下來，兩種解決方

3.3Python數據處理篇之Numpy系列(三)---數組的索引與切片

數組 rip 多維分享 href 多維數組逗號 ada 一維數組目錄（一）數組的索引與切片 1.說明： 2.實例：（二）多維數組的索引與切片

python—索引與切片總結

pan spa col mage 掌握 src 位置字符串 png python中索引與切片的熟練掌握對於字符串的操作很有幫助，梳理如下：（1）索引 S = ‘hello world‘ 1）正向索引正向索引從0開始，向右依次遞增。 2）反

關於groupby與層次化索引的聯絡和層次化標籤的使用

groupby出來物件並不是dataFrame，所以直接print是看不到矩陣或者高維矩陣的，所以需要用能夠產生標量值的方法去處理groupby物件，這樣可以利用矩陣形式處理高維資料；這樣groupby在產生標量值資料後就變成了dataFrame物件，這個過程也可以用apply或者applymap完成，但

NumPy學習(索引和切片，合並，分割，copy與deep copy)

light 共享數據訪問展開 -a class 是把第一個 text NumPy學習(索引和切片，合並，分割，copy與deep copy) 目錄索引和切片合並分割copy與deep copy 　　索引和切片通過索引和切片可以訪問以及修改

mysql-索引與優化

是否這就是位置 ica 函數行為不支持 size 空值寫在前面：索引對查詢的速度有著至關重要的影響，理解索引也是進行數據庫性能調優的起點。考慮如下情況，假設數據庫中一個表有10^6條記錄，DBMS的頁面大小為4K，並存儲100條記錄。如果沒有索引，查詢將對整個表進

MySQL中使用索引與不使用索引的區別

pan 並發並發數 table def ring primary innodb zab 為了回答索引對數據庫性能的影響，做了一次簡單的實驗。測試環境　　 MySQL 5.7.10 innodb 100萬隨機數據表結構 CREATE TABLE `

【轉】聚簇索引與非聚簇索引的區別

聚集 lin 處理更新檢查 ref 末尾滿足實現通常情況下，建立索引是加快查詢速度的有效手段。但索引不是萬能的，靠索引並不能實現對所有數據的快速存取。事實上，如果索引策略和數據檢索需求嚴重不符的話，建立索引反而會降低查詢性能。因此在實際使用當中，應該充分考慮到索引

html class選擇器與id選擇器

spa 寫法錯誤一個 html nbsp 元素 -s cnblogs class選擇器： <p class="p1"> .p1{ color:red; ..... } id選擇器: <p id="p2"> #p1{

Css 後代選擇器與子代選擇器的區別

javascrip width 沒有什麽 for -1 adding 選擇器 light 後代選擇器用空格，比如A B｛border:1px solid red;｝子代選擇器用>, 比如A>B｛border:1px solid red;｝但是，如果你仔

文章匯總索引與內容簡介

索引所有文章索引與內容簡介，點擊文章名就可以跳到該文章頁面。索引描述Python練習（一）給一個不超過5位的正整數，判斷其有幾位，依次打印個、十、百、千、萬位的數字Python練習（二）打印n邊長的正方形Python練習（三）求100內的素數Python練習（四）求100內所有奇數和偶數的和Python練習（

pandas層次化索引

() 方法 code 對象索引對象最小 lis taf 無法 1. 創建多層行索引 1) 隱式構造最常見的方法是給DataFrame構造函數的index參數傳遞兩個或更多的數組 Series也可以創建多層

pandas20 層次化索引與切片- 選擇(tcy)

相關推薦