pandas 19 - 分層索引建立（MultiIndex）( tcy)

阿新 • • 發佈：2018-12-15

建立分層索引（MultiIndex）  2018/12/14

用途：在較低維度的資料結構中儲存和操作具有任意數量維度的資料1d或2d。

函式：

pd.MultiIndex.from_tuples(tuples, sortorder=None, names=None) # 將元組列表轉分層索引
  # 引數：tuples : list / tuple-每個元組都是一行/列的索引。sortorder : int or None
pd.MultiIndex.from_arrays(arrays, sortorder=None, names=None) # 陣列轉分層索引
  # 引數：list / array
pd.MultiIndex.from_product(iterables, sortorder=None, names=None)# 迭代轉分層索引(交叉迭代集)
  # 引數：list / sequence of iterables

例項：

例項1：
arrays = [['s1', 's1', 's2', 's2', 's3', 's3', 's4', 's4'],['ss1', 'ss2', 'ss1', 'ss2', 'ss1', 'ss2', 'ss1', 'ss2']]
tuples = list(zip(*arrays))# [('s1', 'ss1'),('s1', 'ss2'),('s2', 'ss1'),('s2', 'ss2'),('s3', 'ss1'),('s3', 'ss2'),('s4', 'ss1'),('s4', 'ss2')]

index = pd.MultiIndex.from_tuples(tuples, names=['first', 'second']) 

例項2：
arrays = [['s1', 's1', 's2', 's2', 's3', 's3', 's4', 's4'], ['ss1', 'ss2', 'ss1', 'ss2', 'ss1', 'ss2', 'ss1', 'ss2']]
index = pd.MultiIndex.from_arrays(arrays, names=('first', 'second')) 

例項3：#兩個迭代中的每個元素配對
iterables = [['s1', 's2', 's3', 's4'], ['ss1', 'ss2']]
index=pd.MultiIndex.from_product(iterables, names=['first', 'second'])

# MultiIndex(levels=[['s1', 's2', 's3', 's4'], ['ss1', 'ss2']],
# labels=[[0, 0, 1, 1, 2, 2, 3, 3], [0, 1, 0, 1, 0, 1, 0, 1]],names=['first', 'second'])

應用：

例項4：#用多層索引
s = pd.Series(np.arange(8), index=index)

例項5：#自動構建多層索引：將陣列列表直接傳遞給Series或DataFrame
arrays = [np.array(['s1', 's1', 's2', 's2', 's3', 's3', 's4', 's4']),
np.array(['ss1', 'ss2', 'ss1', 'ss2', 'ss1', 'ss2', 'ss1', 'ss2'])]
s = pd.Series(np.arange(8), index=arrays)
s.index.names=['first','second']

# first second
# s1 ss1       0
#    ss2       1
# s2 ss1       2
#    ss2       3
# s3 ss1       4
#    ss2       5
# s4 ss1       6
#    ss2       7
# dtype: int32

例項6： 
df = pd.DataFrame(np.arange(24).reshape(3, 8), index=['A', 'B', 'C'], columns=index)
'''''''''
first   s1      s2      s3      s4
second ss1 ss2 ss1 ss2 ss1 ss2 ss1 ss2
A       0   1   2   3   4   5   6   7
B       8   9  10  11  12  13  14  15
C      16  17  18  19  20  21  22  23
'''
pd.DataFrame(np.arange(36).reshape(6, 6), index=index[:6], columns=index[:6])
'''
first     s1      s2      s3 
second   ss1 ss2 ss1 ss2 ss1 ss2
first second 
s1    ss1  0  1   2   3   4   5
      ss2  6  7   8   9  10  11
s2    ss1 12 13  14  15  16  17
      ss2 18 19  20  21  22  23
s3    ss1 24 25  26  27  28  29
      ss2 30 31  32  33  34  35
'''

pandas 19 - 分層索引建立（MultiIndex）( tcy)

建立分層索引（MultiIndex） 2018/12/14 用途：在較低維度的資料結構中儲存和操作具有任意數量維度的資料1d或2d。函式： pd.MultiIndex.from_tuples(tuples, sortorder=None, names=None

函式索引建立（轉載）

mysql版本需要是5.7及以上版本才支援建立函式索引建立函式索引需要兩步 1.建立虛擬列 alter table t_log add column create_time_index datetime GENERATED ALWAYS AS (date_format(create_t

SQL Server 查詢效能優化——建立索引原則（一）

索引是什麼？索引是提高查詢效能的一個重要工具，索引就是把查詢語句所需要的少量資料新增到索引分頁中，這樣訪問資料時只要訪問少數索引的分頁就可以。但是索引對於提高查詢效能也不是萬能的，也不是建立越多的索引就越好。索引建少了，用WHERE子句找資料效率低，不利於查詢資料。索引建多

ES 建立索引設定（setting）基礎

1.建立索引 PUT /my_index { "settings": { ... any settings ... }, "mappings": { "type_one": { ... any mappings ... },

SQL Server 查詢性能優化——創建索引原則（二）

技術分享 dex ble 銷售得到 with 9.png ron 條件三：索引的建立原則　　一般來說，建立索引要看數據使用的場景，換句話來說哪些訪問數據的SQL語句是常用的，而這些語句是否因為缺少索引（也有可能是索引過多）變的效率低下。但絕不是所有的SQL語句都要建

SQL Server 全文索引介紹（轉載）

所在 ubd exec nchar 配置管理 system data ase 百度搜索概述全文引擎使用全文索引中的信息來編譯可快速搜索表中的特定詞或詞組的全文查詢。全文索引將有關重要的詞及其位置的信息存儲在數據庫表的一列或多列中。全文索引是一種特殊類型的基於標記的

pandas數據結構練習題（部分）

pandas font 對象匹配是否 sce mat 索引排序進行更多函數查閱http://pandas.pydata.org/pandas-docs/stable/10min.htmlimport pandas as pd#兩種數據結構from pandas im

「mysql優化專題」單表查詢優化的一些小總結，非索引設計（3）

flush src innodb atp show 優化 ase 驗證 where子句單表查詢優化：（關於索引，後面再開單章講解）（0）可以先使用 EXPLAIN 關鍵字可以讓你知道MySQL是如何處理你的SQL語句的。這可以幫我們分析是查詢語句或是表結構的性能瓶頸。

mysql性能優化之索引優化（轉）

形式字符串類 b樹索引基礎 var 開發 null -- mysql服務器作為免費又高效的數據庫，mysql基本是首選。良好的安全連接，自帶查詢解析、sql語句優化，使用讀寫鎖（細化到行）、事物隔離和多版本並發控制提高並發，完備的事務日誌記錄，強大的存儲引擎提供高效查

利用索引與不用索引區別（profiles）

數據庫區別 index 示例利用運行 creat create set 1、定義　　對數據庫表的一列或多列的值進行排序的一種結構(Btree方式)=(相當於二分查找法) 2、優點　　加快數據檢索速度 3、缺點　　1、占用物理存儲空間

python之pandas簡單介紹及使用（一）

dad all 就會能夠簡單的兩種 first 模型自己 python之pandas簡單介紹及使用（一）一、　　Pandas簡介1、Python Data Analysis Library 或 pandas 是基於NumPy 的一種工具，該工具是為了解決數據分析任

10月19日每日總結（補）+（一丟丟）字元數值概念

昨天好不容易把朗誦啥的事都搞完了，放鬆一下，有點過頭，所以20號補一下昨天的總結課本習題2： 1.已定義a為字元型變數，則下列語句中正確的是______ A.a=‘97’ B.a=“97” C.a=97 D.a=“a” 好不容易老師叫我一次，呵呵，我一開始選的A，沒想就去下一題了，丟人

pandas 常用清洗數據（一）

core pandas mean type book date axis csv strip 數據源獲取： https://www.kaggle.com/datasets 1、 Look at the some basic stats for the ‘imdb_sc

pandas讀取檔案踩坑（1）

查閱資料發現是檔案中存在linux無法讀取的字元’\r’即換行符加入引數lineterminator='\n',報錯如下加入引數error_bad_lines=False 報錯如下 Windows檢視猜測是檔案格式的問題，在windows 系統中ed

自主移動機器人的定位與地圖建立（SLAM）關鍵性問題

1.引言：機器人的研究越來越多的得到關注和投入，隨著計算機技術和人工智慧的發展，智慧自主移動機器人成為機器人領域的一個重要研究方向和研究熱點。移動機器人的定位和地圖建立是自主移動機器人領域的熱點研究問題。對於已知環境中的機器人自主定位和已知機器人位置的地圖建立已經有了一些實用的解決方法。然而在很

linux程序管理之程序建立（三）

在linux系統中，許多程序在誕生之初都與其父程序共同用一個儲存空間。但是子程序又可以建立自己的儲存空間，並與父程序“分道揚鑣”，成為與父程序一樣真正意義上的程序。 linux系統執行的第一個程序是在初始化階段“捏造出來的”。而此後的執行緒或程序都是由一個已存在的程序像細胞分裂一樣通過系統呼叫複

資料結構筆記：字串類的建立（下）

字串類中的常用成員函式成員函式功能描述 operator[](i) 操作符過載函式，訪問指定下標的字元 startWith(s) 判斷字串是否以s開頭 endO

資料結構筆記：字串類的建立（上）

歷史遺留問題 -C語言不支援真正意義上的字串 -C語言字元陣列和一組函式實現字串操作 -C語言不支援自定義型別，因此無法獲得字串型別從C到C++的進化過程引入了自定義型別在C++中可以通過類完成字串型別的定義字串類的實現 class String :

陣列類的建立（下）

建立StaticArray時，陣列的大小必須是明確指定的，是一種限制。全新的陣列類：DynamicArray使用時其物件代表的陣列的大小能夠動態的指定 1、DynamicArray設計要點類模板（任意時刻）動態確定內部陣列空間大小即儲存陣列的

19-SpringBoot之Redis（六）——Redis快取實現

SpringBoot之Redis（六）——Redis快取實現 1. 新增maven依賴 2. 引數配置 3. 實體類 4. Dao 5. Service 6. Controller 7. 原始碼下載 1. 新增m

pandas 19 - 分層索引建立（MultiIndex）( tcy)

相關推薦