python-pandas的基本用法11

阿新 • • 發佈：2019-02-13

pandas的基本用法11-層次化索引

# -*- coding: utf-8 -*- 

import numpy as np
from pandas import Series, DataFrame, MultiIndex

print 'Series的層次索引'
data = Series([1,3,56,2,88, 32,43,12,65,90],
              index = [['a', 'a', 'a', 'b', 'b', 'b', 'c', 'c', 'd', 'd'],
                       [1, 2, 3, 1, 2, 3, 1, 2, 2, 3]])


print data
# a  1     1
#    2     3
#    3    56
# b  1     2
#    2    88
#    3    32
# c  1    43
#    2    12
# d  2    65
#    3    90
print data.index
# [a  1,    2,    3, b  1,    2,    3, c  1,    2, d  2,    3]
print data[:2]
# a  1    1
#    2    3
print data.unstack()
#     1   2   3
# a   1   3  56
# b   2  88  32
# c  43  12 NaN
# d NaN  65  90
print data.unstack().stack()
# a  1     1
#    2     3
#    3    56
# b  1     2
#    2    88
#    3    32
# c  1    43
#    2    12
# d  2    65
#    3    90

print 'DataFrame的層次索引'
frame = DataFrame(np.arange(12).reshape((4, 3)),
                  index = [['a', 'a', 'b', 'b'], [1, 2, 1, 2]],
                  columns = [['Ohio', 'Ohio', 'Colorado'], ['Green', 'Red', 'Green']])

print frame
#       Ohio       Colorado
#      Green  Red     Green
# a 1      0    1         2
#   2      3    4         5
# b 1      6    7         8
#   2      9   10        11
frame.index.names = ['key1', 'key2']
frame.columns.names = ['state', 'color']
print frame
# key1 key2                      
# a    1         0    1         2
#      2         3    4         5
# b    1         6    7         8
#      2         9   10        11

print frame.ix['a', 1]
# state     color
# Ohio      Green    0
#           Red      1
# Colorado  Green    2
print frame.ix['a', 2]['Colorado']
# color
# Green    5
print frame.ix['a', 2]['Ohio']['Red']
# 4
print '直接用MultiIndex建立層次索引結構'
print MultiIndex.from_arrays([['Ohio', 'Ohio', 'Colorado'], ['Gree', 'Red', 'Green']],
                             names = ['state', 'color'])

print '索引層級交換'
frame_swapped = frame.swaplevel('key1', 'key2')
print frame_swapped
# state       Ohio       Colorado
# color      Green  Red     Green
# key2 key1                      
# 1    a         0    1         2
# 2    a         3    4         5
# 1    b         6    7         8
# 2    b         9   10        11
print frame_swapped.swaplevel(0, 1) #也可以這樣寫
# state       Ohio       Colorado
# color      Green  Red     Green
# key1 key2                      
# a    1         0    1         2
#      2         3    4         5
# b    1         6    7         8
#      2         9   10        11

print '根據索引排序'
print frame.sortlevel('key2')
# state       Ohio       Colorado
# color      Green  Red     Green
# key1 key2                      
# a    1         0    1         2
# b    1         6    7         8
# a    2         3    4         5
# b    2         9   10        11
print frame.swaplevel(0, 1).sortlevel(0)
# state       Ohio       Colorado
# color      Green  Red     Green
# key2 key1                      
# 1    a         0    1         2
#      b         6    7         8
# 2    a         3    4         5
#      b         9   10        11

print '根據指定的key計算統計資訊'
print frame.sum(level = 'key2')
# state   Ohio       Colorado
# color  Green  Red     Green
# key2                       
# 1          6    8        10
# 2         12   14        16

print '使用列生成層次索引'
frame = DataFrame({'a':range(7),
                   'b':range(7, 0, -1),
                   'c':['one', 'one', 'one', 'two', 'two', 'two', 'two'],
                   'd':[0, 1, 2, 0, 1, 2, 3]})
print frame
#  a  b    c  d
# 0  0  7  one  0
# 1  1  6  one  1
# 2  2  5  one  2
# 3  3  4  two  0
# 4  4  3  two  1
# 5  5  2  two  2
# 6  6  1  two  3
print frame.set_index(['c', 'd'])  # 把c/d列變成索引
# c   d      
# one 0  0  7
#     1  1  6
#     2  2  5
# two 0  3  4
#     1  4  3
#     2  5  2
#     3  6  1cd
print frame.set_index(['c', 'd'], drop = False) # cd列依然保留
# c   d              
# one 0  0  7  one  0
#     1  1  6  one  1
#     2  2  5  one  2
# two 0  3  4  two  0
#     1  4  3  two  1
#     2  5  2  two  2
#     3  6  1  two  3
frame2 = frame.set_index(['c', 'd'])
print frame2.reset_index() #還原
#      c  d  a  b
# 0  one  0  0  7
# 1  one  1  1  6
# 2  one  2  2  5
# 3  two  0  3  4
# 4  two  1  4  3
# 5  two  2  5  2
# 6  two  3  6  1

python-pandas的基本用法11

pandas的基本用法11-層次化索引 # -*- coding: utf-8 -*- import numpy as np from pandas import Series, DataFrame, MultiIndex print 'Series的層

雲計算學習筆記，雲計算Python自動化基本用法

雲計算學習筆記Python編程博大精深，知識點眾多，需要先整體上了解python的一些基本用法之後再去對每一個知識點細細研究，這樣學習的速度會快很多。所以下面就先看一些python事先需要知道的基本知識。行和縮進：學習Python時，遇到的第一個需要註意的地方是，不使用括號來表示代碼的類和函數定義塊或流程

PYTHON PYQUERY 基本用法

pyquery tro 遍歷 python color img style att ref 引用方法 from pyquery import PyQuery as pq View Code 基本CSS選擇器 from pyquery import PyQuery

python numpy基本用法

1.陣列用法 list_1 = [1,2,3,4] array_1 = np.array(list_1) 這樣就可以對array_1進行計算了。獲得二維陣列 array_3 = np.array([list_1,list_2]) 獲得陣列的型別 array_3.dtype

python pandas 基本操作

pandas 是基於 Numpy 構建的含有更高階資料結構和工具的資料分析包類似於 Numpy 的核心是 ndarray，pandas 也是圍繞著 Series 和 DataFrame 兩個核心資料結構展開的。Series 和 DataFrame 分別對應於一維的序列和二維的表結構。

python的基本用法（三）字串常用函式

字串常用函式 # s='.abcd.'# new_s=s.strip('.')#預設去掉字串兩邊的空格和換行符,想去掉什麼括號中就寫什麼# print('s',s)# print('new_s',new_s)# t='.hhjDDDhjhj.'# print(t.rstrip('.'))# print(t.

資料分析----pandas 基本用法（上）

一、生成資料表 1、首先匯入pandas庫，一般都會用到numpy庫，首先為我們先匯入備用 import numpy as np import pandas as pd 2、匯入CSV或者xlsx檔案 df=pd.DataFrame(pd.read_csv('name

Python的基本用法

---恢復內容開始--- 一、函式 1.1 預設引數想要計算一個數x的n次方，可以定義如下的函式。但是有時候我們僅僅只需要計算x^2，所以只想使用一個引數即power(x)，這時如果仍用如下程式碼會報錯 def power(x, n): s = 1 while n > 0

python pandas 基本使用，sklearn的10種分類器實踐

由於最近程式碼任務不多，就想把pandas的日常使用和sklearn的建模使用更加規範和熟練，因此就以泰坦尼克的相關資料集為測試資料進行分析。資料集在 https://codeload.github.com/fayduan/Kaggle_Titanic/zip/maste

selenium webdriver (python)的基本用法一

前言對於大多軟體測試人員來講缺乏程式設計經驗（指專案開發經驗，大學的 C 語言算很基礎的程式設計知識）一直是難以逾越的鴻溝，並不是說測試比開發人員智商低，是國內的大多測試崗位是功能測試為主，在工作時間中，我們很難深入的接觸和使用程式設計技術；筆者認為自動化

python-pandas基本資料操作

一、檢視資料（檢視物件的方法對於Series來說同樣適用） 1.檢視DataFrame前xx行或後xx行 a=DataFrame(data); a.head(6)表示顯示前6行資料，若head()中不帶引數則會顯示全部資料。 a.tail(6)表示顯示後

python- pandas cumsum用法

Cumsum ：計算軸向元素累加和，返回由中間結果組成的陣列第一部分：求累計次數（轉自https://blog.csdn.net/qq_22238533/article/details/72900634）本文主要是針對 cumsum函式的一些用法。具體應用場景看下面的資料集。

pandas基本用法（一）

讀取csv檔案 import pandas food_info = pandas.read_csv(file_name)# 返回一個DataFrame物件 n_rows = food_info

11.python並發入門（part9 多線程模塊multiprocessing基本用法）

python 多進程 multiprocessing 一、回顧多繼承的概念。由於GIL（全局解釋器鎖）的存在，在python中無法實現真正的多線程（一個進程裏的多個線程無法在cpu上並行執行），如果想充分的利用cpu的資源，在python中需要使用進程。二、multiprocessing模塊的簡介

Python中numpy庫和pandas庫的基本用法

使用前先安裝兩個庫：python3 -m pip install numpy pandas 注意因為我把我自己的python.exe命令成了python3.exe（因為系統裡有多個版本的python存在），所以上面的命令裡用的是python3。 numpy庫： NumP

python-pandas的基本用法10

pandas的基本用法10-處理NAN # -*- coding: utf-8 -*- import numpy as np from numpy import nan as NA from pandas import Series,DataFrame

python-pandas的基本用法03

pandas的基本用法03-reindex() # -*- coding: utf-8 -*- import numpy as np from pandas import D

python-pandas的基本用法05

pandas的基本用法05-索引 # -*- coding: utf-8 -*- import numpy as np from pandas import Series, DataFrame from numpy.core.

Python整型的基本用法

表示 pri span image python nbsp 十進制轉二進制 () bit #！/usr/bin/env python # -*- coding:utf-8 -*- #整形的使用 #將字符串轉換為數字 a = "999" print(a,type(a))

python數據表的合並(python pandas join() 、merge()和concat()的用法)

div 等價 nta cti nio eve 數據合並 inner lai merage# pandas提供了一個類似於關系數據庫的連接(join)操作的方法<Strong>merage</Strong>,可以根據一個或多個鍵將不同DataFr

python-pandas的基本用法11

pandas的基本用法11-層次化索引

相關推薦