pandas的行列名更改與資料選擇

阿新 • • 發佈：2018-12-22

記錄一些pandas選擇資料的內容，此前首先說行列名的獲取和更改，以方便獲取資料。此文作為學習鞏固。

這篇博的內容順序大概就是：行列名的獲取 —> 行列名的更改 —> 資料選擇

一、pandas的行列名獲取和更改

1. 獲取: df.index() df.columns()

首先，舉個例子，做一個DataFrame如下：

>>>import pandas as pd
>>>import numpy as np
>>>data = pd.DataFrame({'a':[1,2,3],'b':[4,5,6],'c':[7,8,9]})
>>>data

設定了列索引為 abc，行索引是自動生成的，也可以設定

>>>data.index = ['A','B','C']
>>>data

以下的做法都以這個 data 作為資料舉例

接下來就可以獲取索引了，index-行索引，columns-列索引

>>>data.index

>>>data.columns

2. 修改，看到有很多方法，這裡推薦一種比較靈活好用的方法

df.rename(index={ }, columns={ }, inplace=True)

>>>data.rename(index={'A':'D', 'B':'E', 'C':'F'}, columns={'a':'d', 'b':'e', 'c':'f'}, inplace = True)
>>>data

說明3點：

1. index和columns無關，可以分別指定，也就是說，可以只修改行索引，那麼rename()中只寫index

2. 索引可以任意挑選，如此處，index={'A':'D', 'C':'F'} 則只改A和C，columns同樣

3. inplace=True, 在原dataframe上改動

二、pandas的資料選擇

1. 直接用索引選(不靈活、不推薦） df[ ]

1）選擇‘a’列

>>>data['a']

注意：1. 這樣取出的資料型別為 Series

2. 這種方法只能取出一列，不能用數字下標，不能多選或片選, ~~data['a','b']~~

, ~~data['a':'c']~~ , ~~data[0]~~

2）選擇'A','B'行

>>>data['A':'B']  
>>>data[0:2]      # 兩種方法同一結果

注意：1. 這樣取出的資料型別為 DateFrame

2. 這種方法只能用於片選行，可以用數字下標，不能單獨取，即 ~~data['A']~~ , ~~data['A','B']~~ , ~~data[1]~~

2.使用 .loc(推薦） df.loc()，()內參數先行後列，區別行列的取法

1) 取列：

>>>data.loc[:,['a','c']]     #圖1 需要行全取，再對應指定列

2）取行：

>>>data.loc[['A','B']]     #圖2 直接指定行

3）取行列交叉值：

>>>data.loc[['A'],['b','c']]  #圖3

(1) (2) (3)

注意：

1. 區別 df.iloc() .loc() —— 使用標籤 label 作為索引取值

.iloc() —— 使用整數下標 index 作為索引取值,如上面三句可以換成以下三

句，輸出資料型別有不同

>>>data.iloc[:,[0,2]]    # DataFrame
>>>data.iloc[[0,1]]      # DataFrame
>>>data.iloc[0,[1,2]]    # Series

2. 對於數字型別的變數，可以使用bool 選取行，列不能用bool，如

>>>data.loc[data.b>5]   # DataFrame

>>>data.loc[data.b>5,['c']]   #DataFrame  輸出為9位置的frame
>>>data.iloc[data.b.values>5,[2]]  #DataFrame  輸出同上，需要有 .values取值

3. .ix[ ] 可以混用label和index，位置使用同 .loc[ ] .iloc[ ]

pandas的行列名更改與資料選擇

記錄一些pandas選擇資料的內容，此前首先說行列名的獲取和更改，以方便獲取資料。此文作為學習鞏固。這篇博的內容順序大概就是：行列名的獲取 —> 行列名的更改 —> 資料選擇一、pandas的行列名獲取和更改1. 獲取: df.index()

python之pandas的層級索引與資料重構

import numpy as np import pandas as pd #層級索引 s1 = pd.Series(np.random.randint(-5,10,12),index=[list('aaabbbcccddd'),[1,2,4,1,2,3,1,2,3,1,2,3]]) p

【Mark Schmidt課件】機器學習與資料探勘——特徵選擇

本課件的主要內容如下：上次課程回顧：尋找“真實”模型資訊準則貝葉斯資訊準則關於食物過敏特徵選擇全基因組關聯分析 “迴歸權重”方法搜尋評分法評分函式的選擇 “特徵數量”懲罰

java版資料結構與演算法—選擇排序

/** * 選擇排序：時間複雜度O(n^2)， * 比氣泡排序稍好點，交換次數少 */ class ArraySelect { public static void selectSort(int arr[]){ for(int i=0;i<arr.leng

pandas篩選、更改資料

import numpy as np import pandas as pd Q2 = pd.read_excel('F:\AnacondaProjects\mathmodel\data\Question2.xlsx') input_data = pd.read_exce

【python資料處理】pandas行列操作及聚合

1.列操作 apply df.coulumn.function() (df.count.mean()這種) 例子：將Name列全部大寫 from string import upper df['Name'] = df.Name.a

Pandas入門基礎（二）：DataFrame的行、列與資料型別

建立DataFrame資料： data = {'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada', 'Nevada'], 'year': [2000, 2001, 2002, 2001, 20

【pandas】[3] DataFrame通過資料型別選擇子資料框

DataFrame.select_dtypes(include=None, exclude=None) Return a subset of the DataFrame’s columns based on the column dtypes. Parameters:

Pandas基礎（二）：DataFrame的行、列與資料型別

建立DataFrame資料： data = {'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada', 'Nevada'], 'year': [2000, 2001, 2002, 2001, 2002, 2003],

【演算法與資料結構】---------選擇排序

選擇排序是對氣泡排序的優化，其比對的次數並沒有減少，仍保持為O(n^2).減少了其氣泡排序的交換次數，從O(n^2)減少到O(n). 選擇排序在每一輪比較完之後，才進行位置交換。演算法分析：選擇排序最好和最壞的情況一樣運行了O(n^2).時間，但是選擇排

演算法與資料結構(十三) 氣泡排序、插入排序、希爾排序、選擇排序（Swift3.0版）

本篇部落格中的程式碼實現依然採用Swift3.0來實現。在前幾篇部落格連續的介紹了關於查詢的相關內容, 大約包括線性資料結構的順序查詢、折半查詢、插值查詢、Fibonacci查詢，還包括數結構的二叉排序樹以及平衡二叉樹的構建與查詢，然後還聊了雜湊表的構建與查詢。接下來的幾篇部落格中我們就集中的聊一下常見的集中

d3.js——選擇集與資料的繫結

<body> Fire Water Wind <script> var

C++資料結構與STL--選擇排序

*外部迴圈對錶進行n-1次遍歷。pass控制變數的範圍0-n-2 *對於每次重複過程，都有一個內部迴圈掃描arr[pass]到arr[n-1]的無序子表，並判定最小元素的下標。 *只有最小元素的下標(smallIndex)不等於pass，才交換arr[pass]和arr[smallIndex];

Pandas模組：表計算與資料分析

一、pandas簡單介紹 1、pandas是一個強大的Python資料分析的工具包。2、pandas是基於NumPy構建的。 3、pandas的主要功能具備對其功能的資料結構DataFrame、Series 整合時間序列功能

pandas庫隨筆——Cheat Sheet與資料讀取

由於自己是從R轉Python，平時用慣了R對資料進行處理、轉化等操作，如今過渡到Python上還有些許的不適應。但還是不得不感嘆pandas的強大之處，一個庫頂的上R中數個包合併在一起使用。因為平時的使用比較雜，都是隨用隨查，所以在pandas庫的使用上也是

資料結構與演算法-----選擇排序-----直接選擇排序

package jzoffer; public class DirectSelectionSort { public static void main(String[] args) { int [] R = {10,9,8,7,6,5,4,3,2,1}; Syst

【 D3.js 選擇集與資料詳解 — 4 】 enter和exit的處理方法以及處理模板

繫結資料之後，選擇集分為三部分：update、enter、exit。這三部分的處理辦法是什麼呢？本文將講解其處理方法，以及一個常用的處理模板。1. enter的處理方法如果沒有足夠的元素，那麼處理方法通常是使用append()新增元素。請看下面的程式碼：[javascript

pandas&pandas學習教程&DataFrame與Series資料結構

安裝： pandas的最小依賴項為： NumPy，python-dateutil，pytz 安裝pandas前需先安裝上述三個依賴項。 pandas官網文件強調，pandas專案名稱中的字母應該全部採用小寫形式，同時匯入pandas庫應採用import

小白學 Python 資料分析（6）：Pandas （五）基礎操作（2）資料選擇

人生苦短，我用 Python 前文傳送門：小白學 Python 資料分析（1）：資料分析基礎小白學 Python 資料分析（2）：Pandas （一）概述小白學 Python 資料分析（3）：Pandas （二）資料結構 Series 小白學 Python 資料分析（4）：Pandas （三）資

html class選擇器與id選擇器

spa 寫法錯誤一個 html nbsp 元素 -s cnblogs class選擇器： .p1{ color:red; ..... } id選擇器: #p1{

pandas的行列名更改與資料選擇

1. 獲取: df.index() df.columns()

2. 修改，看到有很多方法，這裡推薦一種比較靈活好用的方法

df.rename(index={ }, columns={ }, inplace=True)

二、pandas的資料選擇

1. 直接用索引選(不靈活、不推薦） df[ ]

2.使用 .loc(推薦） df.loc()，()內參數先行後列，區別行列的取法

相關推薦