1. 程式人生 > 實用技巧 >python之使用pandas處理excel資料007

python之使用pandas處理excel資料007

一、環境安裝

 1:pandas依賴處理Excel的xlrd模組,安裝命令是:pip install xlrd
 2:安裝pandas模組還需要一定的編碼環境,確保你的電腦有這些環境:Net.4 、VC-Compiler以及winsdk_web
 3:步驟1和2 準備好了之後,可以開始安裝pandas了,安裝命令是:pip install pandas

  二、基本用法

DataFrame 按照列和按照行進行索引資料
按照列索引 df[’column_name’].values
按照行索引 df.loc[’row_key’].values 或 df.iloc[index].values

df.iloc[行標籤,列標籤]是基於索引位來選取資料集,需要注意的是行、列為區間時,前閉後開集合。

import pandas as pd

# 預設讀取第一個表單,前5行資料(不包含標題行,行號從0開始)
df = pd.read_excel("test_case.xlsx")
data = df.head()
print("獲取到的測試資料:\n{0}".format(data))

# 指定表單名:表單名或索引,0表示第一個表單,返回巢狀列表
df_01 = pd.read_excel("test_case_futureloan.xlsx",sheet_name = "login_case
") 或者使用index指定表單,從0開始 df_01 = pd.read_excel("test_case.xlsx",sheet_name = 1) data_01 = df_01.values #獲取資料,返回巢狀列表

print("獲取到的測試資料:\n{0}".format(data_01))
# 讀取指定行,0表示第一行,不包含表頭
df = pd.read_excel("test_case_futureloan.xlsx")
!!! pandas1.0.0.0版本後以iloc代替ix!!!!
data = df_01["case_id"].values #讀取某一列的值  或者 data = df.iloc[:, [9]].values  #
讀取指定列 data = df_01.iloc[1].values # 讀取指定行 data = df_01.iloc[[0,1]].values # 讀取多行,就要在iloc[]裡面巢狀列表指定行數 data = df.iloc[:2].values # 讀取前2行,index=0、1 data = df.iloc[[0,1],[1,2]] #[0,1]讀取第1、2行 [1,2]分別讀取第2、3列資料 data =df_01.iloc[:,[1,2,4]] #讀取所有行指定列[1,2,4]資料 print("標題", df.columns[9]) # 指定列的標題 print("標題",df.columns.values) # 所有標題 print("獲取到的測試資料:\n{0}".format(data))
因為data = df.iloc[i,:].values #獲取資料,返回巢狀列表,不便於我們讀取測試資料,所以需要將資料轉換為字典格式:
data = df.iloc[i,:].to_dict()

獲取表單所有測試資料:
test_data = [] #存放每行測試資料,列表巢狀字典格式

for i  in fd_01.index.values: #獲取表單行號,遍歷
    row_data = fd_01.iloc[i,:].to_dict() #轉換為字典格式
    test_data.append(row_data)
print("獲取到的測試資料:\n{0}".format(test_data))