python之使用pandas處理excel資料007
阿新 • • 發佈:2020-12-06
一、環境安裝
1:pandas依賴處理Excel的xlrd模組,安裝命令是:pip install xlrd 2:安裝pandas模組還需要一定的編碼環境,確保你的電腦有這些環境:Net.4 、VC-Compiler以及winsdk_web 3:步驟1和2 準備好了之後,可以開始安裝pandas了,安裝命令是:pip install pandas
二、基本用法
DataFrame 按照列和按照行進行索引資料
按照列索引 df[’column_name’].values
按照行索引 df.loc[’row_key’].values 或 df.iloc[index].values
df.iloc[行標籤,列標籤]是基於索引位來選取資料集,需要注意的是行、列為區間時,前閉後開集合。
import pandas as pd # 預設讀取第一個表單,前5行資料(不包含標題行,行號從0開始) df = pd.read_excel("test_case.xlsx") data = df.head() print("獲取到的測試資料:\n{0}".format(data)) # 指定表單名:表單名或索引,0表示第一個表單,返回巢狀列表 df_01 = pd.read_excel("test_case_futureloan.xlsx",sheet_name = "login_case") 或者使用index指定表單,從0開始 df_01 = pd.read_excel("test_case.xlsx",sheet_name = 1) data_01 = df_01.values #獲取資料,返回巢狀列表
print("獲取到的測試資料:\n{0}".format(data_01))
# 讀取指定行,0表示第一行,不包含表頭 df = pd.read_excel("test_case_futureloan.xlsx") !!! pandas1.0.0.0版本後以iloc代替ix!!!! data = df_01["case_id"].values #讀取某一列的值 或者 data = df.iloc[:, [9]].values #讀取指定列 data = df_01.iloc[1].values # 讀取指定行 data = df_01.iloc[[0,1]].values # 讀取多行,就要在iloc[]裡面巢狀列表指定行數 data = df.iloc[:2].values # 讀取前2行,index=0、1 data = df.iloc[[0,1],[1,2]] #[0,1]讀取第1、2行 [1,2]分別讀取第2、3列資料 data =df_01.iloc[:,[1,2,4]] #讀取所有行指定列[1,2,4]資料 print("標題", df.columns[9]) # 指定列的標題 print("標題",df.columns.values) # 所有標題 print("獲取到的測試資料:\n{0}".format(data))
因為data = df.iloc[i,:].values #獲取資料,返回巢狀列表,不便於我們讀取測試資料,所以需要將資料轉換為字典格式:
data = df.iloc[i,:].to_dict()
獲取表單所有測試資料:
test_data = [] #存放每行測試資料,列表巢狀字典格式 for i in fd_01.index.values: #獲取表單行號,遍歷 row_data = fd_01.iloc[i,:].to_dict() #轉換為字典格式 test_data.append(row_data) print("獲取到的測試資料:\n{0}".format(test_data))