pandas excel動態條件過濾並儲存結果
阿新 • • 發佈:2020-12-21
一、概述
由於業務需求,需要對某個excel資料做查詢。其中:
excel檔名,不固定
sheet數量,不固定
過濾條件,不固定
二、分析需求
針對以上3個條件,都是不固定的。因此需要設計一個配置檔案,內容如下:
# 查詢條件,多個條件,用逗號分隔 where_dict = { # excel檔名 "file_name": "456.xlsx", # 過濾條件 "rules": [ { "sheet_name": "Sheet1", "split_rule": ["性別=男", "年齡=21"] }, { "sheet_name": "Sheet2", "split_rule": ["身高=170"] } ] }
通過遍歷這個字典,就可以了。
三、演示
先安裝模組
pip3 install pandas openpyxl
現有一個456.xlsx,內容如下:
Sheet1
Sheet2
Sheet3
完整程式碼如下:
View Code# !/usr/bin/python3 # -*- coding: utf-8 -*- import pandas as pd # 查詢條件,多個條件,用逗號分隔 where_dict = { # excel檔名 "file_name": "456.xlsx", # 過濾條件 "rules": [ { "sheet_name": "Sheet1", "split_rule": ["性別=男", "年齡=21"] }, { "sheet_name": "Sheet2", "split_rule": ["身高=170"] } ] } # 建立新的新的查詢結果excel with pd.ExcelWriter('result.xlsx') as writer: file_name = where_dict['file_name'] for i in where_dict['rules']: # print(i, type(i)) # 查詢條件 where = "" # 開啟指定的sheet df = pd.read_excel(file_name, sheet_name=i['sheet_name']) for j in i['split_rule']: # 切割條件 key, value = j.split('=') # 判斷數值是否為數字 if value.isdigit(): # 拼接查詢條件 where += "(df.%s==%s) & " % (key, value) else: where += "(df.%s=='%s') & " % (key, value) # 去除末尾的& where = where.rstrip('& ') print(i['sheet_name'],'條件:',where) ret = df[eval(where)] # print(ret,type(ret)) # 依次寫入sheet ret.to_excel(writer, sheet_name=i['sheet_name'], index=False, header=True)
執行程式碼,輸出:
Sheet1 條件: (df.性別=='男') & (df.年齡==21)
Sheet2 條件: (df.身高==170)
它會在當前目錄生成result.xlsx,開啟,結果如下:
Sheet1
Sheet2