1. 程式人生 > 其它 >pandas excel動態條件過濾並儲存結果

pandas excel動態條件過濾並儲存結果

技術標籤:pythonjavaexcelmysql資料庫

一、概述

由於業務需求,需要對某個excel資料做查詢。其中:

excel檔名,不固定

sheet數量,不固定

過濾條件,不固定

二、分析需求

針對以上3個條件,都是不固定的。因此需要設計一個配置檔案,內容如下:

# 查詢條件,多個條件,用逗號分隔
where_dict = {
    # excel檔名
    "file_name": "456.xlsx",
    # 過濾條件
    "rules": [
        {
            "sheet_name": "Sheet1",
            "split_rule": ["性別=男", "年齡=21"]
        },
        {
            "sheet_name": "Sheet2",
            "split_rule": ["身高=170"]
        }
    ]
}

通過遍歷這個字典,就可以了。

三、演示

先安裝模組

pip3 install pandas openpyxl

現有一個456.xlsx,內容如下:

Sheet1

Sheet2

Sheet3

完整程式碼如下:

# !/usr/bin/python3
# -*- coding: utf-8 -*-
import pandas as pd

# 查詢條件,多個條件,用逗號分隔
where_dict = {
    # excel檔名
    "file_name": "456.xlsx",
    # 過濾條件
    "rules": [
        {
            "sheet_name": "Sheet1",
            "split_rule": ["性別=男", "年齡=21"]
        },
        {
            "sheet_name": "Sheet2",
            "split_rule": ["身高=170"]
        }
    ]
}

# 建立新的新的查詢結果excel
with pd.ExcelWriter('result.xlsx') as writer:
    file_name = where_dict['file_name']
    for i in where_dict['rules']:
        # print(i, type(i))
        # 查詢條件
        where = ""
        # 開啟指定的sheet
        df = pd.read_excel(file_name, sheet_name=i['sheet_name'])
        for j in i['split_rule']:
            # 切割條件
            key, value = j.split('=')

            # 判斷數值是否為數字
            if value.isdigit():
                # 拼接查詢條件
                where += "(df.%s==%s) & " % (key, value)
            else:
                where += "(df.%s=='%s') & " % (key, value)

        # 去除末尾的&
        where = where.rstrip('& ')
        print(i['sheet_name'],'條件:',where)
        ret = df[eval(where)]
        # print(ret,type(ret))

        # 依次寫入sheet
        ret.to_excel(writer, sheet_name=i['sheet_name'], index=False, header=True)
View Code

執行程式碼,輸出:

Sheet1 條件: (df.性別=='男') & (df.年齡==21)
Sheet2 條件: (df.身高==170)

它會在當前目錄生成result.xlsx,開啟,結果如下:

Sheet1

Sheet2