教你用python程式碼自動整理 Excel 表格 讓工作高效起來
相信有不少朋友日常工作會用到 Excel 處理各式表格檔案,更有甚者可能要花大把時間來做繁瑣耗時的表格整理工作。最近有朋友問可否程式設計來減輕表格整理工作量,今兒我們就通過例項來實現 Python 對錶格的自動化整理。
首先我們有這麼一份資料表 source.csv:
我們要做的是從上表中提取資料,來生成一份符合以下要求的表格:
- 按照以下分組名單 group.xls 來整理資料表中的資料:
最終要展現的資料項:
- 其中“K資料/60”為資料表中的“資料K”/60後保留的2位小數
我們先看手工 Excel 如何處理以上需求:要在 source.csv 資料表中讀取讀取每條資料,放入 group.xls 匹配的分組成員中,最後篩選需要的資料項,再對特定的 “資料K”進行運算處理。
那麼 Python 又將如何操作呢?這裡我們要用到功能強大的 pandas 庫。
pandas 是基於NumPy 的一種工具,該工具是為了解決資料分析任務而建立的。Pandas 納入了大量庫和一些標準的資料模型,提供了高效地操作大型資料集所需的工具。pandas提供了大量能使我們快速便捷地處理資料的函式和方法。你很快就會發現,它是使Python成為強大而高效的資料分析環境的重要因素之一。 pandas 百度百科
首先匯入 pandas 庫,通過相關的函式讀取 csv 和 xls 表格內容:
import pandas as pd # 讀取 group.xls 分組資訊 group = pd.read_excel("group.xls",header=None) group.columns=["分組","角色"] print(group) # 讀取 source.csv 獲取所有成員資料 source = pd.read_csv("source.csv") print(source)
我們可以首先對 source.csv 中的資料項進行篩選,需要的資料項有“角色”、“編號”、“資料B”、“資料C”、“資料D”和“資料K”:
# 通過 iloc[:,[列座標]] 來定位需要的各列資料 filter_merge = source.iloc[:,[0,2,4,5,6,13]] print(filter_merge)
接下來是根據分組角色來匹配角色資料,注意到 group.xls 和 source.csv 共有“角色”一項,我們可以通過此項將兩個表格融合從而形成匹配填充的效果。
combine = pd.merge(group,filter_merge,on="角色")
接下來我們在第二列插入運算後的“資料K/60”:
combine.insert(1,"資料K/60",round(filter_merge["資料K"]/60,2))
最終,我們將生成的資料格式寫入新的 xlsx 表格中:
combine.to_excel(excel_writer="result.xlsx",index=False)
最終自動生成的表格如下:
以上便是 Excel 表格整理的 Python 程式碼簡單實現,在操作過程中也遇到幾個問題貼在這裡供大家參考:
- 匯入 pandas 時可能會報錯: 解決:根據報錯資訊安裝需要的相關模組
- 要進行表格整理的電腦為公司電腦、無法連線外網下載 Python 解決