利用python對excel工作簿合併與拆分

阿新 • • 發佈：2022-04-10

一、對含有多個excel工作簿的多個資料夾進行合併

有A、B、C三個資料夾，每個資料夾都有多個 excel 工作簿（每個工作簿有且僅有一個工作表），當然A、B、C三個資料夾中的檔案數量可以不一樣，檔名稱有交集即可，目的是將三個資料夾中的 excel 工作簿彙總到一個資料夾，並且將三個資料夾中名稱相同的工作簿中的資料合併，有點類似於數學中的並集運算，求A、B、C三個集合的並集。

思路

獲取資料資料夾名稱，儲存為列表 file_list;
遍歷 file_list ，獲取所有 excel 工作簿名稱，儲存為列表 excel_file_list;
遍歷 excel_file_list，將重複在多個數據資料夾中的工作簿合併.

缺點：只適用於含有唯一工作表的 excel 工作簿！

程式碼

import pandas as pd
import os
def main():
    file_path = './data'
    file_list = os.listdir(file_path)
    excel_file_list = []
    for file in file_list:
        excel_file_list += os.listdir(file_path + '/' + file)
    excel_file_list = list(set(excel_file_list))

    for excel in excel_file_list:
        df_list = []
        for file_name in file_list:
            if excel in os.listdir(file_path + '/' + file_name):
                df_list.append(pd.read_excel(file_path + '/' + file_name + '/' + excel))
        res = pd.DataFrame()
        for df in df_list:
            res = pd.concat([res, df])
        res = res.drop_duplicates()
        res.to_excel('./result/' + excel, index=False)
if __name__ == "__main__":
    main()

檔案目錄

│  ExcelSortUtils.py
│  
├─data
│  ├─A組
│  │      MJ_20210131-am.xlsx
│  │      SM-省-0000-市-明細-0000.xlsx
│  │      ZDQY_20210118.xlsx
│  │      名單_20210127.xlsx
│  │      
│  ├─B組
│  │      20210125-620000-明細.xlsx
│  │      MJ_20210131-am.xlsx
│  │      SM-省-0000-市-明細-0000.xlsx
│  │      名單_20210127.xlsx
│  │      
│  └─C組
│          20210125-620000-明細.xlsx
│          MJ_20210131-am.xlsx
│          SM-省-0000-市-明細-0000.xlsx
│          ZDQY_20210118.xlsx
│          名單_20210127.xlsx
│          
└─result
        20210125-620000-明細.xlsx
        MJ_20210131-am.xlsx
        SM-省-0000-市-明細-0000.xlsx
        ZDQY_20210118.xlsx
        名單_20210127.xlsx

二、對含有多個sheet的 excel 工作簿進行合併

有多個excel工作簿，每個工作簿都有多個工作表，工作薄中的工作表名稱有沒有交集都可以，目的是將所有工作簿中的資料彙總到一個工作簿，名稱相同的工作表中的資料進行彙總。

思路

獲取所有 excel 工作簿中的工作表，以字典形式儲存到列表; df_list（df_list=[dict1, dict2, dict3, dict4, dict5])，即每個工作簿對應一個字典，工作簿中的表就是字典的元素，同時將所有工作表的名稱儲存為列表 sheet_list;
遍歷 sheet_list，將在列表 df_list 中重複出現的工作表合併.

程式碼

import pandas as pd
from openpyxl import load_workbook
import os

def main():
    fileList=os.listdir("./data")
    df_list=[] 
    sheet_list=[]
    for workbook in fileList:
        wb = load_workbook(filename=file_path+"\\"+workbook)
        sheetnames = wb.sheetnames
        sheet_list += sheetnames
        df_dict=dict()
        for sheet in sheetnames:
            df = pd.read_excel(file_path+"\\"+workbook, sheet_name=sheet, sep='\t',  encoding='GBK')
            df_dict[sheet] = df
        df_list.append(df_dict)
        
    sheet_list = list(set(sheet_list)) # 所有工作表名稱
    data_list = []
    
    for sheet in sheet_list:
        df = pd.DataFrame()
        for sheet_dic in df_list:
            try:
                df = df.append(sheet_dic[sheet])
            except:
                continue
        df = df.drop_duplicates()
        '''
            此處根據情況新增資料處理過程······
        '''
        data_list.append(df)

    # 將資料彙總到excel
    res_path = os.path.abspath('')+"\\result\彙總.xlsx"
    with pd.ExcelWriter(res_path) as writer:
        i = 0
        for df in data_list:
            df.to_excel(writer, sheet_name = sheet_list[i], index=False)
            i += 1
if __name__ == "__main__":
    main()

檔案目錄

│  excelconcat.py
│  
├─data
│      2月工單-1.xlsx
│      2月工單-2.xlsx
│      2月工單-3.xlsx
│      2月工單-4.xlsx
│      2月工單-5.xlsx
│      
└─result
        彙總.xlsx

三、對excel工作表中的資料進行拆分

現有一張彙總好的工作表，需要將這張表按單位分成不同的excel工作薄下發到各單位，並且保證每張工作表的格式和公式與原來的表一致。

程式碼

import pandas as pd
from openpyxl import load_workbook
import os


def paste(sheet, begin, end, df):
    for i, tup in enumerate(sheet[begin:end]):
        for j, obj in enumerate(tup):
            try:
                obj.value = df.iloc[i, j]
            except:
                obj.value = ''


def main():
    file_name = os.path.abspath('.') + '\\data\\' + os.listdir('./data')[0]
    df_dic = pd.read_excel(file_name, sheet_name=["Sheet1"],
                           skiprows=1, sep='\t', header=None, encoding='GBK')
    # 各單位程式碼
    company_name = ['53731', '48624', '52964', '45234', '46763', '50911', '52983', 
                     '54236', '47326', '47852', '47327', '53442', '54208', '50669']
    company_dic = dict()
    for name in company_name:
        data_list = list()
        for i, key in enumerate(df_dic):
            value = pd.DataFrame(df_dic[key].values).iloc[:, 0:37]
            value[0] = value[0].apply(lambda x: str(x).rstrip())
            value = value[value[0] == name]
            data_list.append(value)
        company_dic[name] = data_list

    wb = load_workbook(filename=file_name)
    '''
    刪除不需要的sheet
    sheetnames = wb.sheetnames
 	sheetlist = []
    for sheet in sheetnames:
        sheetlist.append(wb[sheet])
       
    for sheet in sheetlist:
        if sheet == wb['Sheet1']:
            continue
        else:
            wb.remove(wb[sheet])

    '''
    
    for name in company_name:
        paste(wb["Sheet1"], 'A2', 'AK1000', company_dic[name][0])
        wb.save(os.path.abspath('.') + '\\result\\' + '/%s.xlsx' % (name))

if __name__=='__main__':
    main()

檔案目錄

│  excelsplit.py
│  
├─data
│      測試資料.xlsx
│      
└─result
        45234.xlsx
        46763.xlsx
        47326.xlsx
        47327.xlsx
        47852.xlsx
        48624.xlsx
        50669.xlsx
        50911.xlsx
        52964.xlsx
        52983.xlsx
        53442.xlsx
        53731.xlsx
        54208.xlsx
        54236.xlsx

結果

利用python對excel工作簿合併與拆分

一、對含有多個excel工作簿的多個資料夾進行合併有A、B、C三個資料夾，每個資料夾都有多個 excel 工作簿（每個工作簿有且僅有一個工作表），當然A、B、C三個資料夾中的檔案數量可以不一樣，檔名稱有交集即可，目的是

Python操作Excel工作簿的示例程式碼(\*.xlsx)

前言 Excel 作為流行的個人計算機資料處理軟體，混跡於各個領域，在程式設計師這裡也是常常被處理的物件，可以處理 Excel 格式檔案的 Python 庫還是挺多的，比如 xlrd、xlwt、xlutils、openpyxl、xlwings 等等，但是

使用python建立Excel工作簿及工作表過程圖解

1 配置資訊：建立 excel 工作簿之前的路徑 2 建立工作簿建立工作簿之後的路徑

利用python對excel中一列的時間資料更改格式操作

問題場景：需要將下列的交期一列的資料格式更改成2019/05/10 存貨編碼尺寸數量交期

Python pandas實現excel工作表合併功能詳解

import os,pandas as pd,re #1.獲取資料夾下要合併的檔名 dirpath = \'資料夾地址\' #工作表3特殊處理需要開始下標和結束下標

Excel 工作簿、工作表與單元格

工作簿工作簿是指在 Excel 中用來儲存並處理資料的檔案，其副檔名是.xlsx。工作簿是由工作表組成的，每一個工作簿都可以包含一個或多個工作表，預設為 3 個工作表。Excel 2007 之前的版本最多可以有 255 個工作表，

python對Excel按條件進行內容補充(推薦)

關於xlrd/xlwt和openpyxl的差別兩者都是對於excel檔案的操作外掛，兩者的主要區別在於寫入操作，

Python對Excel按列值篩選並拆分表格到多個檔案的程式碼

場景：集團中心下發本省資料時，並未按地市、業務拆分，現需要按地市、業務拆分並分發到地市。

python對Excel的讀取的示例程式碼

　　在python自動化中，經常會遇到對資料檔案的操作，比如新增多名員工，但是直接將員工資料寫在python檔案中，不但工作量大，要是以後再次遇到類似批量資料操作還會寫在python檔案中嗎？

利用python在excel中畫圖的實現方法

一、前言以前大學時候，學EXCEL看到N多大神利用excel畫圖，覺得很不可思議。今個學了一個來月python,膨脹了就想用excel畫圖。當然，其實用畫圖這個詞不甚嚴謹，實際上是利用opencv遍歷每一個畫素的rgb值，再將其轉化

使用Python對Dicom檔案進行讀取與寫入的實現

Pydicom 單張影像的讀取使用 pydicom.dcmread() 函式進行單張影像的讀取,返回一個pydicom.dataset.FileDataset物件.

如何在Python對Excel進行讀取

利用Python實現Excel的檔案間的資料匹配功能

我們知道Excel有一個match函式，可以做資料匹配。比如要根據人名獲取成績而參考表sheet1的內容如下：

利用python對mysql表做全域性模糊搜尋並分頁例項

在寫django專案的時候，有的資料沒有使用模型管理（資料表是動態新增的），所以要直接使用mysql。前端請求資料的時候可能會指定這幾個引數：要請求的頁號，頁大小，以及檢索條件。

利用python對《乘風破浪的姐姐》視覺化

要說今年最火的綜藝節目，興風作浪……，哦，不對；小明歷險記……，也不對，哎！算了，接著看吧……

可保留圖片、行高、列寬的Excel工作表合併，動畫演示合併步驟

Excel外掛《E靈15.1版》可以批合併工作表、批量拆分工作表。其中合併工作表提供複選框“保留圖片/行高”，當該選項打勾時，合併後的表格會保留圖片、行高、列寬等所有資訊，如果不打勾則只合並資料，忽略

excel單元格尋找工作簿_如何檢視Excel工作簿中的所有命名單元格範圍

excel單元格尋找工作簿 Naming a range of cellsin Excel provide an easy way to reference those cells in aformula. If you have a workbook with a lot of data on the worksheets, naming rang

python批量彙總工作簿和工作表

1、彙總一個工作簿中多個工作表基本邏輯：（1）新建一個列表儲存內容（2）開啟第一張表，統計表有多少行

用python對excel查重

最近媳婦工作上遇到一個重複性勞動，excel表格查重，重複的標記起來，問我能不能寫個程式讓它自動查重標記

利用Python實現原創工具的Logo與Help

前言當我們使用Python完成自己的原創的工具時，比如：埠掃描、弱口令爆破等。你是否想過新增自己的Logo，以及簡要的幫助資訊？

利用python對excel工作簿合併與拆分

一、對含有多個excel工作簿的多個資料夾進行合併

思路

程式碼

檔案目錄

二、對含有多個sheet的 excel 工作簿進行合併

思路

程式碼

檔案目錄

三、對excel工作表中的資料進行拆分

程式碼

檔案目錄

結果

相關推薦