1. 程式人生 > 其它 >python 如何提取多個excel表中的某行/列資料做合併

python 如何提取多個excel表中的某行/列資料做合併

技術標籤:Pythonpython大資料

首先把所有要提取資料的excel放置到同一個目錄資料夾下

匯入包:

import os  '用於提取目錄下檔名'
import pandas as pd  '用於生成data_frame進行結果儲存'

提取目錄資料夾中所有的檔名:
只需要寫到目錄資料夾的路徑即可,會輸出目錄資料夾中所有的檔名稱

info = os.listdir('/目錄資料夾路徑/') 

在這裡插入圖片描述

'建立空的列表用於存放提取出得資料'
data = []

'datafile是info中提取出來的xlsx檔名稱'
for datafile in info:
   '一條判斷語句來排除資料夾中,我們不需要的檔案'
if (datafile !='.ipynb_checkpoints' and datafile != '測試資料清洗.ipynb'): '輸出判斷執行提取的檔名,也可以用於判斷哪個檔案有錯誤' print(datafile) '逐條讀取目錄資料夾下的每一個檔案' file = pd.read_excel(datafile) '選取檔案的固定行/列,存放到列表data中' data.append(file['需要提取的欄位名稱'])
'轉化為dataframe才可以進行儲存操作'
data1=pd.DataFrame(data=
data) '儲存為csv,中文編碼,可以檢視輸出結果' data1.to_csv('檔名稱或路徑.csv',encoding='utf_8_sig')