python 如何提取多個excel表中的某行/列資料做合併
阿新 • • 發佈:2021-02-12
首先把所有要提取資料的excel放置到同一個目錄資料夾下
匯入包:
import os '用於提取目錄下檔名'
import pandas as pd '用於生成data_frame進行結果儲存'
提取目錄資料夾中所有的檔名:
只需要寫到目錄資料夾的路徑即可,會輸出目錄資料夾中所有的檔名稱
info = os.listdir('/目錄資料夾路徑/')
'建立空的列表用於存放提取出得資料'
data = []
'datafile是info中提取出來的xlsx檔名稱'
for datafile in info:
'一條判斷語句來排除資料夾中,我們不需要的檔案'
if (datafile !='.ipynb_checkpoints' and datafile != '測試資料清洗.ipynb'):
'輸出判斷執行提取的檔名,也可以用於判斷哪個檔案有錯誤'
print(datafile)
'逐條讀取目錄資料夾下的每一個檔案'
file = pd.read_excel(datafile)
'選取檔案的固定行/列,存放到列表data中'
data.append(file['需要提取的欄位名稱'])
'轉化為dataframe才可以進行儲存操作'
data1=pd.DataFrame(data= data)
'儲存為csv,中文編碼,可以檢視輸出結果'
data1.to_csv('檔名稱或路徑.csv',encoding='utf_8_sig')