1. 程式人生 > 其它 >在Python中利用pandas讀取Microsoft Excel檔案

在Python中利用pandas讀取Microsoft Excel檔案

技術標籤:pandas學習日誌pythonexcelpandas

pandas支援通過ExcelFile類或pandas.read_excel函式來讀取儲存再Excel2001(或更高版檔案中的表格型資料。這些工具內部是使用附加包xlrd和openpyxl來分別讀取XLS和XLSX檔案的。(這裡你可能需要使用pip或conda手動安裝這些工具。)

1. 讀取檔案
方法一:使用ExcelFile時,通常將xls或xlsx的路徑傳入,生成一個例項:

import pandas as pd
xlsx = pd.ExcelFile(r'C:\Users\HUAWEI\Desktop\example.xlsx'
)

注:上述程式碼中C:\Users\HUAWEI\Desktop\example.xlsx表示位置在C:\Users\HUAWEI\Desktop的檔案example.xlsx,這裡不要忘了轉移符號r

儲存在表中的資料可以通過pandas.read_excel讀取到DataFrame中:

pd.read_excel(xlsx, 'Sheet1')     #這裡的Sheet1不要忘了首字母大寫
#	Unnamed: 0	a	b
#      0	aa	1	3
#      1	bb	2	4

如果讀取的檔案含有多個表格,此時使用ExcelFile讀取檔案更快一些,但你也可以使用更簡潔的方法二。

方法二:
將檔名直接傳入pandas.read_excel:

frame = pd.read_excel(r'C:\Users\HUAWEI\Desktop\example.xlsx', 'Sheet1')
print(frame)
#   Unnamed: 0  a  b
# 0         aa  1  3
# 1         bb  2  4

考慮到程式碼的可讀性,這裡也經常將路徑付給一個變數(例如path),然後將該變數傳給read_excel方法。示例如下:

path = r'C:\Users\HUAWEI\Desktop\example.xlsx'
frame0 = pd.read_excel(
path, 'Sheet1') print(frame0)

2. 寫入檔案
如果需要將pandas資料寫入到Excel格式檔案中去,必須明確資料和待寫入的檔案:

首先在你確定好的路徑下生成一個ExcelWriter:

path = r'C:\Users\HUAWEI\Desktop\example1.xlsx'
writer = pd.ExcelWriter(path)

然後使用pandas物件的to_excel方法將資料寫入:

frame.to_excel(writer, 'Sheet1')

最後儲存:

writer.save()

執行之後你就可以在路徑下找到你剛剛寫好的檔案了!