[Pandas]利用Pandas處理excel資料
阿新 • • 發佈:2018-11-21
Python 處理excel的第三包有很多,比如XlsxWriter、xlrd&xlwt、OpenPyXL、Microsoft Excel API等,最後綜合考慮選用了Pandas。
Pandas 是基於NumPy 的一種工具,該工具是為了解決資料分析任務而建立的。Pandas 納入了大量庫和一些標準的資料模型,提供了高效地操作大型資料集所需的工具。pandas提供了大量能使我們快速便捷地處理資料的函式和方法。你很快就會發現,它是使Python成為強大而高效的資料分析環境的重要因素之一。pandas不但可以讀取excel中資料還可以修改excel資料以及生成excel檔案。
1.抽取excle中資料,將資料以JSON格式輸出
1 # -*- coding: utf-8 -*- 2 import pandas as pd 3 import os 4 import json 5 6 # 提取excel表格中資料,將其轉換成dateframe型別 7 os.chdir('excel檔案地址') 8 9 invoice_data = pd.read_excel('./Invoice_data_Demo.xls', header=0, encoding='utf8') 10 11 sheet_list = [] 12 # 取出excel表頭 13sheet_head = list(invoice_data.columns) 14 sheet_list.append(sheet_head) 15 # 取出excel中每一行資料 16 for i in range(0, len(invoice_data)): 17 data_line = list(invoice_data.loc[i]) 18 data_line = [str(i) for i in data_line] 19 sheet_list.append(data_line) 20 print(sheet_list) 21 22 data_l = json.dumps(sheet_list, ensure_ascii=False)23 print(data_l)
2.生成excel/csv檔案
1 # -*- coding: utf-8 -*- 2 3 import pandas as pd 4 5 a = ['a','b','c'] 6 b = [1,2,3] 7 dit = {'char':a, 'num':b} 8 file_path = r'./output.xlsx' 9 writer = pd.ExcelWriter(file_path) 10 df = pd.DataFrame(dit) 11 # columns引數用於指定生成的excel中列的順序 12 df.to_excel(writer, columns=['char','num'], index=False,encoding='utf-8',sheet_name='Sheet') 13 writer.save() 14 15 # 生成csv檔案 16 df.to_csv(r'./1.csv',columns=['char','num'],index=False,sep=',')