好用的pdf轉excel的python指令碼
阿新 • • 發佈:2021-10-21
https://www.jianshu.com/p/f33233e4c712
利用plumer把pdf轉成excel表格
# -*- coding: utf-8 -*- """ Created on Fri May 17 2019 @author: YangYang 請確保你在執行這個程式碼的時候,已經安裝了pdfplumber庫 如果沒有安裝,請在[附件-命令提示符]下輸入: pip install pdfplumber """ import pdfplumber import xlwt import sys # 定義儲存Excel的位置 workbook = xlwt.Workbook() #定義workbook sheet = workbook.add_sheet('Sheet1') #新增sheet i = 0 # Excel起始位置 path = sys.argv[1] output = sys.argv[2] #path = "aaaaaa.PDF" # 匯入PDF路徑 pdf = pdfplumber.open(path) print('\n') print('開始讀取資料') print('\n') for page in pdf.pages: # 獲取當前頁面的全部文字資訊,包括表格中的文字 # print(page.extract_text()) for table in page.extract_tables(): # print(table) for row in table: print(row) for j in range(len(row)): sheet.write(i, j, row[j]) i += 1 print('---------- 分割線 ----------') pdf.close() # 儲存Excel表 workbook.save(output) print('\n') print('寫入excel成功') print('儲存位置:') print('./result.xls') print('\n') input('PDF取讀完畢,按任意鍵退出')