1. 程式人生 > >python 實現 pdf 書籤讀取、批量寫入

python 實現 pdf 書籤讀取、批量寫入

介紹

剛學Python,利用Python實現了pdf的書籤處理
實現 從pdf檔案中讀取書籤儲存到檔案中和從配置檔案中讀取書籤資訊寫入pdf檔案中
對於一些沒有書籤的PDF檔案,可以將PDF檔案的目錄頁面複製到文字中,稍加編輯後匯入到PDF檔案,就可以生成PDF檔案的書籤

Python版本: Python2.7
用到的庫: pypdf

使用

程式碼沒有提取成 Python 模組,只是單獨一個測試程式

從pdf檔案中讀取書籤儲存到檔案

用來測試的pdf如下:
這裡寫圖片描述
開啟終端,輸入下面指令:

python pdfBookmark.py 2\ Python起步.pdf
bm.txt

引數1: Python指令碼
引數2: PDF檔案
引數3: 提取出來的書籤檔名

這裡寫圖片描述

生成的書籤檔案如下:
這裡寫圖片描述

注意

要注意的是,書籤檔案是有格式的
書籤檔案每一行對應一個書籤,內容為書籤命名+空格+頁數
每一行前面每加一個空格表示書籤的級數
如:

2章  Python起步 1
 2.1  程式輸出,print語句及“Hello World!” 2
 2.2    程式輸入和 raw_input()內建函式 3

對應pdf檔案中就是:
這裡寫圖片描述

從配置檔案中讀取書籤資訊寫入pdf檔案

跟上面測試用的同一個PDF檔案,這裡將書籤檔案稍微修改一些,然後通過Python指令碼寫進去
將書籤檔案進行修改,如:
這裡寫圖片描述

開啟終端,輸入下面指令:

python pdfBookmark.py 2\ Python起步.pdf bm.txt output.pdf 0

引數1 : Python指令碼
引數2 : PDF檔名
引數3 : 書籤檔名
引數4 : 修改後輸出的PDF檔名
引數5: 書籤模式,0表示適合寬度模式,1表示適合頁面模式,主要是點選書籤是跳到頁面後頁面顯示方式不一樣,測試一下就知道效果了

這裡寫圖片描述

生成的PDF檔案如下:
這裡寫圖片描述

原始碼