python 實現 pdf 書籤讀取、批量寫入
阿新 • • 發佈:2019-02-16
介紹
剛學Python,利用Python實現了pdf的書籤處理
實現 從pdf檔案中讀取書籤儲存到檔案中和從配置檔案中讀取書籤資訊寫入pdf檔案中
對於一些沒有書籤的PDF檔案,可以將PDF檔案的目錄頁面複製到文字中,稍加編輯後匯入到PDF檔案,就可以生成PDF檔案的書籤
Python版本: Python2.7
用到的庫: pypdf
使用
程式碼沒有提取成 Python 模組,只是單獨一個測試程式
從pdf檔案中讀取書籤儲存到檔案
用來測試的pdf如下:
開啟終端,輸入下面指令:
python pdfBookmark.py 2\ Python起步.pdf bm.txt
引數1: Python指令碼
引數2: PDF檔案
引數3: 提取出來的書籤檔名
生成的書籤檔案如下:
注意
要注意的是,書籤檔案是有格式的
書籤檔案每一行對應一個書籤,內容為書籤命名+空格+頁數
每一行前面每加一個空格
表示書籤的級數
如:
第2章 Python起步 1
2.1 程式輸出,print語句及“Hello World!” 2
2.2 程式輸入和 raw_input()內建函式 3
對應pdf檔案中就是:
從配置檔案中讀取書籤資訊寫入pdf檔案
跟上面測試用的同一個PDF檔案,這裡將書籤檔案稍微修改一些,然後通過Python指令碼寫進去
將書籤檔案進行修改,如:
開啟終端,輸入下面指令:
python pdfBookmark.py 2\ Python起步.pdf bm.txt output.pdf 0
引數1 : Python指令碼
引數2 : PDF檔名
引數3 : 書籤檔名
引數4 : 修改後輸出的PDF檔名
引數5: 書籤模式,0表示適合寬度模式,1表示適合頁面模式,主要是點選書籤是跳到頁面後頁面顯示方式不一樣,測試一下就知道效果了
生成的PDF檔案如下: