1. 程式人生 > >[置頂] java處理office文件與pdf檔案(一)

[置頂] java處理office文件與pdf檔案(一)

需求說明:

使用者可以上傳word,excel,ppt,pdf檔案。在頁面能夠預覽該檔案,並可以通過搜尋,找到對應的檔案記錄。

使用技術:

通過jacob將office轉化為html,使用poi進行檔案提取;

在前期調研的時候,搜尋其他將office轉化為html的技術,發現其轉化之後的頁面都不怎麼逼真。但是,使用jacob轉化的時候樣式還可以就是有一點,該專案必須部署在windows環境上。通過協調之後,準備放棄相容性使用jacob做html的轉化。對於pdf的處理思路,在搜尋pdf轉化時,發現很多技術轉化之後,檔案都不怎麼好看。想到直接使用html的embed標籤實現。因為該專案主要在內網執行,所以載入相對較快。但是在使用該方案時,必須在ie時設定ActiveX的級別,並且客戶端主機需安裝對應的pdf閱讀器。

資料庫:

oracle10g

實現思路整理:

1、檔案上傳至upload資料夾

2、將檔案轉化為html;

3、提取檔案內容以作搜尋使用。

將會在下一章編輯具體的程式碼實現,敬請期待。

第二章 傳送門