1. 程式人生 > >java 實現html模板匯出pdf的方式

java 實現html模板匯出pdf的方式

最近在工作中遇到了一個很囧的事情。要把HTML頁面轉換成PDF或者tiff圖片等其他形式,目前tiff還是一頭霧水,如果各位大師有真的可行的想法(不要是別人那邊抄的,百度最近搜尋的質量嚴重的打擊了我對國貨的信心。)希望能夠告訴我,先謝了。
言歸正傳。所以,我就做了把HTML轉換成PDF的形式。目前可以完美支援一比一轉換,下面就把我的解決方案貼出來。
首先,當然是找到能夠解析PDF的完美元件,百度和谷歌不約而同的告訴我們。IText是王道。而目前開源的元件中,Itext的確是一個First Choice,如果各位單純是做把圖片轉成PDF或者自己寫了Velocity或者FreeMarker模板生成了HTML是非常推薦直接用Itext來進行的。而如果,大家像我這樣已經有前人寫好了HTML頁面或者懶得寫FreeMarker模板的話。可以直接看下一段。
由於他們已經寫好了HTML頁面,而且顯示已經很完美了。那我要做的就是能完美解析HTML+CSS的PDF生成工具。這時候flying-saucer進入了我的選擇範圍中。

http://code.google.com/p/flying-saucer/
上面是網址,這個工具託管在GoogleCode上面,作者做他們能夠做下面的工作:
Flying Saucer takes XML or XHTML and applies CSS 2.1-compliant stylesheets to it, in order to render to PDF (via iText), images, and on-screen using Swing or SWT。
不難看出工作原理,就是解析XML或者XHTML並且包括css樣式表,並且用Swing或者SWT的元件生成PDF的功能。這解決了頁面的顯示問題。IText自身的一個很嚴重的問題就是解析CSS有很大的問題。而這個解決了。下面就是用Flying Saucer來實現的程式碼:

01 public boolean convertHtmlToPdf(String inputFile, String outputFile)
02 throws Exception {
03
04 OutputStream os = new FileOutputStream(outputFile);    
05 ITextRenderer renderer = new ITextRenderer();    
06 String url = new File(inputFile).toURI().toURL().toString();
07
08 renderer.setDocument(url);  
09
10 // 解決中文支援問題    
11 ITextFontResolver fontResolver = renderer.getFontResolver();   
12 fontResolver.addFont("C:/Windows/Fonts/SIMSUN.TTC", BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED);    
13 //解決圖片的相對路徑問題
14 renderer.getSharedContext().setBaseURL("file:/D:/");
15 renderer.layout();   
16 renderer.createPDF(os); 
17
18 os.flush();
19 os.close();
20 return true;
21 }

上面這段程式碼是這樣的,輸入一個HTML地址URL = inputFile,輸入一個要輸出的地址,就可以在輸出的PDF地址中生成這個PDF。

注意事項:

1.輸入的HTML頁面必須是標準的XHTML頁面。頁面的頂上必須是這樣的格式:

1 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
2 <html xmlns="http://www.w3.org/1999/xhtml">


並且HTML頁面的語法必須是非常嚴謹的,所有標籤都必須閉合等等(由於flying-Saucer做了XML解析的工作,不嚴謹會報錯的。),這是對頁面的第一個要求。

2.要用到圖片的地方寫相對路徑的形式,比如:

1 <img src="a.jpg" alt="323" width="252" height="80" />

而它的圖片位置則必須在Java程式碼中指定。

renderer.getSharedContext().setBaseURL("file:/D:/");

也有另一種方法就是直接在<img>標籤中寫絕對路徑。

3.Flying-Saucer在解析tiff格式的圖片的時候會報錯。具體原因我還沒找到。希望大家能夠指點我。

4.如果在頁面中有中文字型的話。必須在HTML程式碼中的樣式中寫上某種字型的css,並且必須是用英文的,然後在Java程式碼中寫上對應的檔案位置。

ITextFontResolver fontResolver = renderer.getFontResolver();

           fontResolver.addFont("C:/Windows/Fonts/SIMSUN.TTC", BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED);

上面的方法是添加了宋體。也可以新增其他字型。

以上就是解決方案。

下面給出這幾個包的下載地址。大家可以直接下載。