1. 程式人生 > >用Java讀取pdf中的資料

用Java讀取pdf中的資料

     textFile = pdfFile.substring(0, pdfFile.length() - 4)
       + ".txt";
    }
   }
   // 檔案輸入流,寫入檔案倒textFile
   output = new OutputStreamWriter(new FileOutputStream(textFile),
     encoding);
   // PDFTextStripper來提取文字
   PDFTextStripper stripper = null;
   stripper = new PDFTextStripper();
   // 設定是否排序
   stripper.setSortByPosition(sort);
   // 設定起始頁
   stripper.setStartPage(startPage);
   // 設定結束頁
   stripper.setEndPage(endPage);
   // 呼叫PDFTextStripper的writeText提取並輸出文字
   stripper.writeText(document, output);
  } finally {
   if (output != null) {
    // 關閉輸出流
    output.close();
   }
   if (document != null) {
    // 關閉PDF Document
    document.close();
   }
  }
 }