java-poi3.17讀取word文字及圖片

阿新 • • 發佈：2019-01-05

package per.qy.dexter.fileoperate;

import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.io.OutputStream;
import java.util.List;
import java.util.UUID;

import org.apache.poi.POIXMLTextExtractor;
import org.apache.poi.hwpf.HWPFDocument;
import org.apache.poi.hwpf.model.PicturesTable;
import org.apache.poi.hwpf.usermodel.Picture;
import org.apache.poi.xwpf.extractor.XWPFWordExtractor;
import org.apache.poi.xwpf.usermodel.XWPFDocument;
import org.apache.poi.xwpf.usermodel.XWPFPictureData;
import org.junit.Test;

public class WordTest {

	@Test
	public void testWord() {
		// String path = "D:\\temp\\temp\\test.doc";
		String path = "D:\\temp\\temp\\test.docx";
		String content = null;
		File file = new File(path);
		if (file.exists() && file.isFile()) {
			InputStream is = null;
			HWPFDocument doc = null;
			XWPFDocument docx = null;
			POIXMLTextExtractor extractor = null;
			try {
				is = new FileInputStream(file);
				if (path.endsWith(".doc")) {
					doc = new HWPFDocument(is);

					// 文件文字內容
					content = doc.getDocumentText();

					// 文件圖片內容
					PicturesTable picturesTable = doc.getPicturesTable();
					List<Picture> pictures = picturesTable.getAllPictures();
					for (Picture picture : pictures) {
						// 輸出圖片到磁碟
						OutputStream out = new FileOutputStream(
								new File("D:\\temp\\" + UUID.randomUUID() + "." + picture.suggestFileExtension()));
						picture.writeImageContent(out);
						out.close();
					}
				} else if (path.endsWith("docx")) {
					docx = new XWPFDocument(is);
					extractor = new XWPFWordExtractor(docx);

					// 文件文字內容
					content = extractor.getText();

					// 文件圖片內容
					List<XWPFPictureData> pictures = docx.getAllPictures();
					for (XWPFPictureData picture : pictures) {
						byte[] bytev = picture.getData();
						// 輸出圖片到磁碟
						FileOutputStream out = new FileOutputStream(
								"D:\\temp\\temp\\" + UUID.randomUUID() + picture.getFileName());
						out.write(bytev);
						out.close();
					}
				} else {
					System.out.println("此檔案不是word檔案！");
				}
				System.out.println(content);
			} catch (FileNotFoundException e) {
			} catch (IOException e) {
			} finally {
				try {
					if (doc != null) {
						doc.close();
					}
					if (extractor != null) {
						extractor.close();
					}
					if (docx != null) {
						docx.close();
					}
					if (is != null) {
						is.close();
					}
				} catch (IOException e) {
				}
			}
		}
	}

}

java-poi3.17讀取word文字及圖片

package per.qy.dexter.fileoperate; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java

Java 讀取Word文字框中的文字/圖片/表格

Word可插入文字框，文字框中可嵌入文字、圖片、表格等內容。對文件中的已有文字框，也可以讀取其中的內容。本文以Java程式程式碼來展示如何讀取文字框，包括讀取文字框中的文字、圖片以及表格等。【程式環境】程式編輯環境為IntelliJ IDEA，並在程式中引入了free Spire.Doc.jar，安裝的J

java-pdfbox2.0.8讀取pdf文字和圖片

package per.qy.dexter.fileoperate; import java.awt.image.BufferedImage; import java.io.File; import java.io.FileOutputStream; import java

C# 讀取Word文字框中的文字、圖片和表格（附VB.NET程式碼）

【概述】 Word中可插入文字框，在文字框中可新增文字、圖片、表格等內容。本篇文章通過C#程式程式碼介紹如何來讀取文字框中的文字、圖片和表格等內容。附VB.NET程式碼，有需要可作參考。【程式環境】程式中所需必要的程式集檔案Spire.Doc.dll，及其他相關dll檔案（見下文）。用於測試的Word源

解決php文字及圖片顯示亂碼的問題

我們在學習PHP的過程中，想必有不少新手朋友們都遇到過亂碼的問題，解決亂碼問題不僅是小白們必須掌握的基礎知識點，也是最為常見的PHP面試題之一。下面就結合簡單程式碼示例給大家總結介紹下，PHP遇到亂碼時的解決方法。一、PHP頁面中文亂碼 1、header宣告 <?php hea

poi3.17 讀取doc、exec、ppt

<dependency> <groupId>org.apache.poi</groupId> &nb

PHP圖片加水印文字及圖片合成縮放

<?php //圖片新增文字水印 /*$bigImgPath = 'background.png'; $img = imagecreatefromstring(file_get_contents($bigImgPath)); $font = 'MSYH.TTF';//字型,字型檔案需儲存到相應

Bag-of-words模型-可用於計算文字及圖片相似度

引言上述這4篇文章對SIFT演算法的原理和C語言實現都做了詳細介紹，用SIFT做影象匹配效果不錯。現在考慮更為高層的應用，將SIFT演算法應用於目標識別：發現影象中包含的物體類別，這是計算機視覺領域最基本也是最重要的任務之一。且原經典演算法研究系列可能將改名為演算法珠璣--經

萬彩動畫大師教程 | 實現文字及圖片的果凍彈性的強調動畫效果

首字母搜索彈性字母點擊 png 動畫輸入 src 給圖片文字添加果凍彈性的強調動畫效果會使圖片文字像果凍一樣Q彈。在【時間軸區域】中點擊動畫條後面的【+】，會彈出一個小窗體，接著在窗體內部的【搜索框】中輸入【果凍】的首字母【gd】並搜索，就會出現【果凍彈性】

HTML5 文字及圖片標籤解析

首先建立一個.html檔案，再建立一個.css檔案通過載入.css檔案裡的屬性，來實現頁面的更新，可以使程式碼更簡潔。 1.在.html里加載css的方法 <head> <link href="css/index.css" rel="stylesheet

Python學習筆記(28)-Python讀取word文字

一，簡介 Python可以利用python-docx模組處理word文件，處理方式是面向物件的。也就是說python-docx模組會把word文件，文件中的段落、文字、字型等都看做物件，對物件進行處理就是對word文件的內容處理。二，相關概念如果需要讀

POI3.8讀取WORD(簡潔例項)

目前最新版POI為3.8: poi-3.8-20120326.jar poi-examples-3.8-20120326.jar poi-excelant-3.8-20120326.jar poi-ooxml-3.8-20120326.jar poi-ooxml-schemas-3.8-20120

java實現pdf轉word(文字)

end write 適合 common start -i void comm fbo 1：添加依賴 <?xml version="1.0" encoding="UTF-8"?> <project xmlns="http://maven.apache

Java 新增、讀取、刪除Excel圖片

本文介紹在Java程式中如何新增圖片到excel表格，新增圖片時可設定圖片大小、位置、旋轉、超連結、可選文字等，以及如何讀取、刪除excel表格中已有的圖片。工具：Free Spire.XLS for Java （免費版）注：可通過官網下載包，並解壓將lib資料夾下的jar檔案匯入java程

java/poi讀取word，並替換word中的文字內容，向word中插入圖片的操作

先貼程式碼，注：部分程式碼源自網路其他前輩的文章，這裡只是做一個功能整合。 package fcjTool; import java.io.IOException; import java.io.InputStream; import org.ap

Java 讀取Word批註中的文字和圖片

本文將介紹讀取Word批註的方法，包括讀取Word批註中的文字及圖片。關於操作Word批註的方法還可以參考這兩篇文章：Java 新增、回覆、修改、刪除Word批註；Java 給Word指定字串新增批註。下面將通過Java程式碼來演示如何讀取批註。工具使用：Word類庫（Free Spire.Doc for

pdf及word右上角新增圖片（Java實現）

以下程式碼，如有問題，請大家不吝指出，如有更優實現方案，歡迎一起討論。最近在做一個需求：在pdf和word右上角新增一個二維碼其中，pdf可以靈活實現二維碼的位置，但是word由於我是在頁首處新增的圖片，因此我的方法只能在頁首處新增圖片。首先定義一個介面（先丟擲Exception，

java讀取pdf檔案的圖片和文字內容

引用的jar包: pdfbox-1.8.13.jar fontbox-1.8.13.jar public static void main(String[] args) {PDFReader pdfReader1 = new PDFReader();pdfReader1.

Java建立寫入word文件圖片和文字

需要的jar  <dependency> <groupId>com.lowagie</groupId> <artifactId>itext</artifactId

JAVA------20.圖片中插文字和圖片

dap 圖片 logs test http 合成 over cal ray import java.awt.Color; import java.awt.Font; import java.awt.Graphics2D; import java.awt.Image; im

java-poi3.17讀取word文字及圖片

相關推薦