C# 提取PDF文本和圖片

阿新 • • 發佈：2018-09-07

raw namespace Spire.PDF strong ffffff != aging lena gef

任務要求：

提取PDF文檔中的文本
提取PDF文檔中的圖片

所需工具：

Free Spire.PDF for .NET 4.3 （免費版）

實現代碼：

【示例 1 】提取文本

using Spire.Pdf;
using System;
using System.IO;
using System.Text;

namespace ExtractText
{
    class Program
    {
        static void Main(string[] args)
        {
            //加載文檔
            PdfDocument document = new PdfDocument();
            document.LoadFromFile("測試文檔.pdf");

            //實例化StringBuilder類，獲取文本
            StringBuilder content = new StringBuilder();
            content.Append(document.Pages[0].ExtractText());

            //保存提取後的文本內容到.txt文檔
            String fileName = "TextFromPDF.txt";
            File.WriteAllText(fileName, content.ToString());
            System.Diagnostics.Process.Start("TextFromPDF.txt");
        }
    }
}

文本提取效果：
技術分享圖片
【示例 2 】提取圖片

using System;
using System.Collections.Generic;
using System.Text;
using System.Drawing;
using Spire.Pdf;

namespace ExtractImagesFromPDF
{
    class Program
    {
        static void Main(string[] args)
        {
            //實例化PdfDocument類，並加載測試文檔
            PdfDocument doc = new PdfDocument(); 
            doc.LoadFromFile("測試文檔.pdf");

            //實例化List類
            List<Image> ListImage = new List<Image>();
            for (int i = 0; i < doc.Pages.Count; i++)
            {
                // 獲取 Spire.Pdf.PdfPageBase類對象
                PdfPageBase page = doc.Pages[i];
                // 提取圖片
                Image[] images = page.ExtractImages();
                if (images != null && images.Length > 0)
                {
                    ListImage.AddRange(images);
                }

            }
            if (ListImage.Count > 0)
            {
                for (int i = 0; i < ListImage.Count; i++)
                {
                    Image image = ListImage[i];
                    image.Save("image" + (i + 1).ToString() + ".png", System.Drawing.Imaging.ImageFormat.Png);
                }
                System.Diagnostics.Process.Start("image1.png");
            }
        }
    }
}

圖片提取效果：
技術分享圖片

C# 提取PDF文本和圖片

raw namespace Spire.PDF strong ffffff != aging lena gef 任務要求：提取PDF文檔中的文本提取PDF文檔中的圖片所需工具： Free Spire.PDF for .NET 4.3 （免費版）實現代碼：【

C# 提取PPT文本和圖片的實現方案

提取 sam tor sha spa pict color edi {0} 在圖文混排的文檔中，我們可以根據需要將文檔中的文字信息或者圖片提取出來，通過C#代碼可以提取Word和PDF文件中的文本和圖片，那麽同樣的，我們也可以提取PPT幻燈片當中的文本和圖片。本篇文檔將講述

C# 如何添加文本和圖片超鏈接到Word

.net c# 超鏈接超鏈接簡單來講就是內容鏈接，通過設置超鏈接可以實現對象與網頁、站點之間的連接。鏈接目標可以是網頁、圖片、郵件地址、文件夾或者是應用程序。設置鏈接的對象可以是文本或者圖片。在以下內容中，我將介紹如何用C#編程語言對Word文檔中的文本和圖片進行超鏈接設置。執行該操作需要使用免

C# 如何添加文本、圖片水印到PPT

mini append tran tex present strong 背景圖片 ict type 對文檔添加水印可以有效聲明和保護文檔，是保護重要文件的方式之一。在PPT文檔中同樣也可以設置水印，包括文本水印和圖片水印，本文將講述如何通過Spire.Presentatio

C# 操作Word文本框——插入圖片、表格、文字、超鏈接等

C# .NET Word 文本框 Spire.Doc 概述 Text Box（文本框）是Word排版的工具之一。在Word文檔中的任何地方插入文本框，可添加補充信息，放在合適的位置，也不會影響正文的連續性。我們可以設置文本框的大小，線型，內部邊距，背景填充等效果。文本框內可以圖文混排，設置

提取PDF文檔圖片的最佳方式沒有之一

com 但是轉換成 pro 圖片上傳圖文教程 ges 方法 PDF格式文件的內容有文字也有圖片，當需要提取圖片的時候，有很多方式可以實現，但是如果想達到快速提取、準確無誤，最佳方法的圖文教程如下： 1、首先打開pdf365在線轉換平臺,pdf365.cn網站； 2、點

怎麽提取pdf文件中的圖片

-o 文件的 ces 狀態圖片成功選擇 nag 當我通常我們在網上下載的PDF文件中，圖片和文字都是在一起的，當我們看到一些好看的圖片想保存下來的時候，那麽，我們怎麽提取PDF文件中的圖片呢，小編在這裏向大家簡單的介紹一下提取PDF文件中的圖片吧。 1、PDF文件大

Java 提取PDF文件中的圖片

在之前的文章中寫了如何從PDF文件中讀取文字內容，這篇文章接著介紹如何從PDF文件中讀取圖片。使用元件： Spire.PDF for JAVA （注意不是Free Spire.PDF for Java）在使用以下程式碼前，你需要下載Spire.PDF for JAVA包並解壓縮，

C# 替換Word文本—— 用文檔、圖片、表格替換文本

ins args introduce 圖片一個修改 findall child form 編輯文檔時，對一些需要修改的字符或段落可以通過查找替換的方式，快速地更改。在C# 在word中查找及替換文本一文中，主要介紹了在Word中以文本替換文本的方法，在本篇文章中，將介紹

C# 替換Word文本—— 用文檔、圖片、表格替換

field () water color 需要 for 所在 int 修改編輯文檔時，對一些需要修改的字符或段落可以通過查找替換的方式，快速地更改。在本篇文章中，將介紹如何用一篇Word文檔、圖片或者表格來替換文檔中的指定文本字符串。示例要點如下：用文檔替換Word中

電腦中如何提取PDF文件中的圖片

頁面 pdf 輸出文件中技術分享完整再次文件夾定義通常，我們在一些PDF文件中看到一些好看的圖片，想將圖片保存下來，但是PDF文件是無法編輯的，在文件自身當中我們無法將圖片完成的提取出來，因此大家都會想辦法在不破壞圖片完整性的情況下將圖片從PDF文件中提取出來

C# 獲取PDF文件的字型資訊及指定文字的座標，寬度和高度

在本篇文章中我將分享如何使用C#程式設計的方法來獲取PDF文件中文字的字型資訊（字型名稱，大小，型別等）及指定文字的座標（X，Y），寬度和高度。這個方法使用了一個免費PDF元件Free Spire.PDF。 Free Spire.PDF簡單介紹 Free Spire.P

bootstrap-導航條中的按鈕、文本和鏈接

bootstrap-導航條中的按鈕、文本和鏈接1.運行效果如圖所示2.實現代碼如下<!DOCTYPE html> <html> <head> <meta charset="utf-8"> <meta http-equiv="X-UA-Com

jQuery的DOM操作之設置和獲取HTML、文本和值 html（）text（）val（）

java fontsize doc .text cti checkbox .net mar jsb 1. html()方法: 此方法類似於JavaScript中的innerHTML屬性，可以用來讀取或者設置某個元素中的html內容。 <html> <h

文本和字節序列

問題負責如果解碼默認分享圖片函數 python 編碼 utf-8與unicode 在一般情況下，在內存中的使用的是unicode，而在存儲或者傳輸時，使用的utf-8．因為utf-8是是不定長，可以減少存儲的空間，或者傳輸時的帶寬的占用．如何理解編碼與解碼呢？

jade成段的文本和標簽

nbsp str tro 兩種強制怎麽 bsp 一個豎線如果文本是大段的文本怎麽寫呢？因為文本會換行，比如有多行的文本，標簽，文本傻傻分不清楚 p 1234567890 => <p>1234567890</p>

C++Primer筆記——文本查詢程序（原創，未使用類）

primer color lease NPU 一個 mes getline line 筆記 1 #include <iostream> 2 #include <vector> 3 #include <set> 4

6.1.2.9 文本和字體

行高 size its 技術 erl ont 字體 info 分享字號： font-size: 20px; 默認是16px 　　px: 像素　　rem em % 移動端使用的單位字形： font-weight: bold; 　　normal 　　bol

xpath的使用：定位，獲取文本和屬性值

world src @class foo posit on() .text value oot myPage = ‘‘‘<html><title>TITLE</title><body><h1></h1>

c#獲取pdf文件頁數

fread map agen close write enum ade reader number 引用命名空間：using iTextSharp.text.pdf; string filePath = Server.MapPath("/upl

C# 提取PDF文本和圖片

所需工具：

實現代碼：

相關推薦