python wand image純圖片PDF轉圖片後呼叫百度OCR

阿新 • • 發佈：2018-12-12

一、安裝庫

pip install wand
yum update
yum -y install ImageMagick-devel 我自己是在docker裡面安裝測試的，沒問題

二、開整大體思路：

使用wand處理純圖片的PDF檔案(轉成圖片)
使用Image庫處理PDF生成的圖片
圖片傳給百度OCR識別

貼程式碼吧

# coding=utf-8
from __future__ import division

import StringIO
import math
from wand.image import Image
# 這裡我起了個別名
from PIL import Image as 
 PImage

# 百度OCR最大長度
bai_du_ocr_max = 4096

#主要方法
def convert(file_name, target_width=1500):
   try:
       with Image(filename=file_name) as img:
           image_page_num = len(img.sequence)

           # PDF裡面只有一張圖片
           if image_page_num == 1:
               # 獲取最終圖片寬高
               target_width, 
 target_height = _get_one_info(target_width, img.width, img.height)

               # 縮放，文件上說比resize速度快
               img.sample(target_width, target_height)

               # 如果最終高度大於百度最大高度，則crop
               if target_height > bai_du_ocr_max:
                   img.crop(0, 0, target_width, bai_du_ocr_max) 


               # img.save(filename='%s.jpg' % (str(int(time.time())) + '_' + str(img.width)))
               result = img.make_blob('jpg')

               # 下面是準備二值化，發現總體速度還不如直接傳給百度
               # paste_image = PImage.open(StringIO.StringIO(img.make_blob('jpg')))
               # paste_image = paste_image.convert("L")
               # paste_image.show()
               # d = StringIO.StringIO()
               # paste_image.save(d, 'JPEG')
               # result = d.getvalue()

           # PDF裡面有一張以上圖片
           else:
               # 多張時，獲取最終寬高、拼接頁數
               target_width, target_height, page_num = _get_more_info(
                   target_width, img.width, img.height, image_page_num
               )

               # 生成貼上的背景圖 (測試多次，發現L比RGB快)
               paste_image = PImage.new('L', (target_width, target_height))

               # 拼接圖片
               for i in range(0, page_num):
                   image = Image(image=img.sequence[i])
                   # 計算一張圖的高度
                   one_img_height = int(target_height / page_num)
                   # 縮放
                   image.sample(target_width, one_img_height)
                   # 將wand庫檔案轉成PIL庫檔案
                   pasted_image = PImage.open(StringIO.StringIO(image.make_blob('jpg')))
                   # 將圖片貼上到背景圖
                   paste_image.paste(pasted_image, (0, one_img_height * i))

               # 如果最終高度大於百度最大高度，則crop
               if target_height > bai_du_ocr_max:
                   paste_image = paste_image.crop((0, 0, target_width, bai_du_ocr_max))

               # 從記憶體中讀取檔案
               d = StringIO.StringIO()
               # 這裡是JPEG不是JPG
               paste_image.save(d, 'JPEG')
               result = d.getvalue()
               # paste_image.save('%s.jpg' % (str(int(time.time())) + '_' + str(img.width)))
               # 測試的時候可以開啟
               # paste_image.show()
   except Exception as e:
       result = False
   return result


# 一張時獲取寬高,如果圖片寬頻大於我們想要的寬度，則等比縮放圖片高度
def _get_one_info(target_width, img_width, img_height):
   if img_width > target_width:
       ratio = target_width / img_width
       target_height = int(ratio * img_height)
   else:
       target_width = img_width
       target_height = img_height
   return target_width, target_height


# 多張時獲取寬高和拼接頁數
def _get_more_info(target_width, img_width, img_height, image_page_num):
   one_width, one_height = _get_one_info(target_width, img_width, img_height)
   if one_height < bai_du_ocr_max:
       # 百度最大高度除以每張圖高度，向上取整，即拼接圖片的數量
       num = int(math.ceil(bai_du_ocr_max / one_height))
       # 取拼接數和總頁數的最小值
       page_num = min(num, image_page_num)
       return one_width, one_height * page_num, page_num
   else:
       return one_width, one_height, 1  # 1頁


# 除錯時候用
def _ocr(content):
   url = '百度OCR連結(自己去百度OCR官網申請就行)'
   img = base64.b64encode(content)
   params = {"image": img}
   params = urllib.urlencode(params)

   request = urllib2.Request(url, params)
   request.add_header('Content-Type', 'application/x-www-form-urlencoded')
   response = urllib2.urlopen(request)
   content = response.read()
   # print content
   dict_content = json.loads(content)
   text = "\n".join(map(lambda x: x["words"], dict_content["words_result"]))
   return text


# 除錯時候用
def _write_file(path, data, type="w"):
   try:
       f = open(path, '%sb' % type)
   except:
       f = open(path.encode("utf-8"), '%sb' % type)
   f.write(data)
   f.close()


# 除錯時候用
if __name__ == '__main__':
   import sys
   import base64
   import json
   import urllib
   import urllib2
   import time

   start = time.time()
   source_file = sys.argv[1]
   ret = convert(source_file, 1500)
   end = time.time()
   # 這裡我統一儲存下檔案，方便開啟觀察
   _write_file(str(end) + '.jpg', ret)
   if ret:
       text = _ocr(ret)
   end_parse = time.time()
   print '____________________________________________'
   print end - start
   print end_parse - end
   print '+++++++++++++++++++++++++++++++++++++++++++++'
   print text

呼叫方法(python檔名字和檔案路徑自己替換)

python pdf2img.py file_path

PS：我這裡一張和多張時分開的，我發現我的PDF檔案大多數都是一頁的(需求方)，極少數是多頁。另外，1頁的時候只用wand一個庫就行，不需要貼上到大圖上，會省去一些時間。有些問題沒做就是，併發高的時候，伺服器記憶體可能扛不住，畢竟圖片都是在記憶體裡面。

python wand image純圖片PDF轉圖片後呼叫百度OCR

一、安裝庫 pip install wand yum update yum -y install ImageMagick-devel 我自己是在docker裡面安裝測試的，沒問題二、開整大體思路：使用wand處理純圖片的PDF檔案(轉成圖片) 使用I

PDF轉圖片以及轉html

type 電子書技術分享 tor 實現 img image() lose bag 嘿，筆者就是本著有意思的心態。其實實現的原理與ppt轉html的一致。先轉成圖片，然後把圖片呈現在html上。直接貼代碼嘍。 package com.css.java.lea

PDF轉圖片，怎樣實現PDF轉圖片

PDF怎樣轉圖片呢？因為圖片傳輸資訊的直觀性和方便性，所以現在很多的資訊都是通過圖片進行傳遞的，那麼如果我們手上有一份需要以圖片格式進行傳輸的PDF檔案，那麼我們應該怎樣實現PDF轉圖片的問題呢？下面跟隨小編的步伐一起來看一下吧。步驟一：在電腦上將需要進行轉換的PDF檔案準備好，同時通過瀏覽器搜尋迅捷PDF線

[那些年踩過的坑]pdf轉換為圖片的教程(pdf的Base64轉換為圖片的base64和自己不通過第三方來實現pdf轉圖片的Dome)

　　因為工作需要,要把PDF的64字串轉換為圖片的base64儲存到資料庫,但是看了看國內外,一方面是做這個的比較少,還有就是做這個真的很煩. 　　PDF轉圖片呢,大概的實現思路方式一般有兩種,一種就是重繪,類似於畫畫,把看到的畫到新的畫布上;第二種呢,就會識別裡面的內容複製到新的畫布上,我也不知道我比喻準

PDF轉圖片(C#版本)

1 using System; 2 using System.Collections.Generic; 3 using System.Linq; 4 using System.Windows.Forms; 5 using O2S.Components.PDFRender4NET; 6 using Sys

安卓手機PDF轉圖片的簡單操作方法

有時候我們可能需要將手機的照片放在一起，然後轉換為PDF格式的檔案，現在不僅是電腦手機也可以實現了，徹底的解除了電腦的束縛，今天小編就將轉換的方法分享給大家。轉換工具介紹：它是一款提供檔案格式轉換的辦公應用。支援一鍵完成PDF檔案與Office、HTML、TX

關於PDF轉圖片檔案

大家好，我是你們親愛的小六六，上篇說到會出有關PDF轉圖片檔案，現在就給大家貼出來，有需要的朋友參考。話不多說上乾貨!!! public static List<String> pdfToImagePath(String filePath){

go語言中pdf轉圖片功能的實現(CentOS)

一、centos下環境部署步驟1：部署ImageMagick(2)解壓剛才下載的檔案： tar xvf ImageMagick-6.9.9-36.tar.gz(3)進入解壓目錄：cd ImageMagick-6.9.9-36(4)檢查配置：./configure(5)安裝j

linux PDF轉圖片

最近有將PPT首頁做成封面的需求，可以通過PPT—>PDF—>圖片的方式來獲得，這裡記錄下PDF轉圖片的方法。（PPT及PPTX轉PDF：點選開啟連結）通過ImageMagick包可以

java實現PDF轉圖片（每頁轉換成一張圖片，可單頁轉換或指定頁數）

話不多說，直接上程式碼 public class PDF2IMAGE { public static void main(String[] args) { if(args!=null && args.length>=4) {

Android應用開發之PDF轉圖片功能實現

一、概述轉眼畢業小兩年了，回想這兩年寫的程式碼，不由得想起了上學那會兒某位網際網路大牛說，搞IT這行如果你沒有寫夠十萬行程式碼，那你就還沒有入門，俺這個時候真的有點汗顏啊，此處省略十萬字。小編最近開始整理這兩年寫的程式碼，不由得首先想起了今天要寫的這個功能—

java實現pdf轉圖片pdf

為了實現pdf報表不可篡改，將pdf報表轉換為內容全為圖片的pdf報表。實現思路： 3.將byte[]圖片資料加入到輸出pdf中（使用itext.jar）。實現方法： public static void pdfToImageToPd

pdf轉圖片、提取pdf文字、提取pdf圖片

package com.midevip.common.util; import com.itextpdf.text.pdf.PdfReader;

PDF轉圖片Java實現

<dependency> <groupId>org.apache.pdfbox</groupId> <artifactId>fontbox</artifactId> <v

（轉）PDF轉圖片工具類

rendering ret isn rotation xpage wim erro buffere item import org.apache.commons.lang3.StringUtils; import org.icepdf.core.pobjects.Do

怎樣將pdf文件轉換成圖片，pdf轉圖片的小技巧

選擇自己的自動打開文件文件夾 ces RoCE 彈出設置圖 Pdf文件是辦公當中普遍使用得文件格式，該文件格式因自身的優異性得到廣泛使用。可是pdf文件通常需要借助功能才能進行查閱。因此在假期時間，突然需要查看pdf工作文件，可是身邊沒有電腦，手機也無法查看時，就

PDF轉圖片工具

urn com mce rac put ESS output 直接 run 點擊下載（提取碼：1ll1 ）軟件功能基於mupdf，UI使用wxpython開發功能：支持pdf轉圖片，圖片格式png 支持批量轉換使用：第一步，點擊按鈕添加文檔到列表，或直接將待

檔案流轉換工具、二維碼生成工具、pdf轉圖片流

import java.awt.image.BufferedImage; import java.io.ByteArrayInputStream; import java.io.ByteArrayOutputStream; import java.io.File; impo

Java讀寫pdf、pdf轉圖片工具類

本工具類所用到的相關jar包及版本有： 1.pdfbox-1.5.0.jar 2.fontbox-1.5.0.jar 3.jempbox-1.5.0.jar 4.iText-5.0.6.jar; package com.qunliv

C# web實現word 轉Html、office轉Html、pdf轉圖片線上預覽檔案

改篇 pdf 預覽再本機沒問題，釋出再iis中不行，（使用剪貼簿的問題..excel和word 可以,）詳細配置及程式碼 word 轉Html 複製程式碼 1 /// <summary> 2 /// word轉成html 3

python wand image純圖片PDF轉圖片後呼叫百度OCR

相關推薦