1. 程式人生 > >python 爬蟲環境配置中 tesserocr的安裝(windows)

python 爬蟲環境配置中 tesserocr的安裝(windows)

安裝tesserocr

OCR 光學字元識別,翻譯圖形驗證碼。

1.首先安裝tesseract,下載連結


下載地址

2. 安裝


已安裝完畢,不截圖了,安裝時最後一個選擇是下載支援的語言包,大概有1G多,耐心等待即可。

3. 安裝tesserocr


可以直接用: pip(3) install tesserocr pillow 命令進行安裝。
但我沒有安裝成功,所以下載了.whl檔案進行安裝。


下載後用 pip命令安裝:

pip install tesserocr-2.2.2-cp36-cp36m-win_amd64.whl

同樣的方法安裝 Pillow即可。在PyChrome上可以搜尋直接安裝。

驗證時出現錯誤


下載好一個圖片
利用python程式碼來測試:
import  tesserocr
from PIL import  Image #Pillow
image=Image.open('image.png')
print(tesserocr.image_to_text(image))

出現錯誤
print(tesserocr.image_to_text(image))
File "tesserocr.pyx", line 2401, in tesserocr._tesserocr.image_to_text
RuntimeError: Failed to init API, possibly an invalid tessdata path: D:\Program Files (x86)\Microsoft\(python的安裝目錄)


懷疑是API或者testdata的路徑有問題,將tesserocr安裝目錄下的testdata資料夾移到所提示的目錄後就解決了。
輸出 :IIUNO0BJIOM (感覺識別的不太準啊)

相關推薦

python 爬蟲環境配置 tesserocr安裝windows

安裝tesserocr OCR 光學字元識別,翻譯圖形驗證碼。 1.首先安裝tesseract,下載連結 下載地址 2. 安裝 已安裝完畢,不截圖了,安裝時最後一個選擇是下載支援的語言包,大概有1G多,耐心等待即可。 3. 安裝te

ROS入門筆記:ROS安裝環境配置及解除安裝重點

ROS入門筆記(二):ROS安裝與環境配置及解除安裝(重點) [TOC] # 1 ROS安裝步驟 ## 1.1 ROS版本 ROS目前只支援在Linux系統上安裝部署, 它的首選開發平臺是Ubuntu。 | 釋出時間 | ROS版本 | Ubuntu版本 | | :

python——爬蟲&問題解決&思考

參數 多層 得到 簡單 odi 用兩個 src http 輸出   繼續上一篇文章的內容,上一篇文章中已經將url管理器和下載器寫好了。接下來就是url解析器,總的來說這個模塊是幾個模塊中比較難的。因為通過下載器下載完頁面之後,我們雖然得到了頁面,但是這並不是我們想要的結果

Python Kivy 中文教程:安裝Windows

速度 超越 入門 ret 加速 平臺 ads 運行 打包工具 Kivy 是一套用於跨平臺快速應用開發的開源框架,只需編寫一套代碼,便可運行於各大桌面及移動平臺上(包括 Linux, Windows, OS X, Android, iOS, 以及 Raspberry Pi)

python爬蟲實踐——零基礎快速入門爬取豆瓣電影

爬蟲又稱為網頁蜘蛛,是一種程式或指令碼。 但重點在於,它能夠按照一定的規則,自動獲取網頁資訊。 爬蟲的基本原理——通用框架 1.挑選種子URL; 2.講這些URL放入帶抓取的URL列隊; 3.取出帶抓取的URL,下載並存儲進已下載網頁庫中。此外,講這些URL放入帶抓取UR

python爬蟲"Hello World"級入門例項,使用json從中國天氣網抓取資料

一、二話不說先上程式碼 python2.7版 #!/usr/bin/python2.7 #-*- coding=UTF-8 -*- import urllib import json def get_dic(url): page = urll

python爬蟲-爬取愛情公寓電影2018豆瓣短評並資料分析

說起這部電影,我本人並沒有看,其實原先是想為了情懷看一下,但是好友用親身經歷告訴我看來會後悔的,又去看了看豆瓣評分,史無前例的,,,低。 出於興趣就爬取一下這部電影在豆瓣上的短評,並且用詞雲分析一下。  1.分析url 經過分析不難發現每一頁短評的url都是一致的除

python爬蟲實踐——零基礎快速入門爬取小豬租房資訊

接下來我們爬取小豬短租租房資訊。進入主頁後選擇深圳地區的位置。地址如下: http://sz.xiaozhu.com/ 一,標題爬取 按照慣例,我們先複製標題的xpath資訊,多複製幾個進行對比: //*[@id="page_list"]/ul/li[1]/

go語言環境安裝Windows

1.下載go語言安裝包,可以到官網下載https://golang.org,在大天朝上這個網站要翻牆,所以,不翻牆,可以去這裡http://www.golangtc.com/download下載。 2.直接安裝。 3.環境變數配置 一般來說,安裝msi安裝

Maven環境配置及簡單使用

Maven環境變數配置 配置Maven前先從官網下載相關版本,Maven下載地址:http://maven.apache.org/download.cgi,筆者使用最新版本apache-mave

python爬蟲設定代理ip池——方法

"""在使用python爬蟲的時候,經常會遇見所要爬取的網站採取了反爬取技術,高強度、高效率地爬取網頁資訊常常會給網站伺服器帶來巨大壓力,所以同一個IP反覆爬取同一個網頁,就很可能被封,那如何解決呢?使用代理ip,設定代理ip池。以下介紹的免費獲取代理ip池的方法:優點:1.

Lua 環境安裝Windows

2. 安裝完成後,桌面會出現 及。其中 Lua圖示是console。Scite圖示是IDE。 3. 開啟Lua,輸入print("Hello Lua"). 4.  使用 Scite 點選中的,

阿里雲伺服器一鍵WEB環境配置---Linux學習筆記3

我們可以看到正在執行狀態的服務及埠:9000埠是php程序服務,3306埠是mysql服務,80埠是nginx服務,21埠是ftp服務。 如果看到以上資訊,則說明安裝沒有異常。這裡有一點需要注意的是,如果您選擇安裝的是apache,則沒有上面的9000埠。為什麼選擇安裝的是apache,就沒有9000

Python爬蟲學習6:scrapy入門爬取汽車評論並儲存到csv檔案

一、scrapy 安裝:可直接使用Anaconda Navigator安裝, 也可使用pip install scrapy安裝二、建立scrapy 爬蟲專案:語句格式為 scrapy startproject project_name生成的爬蟲專案目錄如下,其中spiders

wxPython的安裝Windows

python版本 -cp 版本 all 效果 widget idg app nbsp 一、wxPython介紹 1、wxPython是Python語言的一套優秀的GUI圖形庫。wxPython可以很方便的創建完整的、功能鍵全的GUI用戶界面。 wxPython是作為

composer安裝windows

all link .cn setup.php tps nbsp installer 鏈接 .org 1. 打開openssl模塊 2. php -r "readfile(‘https://getcomposer.org/installer‘);" > composer

mysql的下載及安裝windows

block 復制粘貼 分享圖片 b2c open 客戶 ast tps get 1:下載MySql 官網下載地址:https://dev.mysql.com/downloads/mysql/ 選擇對應的下載文件。(我電腦是64位,所以這下載的是64位的下載文件)

Scrapy框架的安裝windows

用anaconda安裝 這種方法是最快的。前提是安裝了anaconda。 方法:命令列執行 conda install scrapy 詢問是否安裝新的包 ,輸入y回車即可。 整個過程非常省心。 ———————————————————————————————————————————

Android Studio安裝Windows

一、下載 可在 http://www.androiddevtools.cn/ 上下載所需的各種版本 附百度網盤連結:Android Studio3.0正式版 Android Studio3.1正式版 Android Studio3.1.3正式版 二、安裝 三、設定SDK目錄

redis初識與安裝windows

Redis是什麼? Redis是一個開源免費的,效能較高的key-value資料庫,我們常見的mysql叫關係型資料庫,redis屬於非關係型資料庫。 所謂效能高,讀的速度11000次/s,寫的速度是81000次/s,(直接在記憶體中)注意是理論速度,實測沒