python 爬蟲環境配置中 tesserocr的安裝（windows）

阿新 • • 發佈：2019-01-21

安裝tesserocr

OCR 光學字元識別，翻譯圖形驗證碼。

1.首先安裝tesseract，下載連結

下載地址

2. 安裝

已安裝完畢，不截圖了，安裝時最後一個選擇是下載支援的語言包，大概有1G多，耐心等待即可。

3. 安裝tesserocr

可以直接用: pip(3) install tesserocr pillow 命令進行安裝。
但我沒有安裝成功，所以下載了.whl檔案進行安裝。

下載後用 pip命令安裝：

pip install tesserocr-2.2.2-cp36-cp36m-win_amd64.whl

同樣的方法安裝 Pillow即可。在PyChrome上可以搜尋直接安裝。

驗證時出現錯誤

下載好一個圖片

利用python程式碼來測試：

import  tesserocr
from PIL import  Image #Pillow
image=Image.open('image.png')
print(tesserocr.image_to_text(image))

出現錯誤
print(tesserocr.image_to_text(image)) File "tesserocr.pyx", line 2401, in tesserocr._tesserocr.image_to_text RuntimeError: Failed to init API, possibly an invalid tessdata path: D:\Program Files (x86)\Microsoft\（python的安裝目錄）

懷疑是API或者testdata的路徑有問題，將tesserocr安裝目錄下的testdata資料夾移到所提示的目錄後就解決了。
輸出：IIUNO0BJIOM （感覺識別的不太準啊）

python 爬蟲環境配置中 tesserocr的安裝（windows）

安裝tesserocr OCR 光學字元識別，翻譯圖形驗證碼。 1.首先安裝tesseract，下載連結下載地址 2. 安裝已安裝完畢，不截圖了，安裝時最後一個選擇是下載支援的語言包，大概有1G多，耐心等待即可。 3. 安裝te

ROS入門筆記（二）：ROS安裝與環境配置及解除安裝（重點）

python——爬蟲&問題解決&思考（四）

參數多層得到簡單 odi 用兩個 src http 輸出　　繼續上一篇文章的內容，上一篇文章中已經將url管理器和下載器寫好了。接下來就是url解析器，總的來說這個模塊是幾個模塊中比較難的。因為通過下載器下載完頁面之後，我們雖然得到了頁面，但是這並不是我們想要的結果

Python Kivy 中文教程：安裝（Windows）

速度超越入門 ret 加速平臺 ads 運行打包工具 Kivy 是一套用於跨平臺快速應用開發的開源框架，只需編寫一套代碼，便可運行於各大桌面及移動平臺上（包括 Linux, Windows, OS X, Android, iOS, 以及 Raspberry Pi）

python爬蟲實踐——零基礎快速入門（二）爬取豆瓣電影

爬蟲又稱為網頁蜘蛛，是一種程式或指令碼。但重點在於，它能夠按照一定的規則，自動獲取網頁資訊。爬蟲的基本原理——通用框架 1.挑選種子URL； 2.講這些URL放入帶抓取的URL列隊； 3.取出帶抓取的URL，下載並存儲進已下載網頁庫中。此外，講這些URL放入帶抓取UR

python爬蟲"Hello World"級入門例項（二）,使用json從中國天氣網抓取資料

一、二話不說先上程式碼 python2.7版 #!/usr/bin/python2.7 #-*- coding=UTF-8 -*- import urllib import json def get_dic(url): page = urll

python爬蟲-爬取愛情公寓電影（2018）豆瓣短評並資料分析

說起這部電影，我本人並沒有看，其實原先是想為了情懷看一下，但是好友用親身經歷告訴我看來會後悔的，又去看了看豆瓣評分，史無前例的，，，低。出於興趣就爬取一下這部電影在豆瓣上的短評，並且用詞雲分析一下。 1.分析url 經過分析不難發現每一頁短評的url都是一致的除

python爬蟲實踐——零基礎快速入門（四）爬取小豬租房資訊

接下來我們爬取小豬短租租房資訊。進入主頁後選擇深圳地區的位置。地址如下： http://sz.xiaozhu.com/ 一，標題爬取按照慣例，我們先複製標題的xpath資訊，多複製幾個進行對比： //*[@id="page_list"]/ul/li[1]/

go語言環境安裝（Windows）

1.下載go語言安裝包，可以到官網下載https://golang.org，在大天朝上這個網站要翻牆，所以，不翻牆，可以去這裡http://www.golangtc.com/download下載。 2.直接安裝。 3.環境變數配置一般來說，安裝msi安裝

Maven環境配置及簡單使用（二）

Maven環境變數配置配置Maven前先從官網下載相關版本，Maven下載地址:http://maven.apache.org/download.cgi,筆者使用最新版本apache-mave

python爬蟲設定代理ip池——方法（一）

"""在使用python爬蟲的時候，經常會遇見所要爬取的網站採取了反爬取技術，高強度、高效率地爬取網頁資訊常常會給網站伺服器帶來巨大壓力，所以同一個IP反覆爬取同一個網頁，就很可能被封，那如何解決呢？使用代理ip，設定代理ip池。以下介紹的免費獲取代理ip池的方法：優點：1.

Lua 環境安裝（Windows）

2. 安裝完成後，桌面會出現及。其中 Lua圖示是console。Scite圖示是IDE。 3. 開啟Lua，輸入print("Hello Lua"). 4. 使用 Scite 點選中的，

阿里雲伺服器一鍵WEB環境配置---Linux學習筆記（3）

我們可以看到正在執行狀態的服務及埠：9000埠是php程序服務，3306埠是mysql服務，80埠是nginx服務，21埠是ftp服務。如果看到以上資訊，則說明安裝沒有異常。這裡有一點需要注意的是，如果您選擇安裝的是apache，則沒有上面的9000埠。為什麼選擇安裝的是apache，就沒有9000

Python爬蟲學習6：scrapy入門（一）爬取汽車評論並儲存到csv檔案

一、scrapy 安裝：可直接使用Anaconda Navigator安裝，也可使用pip install scrapy安裝二、建立scrapy 爬蟲專案：語句格式為 scrapy startproject project_name生成的爬蟲專案目錄如下，其中spiders

wxPython的安裝（Windows）

python版本 -cp 版本 all 效果 widget idg app nbsp 一、wxPython介紹 1、wxPython是Python語言的一套優秀的GUI圖形庫。wxPython可以很方便的創建完整的、功能鍵全的GUI用戶界面。 wxPython是作為

composer安裝（windows）

all link .cn setup.php tps nbsp installer 鏈接 .org 1. 打開openssl模塊 2. php -r "readfile(‘https://getcomposer.org/installer‘);" > composer

mysql的下載及安裝（windows）

block 復制粘貼分享圖片 b2c open 客戶 ast tps get 1：下載MySql 官網下載地址：https://dev.mysql.com/downloads/mysql/ 選擇對應的下載文件。（我電腦是64位，所以這下載的是64位的下載文件）

Scrapy框架的安裝（windows）

用anaconda安裝這種方法是最快的。前提是安裝了anaconda。方法：命令列執行 conda install scrapy 詢問是否安裝新的包，輸入y回車即可。整個過程非常省心。 ———————————————————————————————————————————

Android Studio安裝（Windows）

一、下載可在 http://www.androiddevtools.cn/ 上下載所需的各種版本附百度網盤連結：Android Studio3.0正式版 Android Studio3.1正式版 Android Studio3.1.3正式版二、安裝三、設定SDK目錄

（一）redis初識與安裝（windows）

Redis是什麼？ Redis是一個開源免費的，效能較高的key-value資料庫，我們常見的mysql叫關係型資料庫，redis屬於非關係型資料庫。所謂效能高，讀的速度11000次/s,寫的速度是81000次/s,（直接在記憶體中）注意是理論速度，實測沒

python 爬蟲環境配置中 tesserocr的安裝（windows）

安裝tesserocr

1.首先安裝tesseract，下載連結

2. 安裝

3. 安裝tesserocr

驗證時出現錯誤

相關推薦