python 爬蟲環境配置中 tesserocr的安裝(windows)
安裝tesserocr
OCR 光學字元識別,翻譯圖形驗證碼。
1.首先安裝tesseract,下載連結
下載地址
2. 安裝
已安裝完畢,不截圖了,安裝時最後一個選擇是下載支援的語言包,大概有1G多,耐心等待即可。
3. 安裝tesserocr
可以直接用:
pip(3) install tesserocr pillow
命令進行安裝。 但我沒有安裝成功,所以下載了.whl檔案進行安裝。
下載後用 pip命令安裝:
pip install tesserocr-2.2.2-cp36-cp36m-win_amd64.whl
同樣的方法安裝 Pillow即可。在PyChrome上可以搜尋直接安裝。
驗證時出現錯誤
下載好一個圖片
利用python程式碼來測試:
import tesserocr
from PIL import Image #Pillow
image=Image.open('image.png')
print(tesserocr.image_to_text(image))
出現錯誤
print(tesserocr.image_to_text(image))
File "tesserocr.pyx", line 2401, in tesserocr._tesserocr.image_to_text
RuntimeError: Failed to init API, possibly an invalid tessdata path: D:\Program Files (x86)\Microsoft\(python的安裝目錄)
懷疑是API或者testdata的路徑有問題,將tesserocr安裝目錄下的testdata資料夾移到所提示的目錄後就解決了。
輸出 :IIUNO0BJIOM (感覺識別的不太準啊)
相關推薦
python 爬蟲環境配置中 tesserocr的安裝(windows)
安裝tesserocr OCR 光學字元識別,翻譯圖形驗證碼。 1.首先安裝tesseract,下載連結 下載地址 2. 安裝 已安裝完畢,不截圖了,安裝時最後一個選擇是下載支援的語言包,大概有1G多,耐心等待即可。 3. 安裝te
ROS入門筆記(二):ROS安裝與環境配置及解除安裝(重點)
ROS入門筆記(二):ROS安裝與環境配置及解除安裝(重點) [TOC] # 1 ROS安裝步驟 ## 1.1 ROS版本 ROS目前只支援在Linux系統上安裝部署, 它的首選開發平臺是Ubuntu。 | 釋出時間 | ROS版本 | Ubuntu版本 | | :
python——爬蟲&問題解決&思考(四)
參數 多層 得到 簡單 odi 用兩個 src http 輸出 繼續上一篇文章的內容,上一篇文章中已經將url管理器和下載器寫好了。接下來就是url解析器,總的來說這個模塊是幾個模塊中比較難的。因為通過下載器下載完頁面之後,我們雖然得到了頁面,但是這並不是我們想要的結果
Python Kivy 中文教程:安裝(Windows)
速度 超越 入門 ret 加速 平臺 ads 運行 打包工具 Kivy 是一套用於跨平臺快速應用開發的開源框架,只需編寫一套代碼,便可運行於各大桌面及移動平臺上(包括 Linux, Windows, OS X, Android, iOS, 以及 Raspberry Pi)
python爬蟲實踐——零基礎快速入門(二)爬取豆瓣電影
爬蟲又稱為網頁蜘蛛,是一種程式或指令碼。 但重點在於,它能夠按照一定的規則,自動獲取網頁資訊。 爬蟲的基本原理——通用框架 1.挑選種子URL; 2.講這些URL放入帶抓取的URL列隊; 3.取出帶抓取的URL,下載並存儲進已下載網頁庫中。此外,講這些URL放入帶抓取UR
python爬蟲"Hello World"級入門例項(二),使用json從中國天氣網抓取資料
一、二話不說先上程式碼 python2.7版 #!/usr/bin/python2.7 #-*- coding=UTF-8 -*- import urllib import json def get_dic(url): page = urll
python爬蟲-爬取愛情公寓電影(2018)豆瓣短評並資料分析
說起這部電影,我本人並沒有看,其實原先是想為了情懷看一下,但是好友用親身經歷告訴我看來會後悔的,又去看了看豆瓣評分,史無前例的,,,低。 出於興趣就爬取一下這部電影在豆瓣上的短評,並且用詞雲分析一下。 1.分析url 經過分析不難發現每一頁短評的url都是一致的除
python爬蟲實踐——零基礎快速入門(四)爬取小豬租房資訊
接下來我們爬取小豬短租租房資訊。進入主頁後選擇深圳地區的位置。地址如下: http://sz.xiaozhu.com/ 一,標題爬取 按照慣例,我們先複製標題的xpath資訊,多複製幾個進行對比: //*[@id="page_list"]/ul/li[1]/
go語言環境安裝(Windows)
1.下載go語言安裝包,可以到官網下載https://golang.org,在大天朝上這個網站要翻牆,所以,不翻牆,可以去這裡http://www.golangtc.com/download下載。 2.直接安裝。 3.環境變數配置 一般來說,安裝msi安裝
Maven環境配置及簡單使用(二)
Maven環境變數配置 配置Maven前先從官網下載相關版本,Maven下載地址:http://maven.apache.org/download.cgi,筆者使用最新版本apache-mave
python爬蟲設定代理ip池——方法(一)
"""在使用python爬蟲的時候,經常會遇見所要爬取的網站採取了反爬取技術,高強度、高效率地爬取網頁資訊常常會給網站伺服器帶來巨大壓力,所以同一個IP反覆爬取同一個網頁,就很可能被封,那如何解決呢?使用代理ip,設定代理ip池。以下介紹的免費獲取代理ip池的方法:優點:1.
Lua 環境安裝(Windows)
2. 安裝完成後,桌面會出現 及。其中 Lua圖示是console。Scite圖示是IDE。 3. 開啟Lua,輸入print("Hello Lua"). 4. 使用 Scite 點選中的,
阿里雲伺服器一鍵WEB環境配置---Linux學習筆記(3)
我們可以看到正在執行狀態的服務及埠:9000埠是php程序服務,3306埠是mysql服務,80埠是nginx服務,21埠是ftp服務。 如果看到以上資訊,則說明安裝沒有異常。這裡有一點需要注意的是,如果您選擇安裝的是apache,則沒有上面的9000埠。為什麼選擇安裝的是apache,就沒有9000
Python爬蟲學習6:scrapy入門(一)爬取汽車評論並儲存到csv檔案
一、scrapy 安裝:可直接使用Anaconda Navigator安裝, 也可使用pip install scrapy安裝二、建立scrapy 爬蟲專案:語句格式為 scrapy startproject project_name生成的爬蟲專案目錄如下,其中spiders
wxPython的安裝(Windows)
python版本 -cp 版本 all 效果 widget idg app nbsp 一、wxPython介紹 1、wxPython是Python語言的一套優秀的GUI圖形庫。wxPython可以很方便的創建完整的、功能鍵全的GUI用戶界面。 wxPython是作為
composer安裝(windows)
all link .cn setup.php tps nbsp installer 鏈接 .org 1. 打開openssl模塊 2. php -r "readfile(‘https://getcomposer.org/installer‘);" > composer
mysql的下載及安裝(windows)
block 復制粘貼 分享圖片 b2c open 客戶 ast tps get 1:下載MySql 官網下載地址:https://dev.mysql.com/downloads/mysql/ 選擇對應的下載文件。(我電腦是64位,所以這下載的是64位的下載文件)
Scrapy框架的安裝(windows)
用anaconda安裝 這種方法是最快的。前提是安裝了anaconda。 方法:命令列執行 conda install scrapy 詢問是否安裝新的包 ,輸入y回車即可。 整個過程非常省心。 ———————————————————————————————————————————
Android Studio安裝(Windows)
一、下載 可在 http://www.androiddevtools.cn/ 上下載所需的各種版本 附百度網盤連結:Android Studio3.0正式版 Android Studio3.1正式版 Android Studio3.1.3正式版 二、安裝 三、設定SDK目錄
(一)redis初識與安裝(windows)
Redis是什麼? Redis是一個開源免費的,效能較高的key-value資料庫,我們常見的mysql叫關係型資料庫,redis屬於非關係型資料庫。 所謂效能高,讀的速度11000次/s,寫的速度是81000次/s,(直接在記憶體中)注意是理論速度,實測沒