有了這款工具，自動化識別驗證碼再也不是問題

阿新 • • 發佈：2022-12-09

每天進步一點點，關注我們哦，每天分享測試技術文章

本文章出自【碼同學軟體測試】

碼同學公眾號：自動化軟體測試，領取資料可加：magetest

碼同學抖音號：小碼哥聊軟體測試

環境準備

1、windows 環境下載 exe

http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe

雙擊 exe，一路 next 完成 Tesseract-OCR 安裝

免費領取碼同學軟體測試課程筆記+超多學習資料+完整視訊+面試題，可加微信：magetest

2、配置環境變數

PATH 增加 D:\ProgramFiles\Tesseract-OCR

新建環境變數 TESSDATA_PREFIX 值為

 D:\ProgramFiles\Tesseract-OCR\tessdata

這是將語言字型檔資料夾新增到環境變數 TESSDATA_PREFIX 中

CMD 命令列視窗輸入如下命令：

檢視版本號

C:\Users\18611>tesseract -v tesseract 4.00.00alpha leptonica-1.74.1 libgif 4.1.6(?) : libjpeg 8d (libjpeg-turbo 1.5.0) : libpng  1.6.20: libtiff 4.0.6 : zlib 1.2.8 :  libwebp 0.4.3 : libopenjp2 2.1.0

檢視支援的語言包

C:\Users\18611>tesseract --list-langs List of available languages (2): eng osd 
C:\Users\18611>

命令識別圖片

識別如下圖片驗證碼

使用 tesseract 命令識別圖片中的內容

C:\Users\18611>cd Desktop C:\Users\18611\Desktop>tesseract test2.png output Tesseract Open Source OCR Engine v4.00.00alpha with Leptonica C:\Users\18611\Desktop> 【語法】:tesseract imagename outputbase [-l lang] [-psm pagesegmode]  [configfile…]

imagename 為目標圖片檔名，需加格式字尾；
outputbase 是轉換結果檔名；
lang 是語言名稱（在 Tesseract-OCR 中 tessdata 資料夾可看到以 eng 開頭的語言檔案 eng.traineddata），如不標-l eng 則預設為 eng。

java自動識別圖片

將 tesseract.exe 命令儲存為 bat 檔案，bat 內容為：

//圖片路徑 D:\Tesseract-OCR\test.png 生成 txt 檔案存放路徑及檔名 result

程式碼實現如下：

package com.mtx.util;
import 
java.io.BufferedReader;
import 
java.io.File;
import 
java.io.FileInputStream;
import 
java.io.InputStreamReader;

/** * @ClassName ReadCpacha
      * @Description TODO
      * @Author 彩虹 rainbow QQ3130978832
      * @Date-Time 2022/6/9 13:55
      * @ProjectName MtxPublic
      * @Copyright 北京碼同學網路科技有限公司
**/

public 
class 
ReadCpacha
{  

public 
static 
String 
readPic(){  
        String 
cmd= "
cmd /c start D:\\Tesseract-OCR\\tesseract.bat";  
    try 
{  
         Runtime.
getRuntime().exec(
cmd);  
    } 
catch
(
Exception e) {  
            e.
printStackTrace();  
    }  
    try 
{           //執行緒阻塞 3 秒等待 tesseract.exe 執行完成           Thread.sleep
(3000);      }catch 
(InterruptedException e) {           e.
printStackTrace();      }      //執行 tesseract.exe 識別圖片後生成 result.txt 檔案中儲存識別後驗證碼           //讀取 result.txt 檔案獲取驗證碼           // ReadTxt         BufferedReader 
bufferedReader = new 
BufferedReader(inputStreamReader);           StringBuffer 
sb= new StringBuffer();           String 
text = null;           while
((text = bufferedReader.readLine()) != null){                 //逐行讀取到的字串存到 StringBuffer 物件                      sb.
append(text);            }            return 
sb.toString();         }catch 
(Exception e) {              e.
printStackTrace();         }      }        return 
null;    }      public 
static void 
main(String[] args) {          String 
str = readPic();//呼叫封裝方法測試          System.out.println(str);      }}
C:\Users\18611\IdeaProjects\MtxPublic>tesseract --help-psmPage segmentation modes:  0 Orientation and script detection (OSD) only.  1 Automatic page segmentation with OSD.  2 Automatic page segmentation, but no OSD, or OCR.  3 Fully automatic page segmentation, but no OSD. (Default)  4 Assume a single column of text of variable sizes.  5 Assume a single uniform block of vertically aligned text.  6 Assume a single uniform block of text.  7 Treat the image as a single text line.  8 Treat the image as a single word.9 Treat the image as a single word in a circle.10 Treat the image as a single character.11 Sparse text. Find as much text as possible in no particular order.12 Sparse text with OSD.13 Raw line. Treat the image as a single text line,  bypassing hacks that are Tesseract-specific.
C:\Users\18611\IdeaProjects\MtxPublic>

免費領取碼同學軟體測試課程筆記+超多學習資料+學習完整視訊 ☞ 可加：magetest／關注碼同學公眾號：自動化軟體測試

本文著作權歸作者所有，任何形式的轉載都請聯絡作者獲得授權並註明出處。

有了這款工具，自動化識別驗證碼再也不是問題

每天進步一點點，關注我們哦，每天分享測試技術文章本文章出自【碼同學軟體測試】

有了這款工具，定位線上問題事半功倍｜雲效工程師指北

大家好，我叫劉玄，負責雲效流水線的開發。程式設計師在日常工作中經常會遇到一些線上問題需要排查，本文的主人公程式設計師小張也不例外。但排查的過程卻時常令他困擾不已。讓我們一起看看他遇到了哪些問題，又是怎

有了這款視覺化工具，Java 應用效能調優 so easy。。。

JVisualVM 簡介案例分析準備模擬記憶體洩漏樣例使用JVisualVM分析記憶體洩漏 JVisualVM 遠端監控 Tomcat

有了這款視覺化工具，Java 應用效能分析、調優 so easy

https://mp.weixin.qq.com/s?__biz=MzI4Njc5NjM1NQ==&mid=2247495937&idx=1&sn=3a218db3ff445af84e3397dfa068144c&chksm=ebd5ce2ddca2473bb6baab75dc61890d22dbea9e0188b26a04ffc6403db470c2cd1a528

有了這款任務管理神器，工作更便捷高效

同是一名網際網路產品的運營，太瞭解這個行業的苦累和心酸，所以在日常複雜的工作中就非常需要一個可以幫助記憶規劃和執行的東西，比如一款事項管理軟體。而在我前期去尋找軟體的時候發現，現在市面上的任務管理軟體

合宙Luat | 有了這個小工具，你可以像專家一樣分析模組訊號質量

訊號質量深切影響著模組和終端裝置的運作。那麼，如何判斷實際專案中模組訊號質量的好壞呢？

有了這 4 款工具，老闆再也不怕我寫爛SQL了

你對於正在執行的mysql 效能如何？引數設定的是否合理？賬號設定的是否存在安全隱患？是否瞭然於胸？

讓SpringBoot不需要Controller、Service、DAO、Mapper，臥槽！這款工具絕了！

Dataway介紹 Dataway 是基於 DataQL 服務聚合能力，為應用提供的一個介面配置工具。使得使用者無需開發任何程式碼就配置一個滿足需求的介面。整個介面配置、測試、冒煙、釋出。一站式都通過 Dataway 提供的 UI 介面

機器人也能有觸覺：北航造了根機器手指，紋理識別準確率 100%

8 月 6 日訊息，北京航空航天大學的一個研究團隊最近開發了一種新的觸覺感測技術，能夠讓機器人擁有像人一樣的觸覺，感受到物體表面的紋理是什麼樣的，還能感受到物體有多硬。

以色列科技公司研發出一款 AI 工具，可識別你是“真生病”還是“裝病請假”

北京時間 8 月 16 日下午訊息，據報道，以色列科技公司 Binah 早前開發一款 AI 工具，可以讓企業透過智慧電話、電腦遠距監察員工的生命跡象，以確認員工是真的生病，還是裝病請假。

用了這款docker監控平臺，再也不用記一大堆命令了，真香!

每天進步一點點，關注我們哦，每天分享測試技術文章本文章出自【碼同學軟體測試】

Java進階專題(十一) 想理解JVM看了這篇文章，就知道了！（中）

前言上次講解了JVM記憶體相關知識，今天繼續JVM專題。 JVM垃圾回收演算法什麼是垃圾回收

【IT之家評測室】效能小鋼炮有了高顏值，聯想小新 13s 銳龍版冰瓷瑩玉體驗

2019 年，聯想推出了 13.3 英寸的小新 Pro 13 機型，搭載了 16:10 的 2K 屏，再加上其優秀的散熱、激進的效能調教和極高的價效比，迅速成為了一款真香機。之後，聯想又推出了酷睿核顯版小新 Pro 13s 冰瓷瑩玉，這是一

明瞭 | 看了這篇文章，多年不能理解的分散式事物，終於看懂了！

基礎知識工欲善其事，必先利其器。所以需要先有一定的基礎知識。事物事物指的是對應用程式進行的嚴密的操作，添加了事物以後，所有的操作都必須完成，否則已經發生的事物進行撤銷，即，事物具有四個特點

有了這個IDEA外掛，從此不用再開Postman了

一、前言介面除錯是每個軟體開發從業者必不可少的一項技能，一個專案的的完成，可能介面測試除錯的時間比真正開發寫程式碼的時間還要多，幾乎是每個開發的日常工作項。

大廠門檻高，Android渣本處境難，讀了這篇文章，你將知道如何能進大廠，如何實現財務自由，如何在工作中游刃有餘

前言 10月份美團在內網通報最新的職級體系調整，明年初起實行新的“扁平職級，寬頻薪酬”體系，原有的“M+P”雙職級線、“1-2 至 3-3”等專業序列被取消，取而代之的是以“L+數字”命名的單職級線。與此同時

#老楊說運維# 裝了不少監控工具，比如Zabbix，告警資訊和監控指標集中管理了嗎？

老楊說，現在很多的企業，對於IT運維工作，都安裝了不少監控工具。比如普羅米修斯啦、Zabbix啦、甚至也有不少IOE的產品。但大多數企業首先會把告警的資料進行集中管理，這樣便於及時發現IT系統可能存在的問

有了Git這個功能，再也不需要依賴IDE了！

大家好，今天給大家介紹一個隱藏的功能——搜尋。我們在寫程式碼的時候經常遇到的一種情況就是，我們想要知道某一個函式是怎麼定義的，這樣我們才能知道該如何呼叫它。如果程式碼少的話我們當然可以自己人肉查詢，但

有了這些神器軟體，全網音樂免費下載

本文首發微信公眾號陳蛋蛋碎碎念，獲取更多資源，請掃描文末二維碼關注

科技改變醫療：谷歌推出新 AI 工具，可識別常見面板狀況

據外媒報道，由於人工智慧在醫療保健領域有多種用途，谷歌計劃使用人工智慧幫助使用者瞭解更多常見的面板病。當與智慧手機等技術相結合時，這種醫學知識可以真正改善個人瞭解自身健康的方式。

有了這款工具，自動化識別驗證碼再也不是問題

相關推薦