1. 程式人生 > >驗證碼破解技術四部曲之環境搭建篇(一)

驗證碼破解技術四部曲之環境搭建篇(一)

前言

轉眼就變成大四狗了,大學期間做的比較深入的技術是爬蟲,但是爬蟲也有很多高階的技術沒有涉及,比如說驗證碼的破解便是其中之一,再加上我對其非常感興趣,於是乎,開始苦學影象處理、學習機器學習,驗證碼破解也有了些眉頭。

以下是我破解的幾種驗證碼。

1、最容易破解的驗證碼



直接使用tesseract庫識別。

2、download.csdn的驗證碼



使用K近鄰演算法識別。

3、weibo.cn驗證碼



使用卷積神經網路訓練識別。

說明

專案原始碼:https://github.com/nladuo/cap... (可以幫我點個star(^__^)) 
開發語言:python(編寫爬蟲),c++(編寫影象處理部分以及機器學習演算法) 
開發環境:ubuntu 14.04 
依賴庫: 
Python:PIL、BeautifulSoup4、requests 
C++:boost、opencv2、tesseract-ocr

環境搭建

安裝opencv 2.4.12

sudo apt-get install build-essential cmake libgtk2.0-dev pkg-config python-dev python-numpy libavcodec-dev libavformat-dev libswscale-dev 
wget https://codeload.github.com/Itseez/opencv/zip/2.4.12
unzip opencv-2.4.12.zip
cd opencv-2.4.12 ; mkdir release  ; cd release  
cmake -D CMAKE_BUILD_TYPE=RELEASE
-D CMAKE_INSTALL_PREFIX=/usr/local .. make -j8 sudo make install

安裝tesseract-ocr

sudo apt-get install tesseract-ocr tesseract-ocr-dev

安裝boost

sudo apt-get install libboost-all-dev

安裝python的PIL庫

sudo apt-get install python-imaging

安裝python的BeautifulSoup4、requests庫

sudo apt-get install python-pip
sudo pip install 
bs4 sudo pip install requests

下載專案原始碼

git clone https://github.com/nladuo/captcha-break.git

相關推薦

驗證破解技術四部曲環境搭建

前言 轉眼就變成大四狗了,大學期間做的比較深入的技術是爬蟲,但是爬蟲也有很多高階的技術沒有涉及,比如說驗證碼的破解便是其中之一,再加上我對其非常感興趣,於是乎,開始苦學影象處理、學習機器學習,驗證碼破解也有了些眉頭。 以下是我破解的幾種驗證碼。 1、最容易破解的

阿里雲伺服器Ubuntu環境搭建筆記

1.阿里雲免費套餐:https://free.aliyun.com/ntms/free/personal.html?handle=true 選擇第一個雲伺服器ECS,選擇免費體驗一個月 2.更多收費的雲伺服器連結:https://www.aliyun.com/product/ecs?sp

Django重新開始學習--環境搭建 筆記

nbsp url對應 tin art admin set pla base default 環境 :   python2.7   django 1.9.8   使用工具pycharm   Mysql =====================================

深度學習TensorFlow環境搭建硬體選購和主機組裝

一、硬體採購   近年來,人工智慧AI越來越多被人們所瞭解,尤其是AlphaGo的人機圍棋大戰之後,機器學習的熱潮也隨之高漲。最近,公司採購了幾批裝置,通過深度學習(TensorFlow)來研究金融行業相關問題,學習機器學習我們需要滿足一定的硬體要求,本文主要是介紹

環境搭建筆記——Maven配置Struts2+Spring4+Mybatis3執行環境

<projectxmlns="http://maven.apache.org/POM/4.0.0"xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4

openstack controller ha測試環境搭建記錄——作業系統準備

為了初步瞭解openstack controller ha的工作原理,搭建測試環境進行學習。在學習該方面知識時,當前採用的作業系統版本是centos 7.1 x64。首先在ESXi中建立2臺用於測試的虛機,最小化安裝完成centos,配置IP分別為10.0.0.12、10.0.0.13,主機名分別為contr

solr 6.6 windows 環境搭建-執行

一、window 環境jdk 1.8    tomcat 8.0本機tomcat環境:D:\Tools\solr\apache-tomcat-8.5.31本機解壓路徑:D:\Tools\solr\solr-6.6.0二、部署solr1、首先確定安裝了jdk 、tomcat、並

構建法--探索

構建 編寫 裏的 set namespace 對象 之前 定義 時也 問題一: 在Cust中無法找到telephone的get方法,這裏是因為我之前沒有telephone的成員變量,加上之後有沒有寫telephone的get方法; 解決方案:只要在Cust這個類裏面,加上

Exchange/Office365 自動處理腳本:環境準備

conn ise 相關 -exec rev use sof ant set 一、服務器要求操作系統:Windows Server 2008/2012 R2網絡要求: 加入域 允許訪問office365相關網址 開通到Exchange/Skype 的端口443,5985,5

Gentoo無線網絡卡安裝基礎知識

已開通新的部落格,後續文字都會發到新部落格 http://www.0xfree.top   最近接觸了一下Gentoo,在無線網絡卡方面遇到了問題,於是便廣泛的查詢資料,雖然到最後還是沒有搞定,但是把過程中積累下來的東西和大家分享分享,有什麼錯誤的地方,歡迎大家回帖指正 如

JavaScript學習小白

好好學習 ,天天向上。Are you ready? 一、JS概述 1. 什麼是JS? Javascript是(基於物件)和(事件驅動)的(客戶端指令碼)語言。 2. 哪一年?哪家公司?誰?第一個名字? 1995 網景 布蘭登 livescript 3. W3C第一套標準:ECMA-262

Qt開發中國象棋:工程概述

          最近看一篇關於C++實現中國象棋的部落格,於是基於該博主的框架,自己嘗試實現了一個簡單基於Qt的中國象棋遊戲,只是實現了簡單的人人對戰,還沒有實現較為複雜的人機對戰。主要涉及Qt的重繪事件QPaintEvent,用來實現棋盤的

Java多執行緒進階

一、執行緒池 1.1 執行緒池的建立 1.1.1 ThreadPoolExecutor 1.1.2 執行緒池的分類

IT名企常見面試題總結計算機網路

1.OSI七層模型和 TCP/IP四層模型 osi七層模型和tcp/ip四層模型對比(圖片來源於網路) 下面是各層分別對應的一些協議: 2.TCP傳輸的三次握手與四次揮手 首先要理解TCP中兩個序

JAVA工程師成神路--基礎目錄

在網上看到一篇文章“java成神之路”,按照上面的要求大幹一番,看看能不能成神。 具體指標 一、基礎篇 1-1 JVM     1.1.1  JAVA記憶體           1.1.1.1  JAVA記憶體模型           1.1.1.2 JAVA記憶體管理  

Hadoop——hadoopMapReduce理論—— Writable序列化

一、序列化的概念 序列化就是把記憶體中的物件,轉換成位元組序列(或其他資料傳輸協議)以便於儲存(持久化)和網路傳輸。 反序列化就

Salesforce學習路-admin幾個簡單概念

Salesforce是一款非常強大的CRM(Customer Relationship Management)系統,國外企業使用十分頻繁,而國內目前僅有幾家在使用(當然,國內外企使用的依舊較多),因此相對來講,中文資料相對較少。這裡,結合之前參加的培訓和自己的一些理解,說說Salesforce的相關知識,如有

Salesforce學習路-developer利用VS Code結合Git開發Salesforce

Part 1: 從Git中克隆程式碼到本地 git clone https://github.com/git/git Part 2: 在VS Code中安裝Salesforce和Git外掛 在VS Code中開啟程式碼工程 安裝Salesforce Extension Pack 安裝

Strust2基礎環境搭建

第一步 新建一個web專案 第二步 導包(以下包都在strust官網上下載),推薦下載struts-2.3.36-all 進入如下頁面,可以用win解壓縮.war檔案   或者   是把.war檔案放到tomcat-webapps下面,然後啟動to

阿里雲伺服器Ubuntu環境搭建筆記——軟體安裝

1.嘗試安裝screen,輸入命令:apt install screen 輸出:Reading package lists... Done Building dependency tree        Reading state informatio