驗證碼破解技術四部曲之環境搭建篇(一)
前言
轉眼就變成大四狗了,大學期間做的比較深入的技術是爬蟲,但是爬蟲也有很多高階的技術沒有涉及,比如說驗證碼的破解便是其中之一,再加上我對其非常感興趣,於是乎,開始苦學影象處理、學習機器學習,驗證碼破解也有了些眉頭。
以下是我破解的幾種驗證碼。
1、最容易破解的驗證碼
直接使用tesseract庫識別。
2、download.csdn的驗證碼
使用K近鄰演算法識別。
3、weibo.cn驗證碼
使用卷積神經網路訓練識別。
說明
專案原始碼:https://github.com/nladuo/cap... (可以幫我點個star(^__^))
開發語言:python(編寫爬蟲),c++(編寫影象處理部分以及機器學習演算法)
開發環境:ubuntu 14.04
依賴庫:
Python:PIL、BeautifulSoup4、requests
C++:boost、opencv2、tesseract-ocr
環境搭建
安裝opencv 2.4.12
sudo apt-get install build-essential cmake libgtk2.0-dev pkg-config python-dev python-numpy libavcodec-dev libavformat-dev libswscale-dev
wget https://codeload.github.com/Itseez/opencv/zip/2.4.12
unzip opencv-2.4.12.zip
cd opencv-2.4.12 ; mkdir release ; cd release
cmake -D CMAKE_BUILD_TYPE=RELEASE -D CMAKE_INSTALL_PREFIX=/usr/local ..
make -j8
sudo make install
安裝tesseract-ocr
sudo apt-get install tesseract-ocr tesseract-ocr-dev
安裝boost
sudo apt-get install libboost-all-dev
安裝python的PIL庫
sudo apt-get install python-imaging
安裝python的BeautifulSoup4、requests庫
sudo apt-get install python-pip
sudo pip install bs4
sudo pip install requests
下載專案原始碼
git clone https://github.com/nladuo/captcha-break.git
相關推薦
驗證碼破解技術四部曲之環境搭建篇(一)
前言 轉眼就變成大四狗了,大學期間做的比較深入的技術是爬蟲,但是爬蟲也有很多高階的技術沒有涉及,比如說驗證碼的破解便是其中之一,再加上我對其非常感興趣,於是乎,開始苦學影象處理、學習機器學習,驗證碼破解也有了些眉頭。 以下是我破解的幾種驗證碼。 1、最容易破解的
阿里雲伺服器之Ubuntu環境搭建筆記(一)
1.阿里雲免費套餐:https://free.aliyun.com/ntms/free/personal.html?handle=true 選擇第一個雲伺服器ECS,選擇免費體驗一個月 2.更多收費的雲伺服器連結:https://www.aliyun.com/product/ecs?sp
Django重新開始學習--環境搭建 筆記(一)
nbsp url對應 tin art admin set pla base default 環境 : python2.7 django 1.9.8 使用工具pycharm Mysql =====================================
深度學習(TensorFlow)環境搭建:(一)硬體選購和主機組裝
一、硬體採購 近年來,人工智慧AI越來越多被人們所瞭解,尤其是AlphaGo的人機圍棋大戰之後,機器學習的熱潮也隨之高漲。最近,公司採購了幾批裝置,通過深度學習(TensorFlow)來研究金融行業相關問題,學習機器學習我們需要滿足一定的硬體要求,本文主要是介紹
環境搭建筆記(一)——Maven配置Struts2+Spring4+Mybatis3執行環境
<projectxmlns="http://maven.apache.org/POM/4.0.0"xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4
openstack controller ha測試環境搭建記錄(一)——作業系統準備
為了初步瞭解openstack controller ha的工作原理,搭建測試環境進行學習。在學習該方面知識時,當前採用的作業系統版本是centos 7.1 x64。首先在ESXi中建立2臺用於測試的虛機,最小化安裝完成centos,配置IP分別為10.0.0.12、10.0.0.13,主機名分別為contr
solr 6.6 windows 環境搭建-執行(一)
一、window 環境jdk 1.8 tomcat 8.0本機tomcat環境:D:\Tools\solr\apache-tomcat-8.5.31本機解壓路徑:D:\Tools\solr\solr-6.6.0二、部署solr1、首先確定安裝了jdk 、tomcat、並
構建之法--探索篇(一)
構建 編寫 裏的 set namespace 對象 之前 定義 時也 問題一: 在Cust中無法找到telephone的get方法,這裏是因為我之前沒有telephone的成員變量,加上之後有沒有寫telephone的get方法; 解決方案:只要在Cust這個類裏面,加上
Exchange/Office365 自動處理腳本:環境準備篇(一)
conn ise 相關 -exec rev use sof ant set 一、服務器要求操作系統:Windows Server 2008/2012 R2網絡要求: 加入域 允許訪問office365相關網址 開通到Exchange/Skype 的端口443,5985,5
Gentoo無線網絡卡安裝之基礎知識篇(一)
已開通新的部落格,後續文字都會發到新部落格 http://www.0xfree.top 最近接觸了一下Gentoo,在無線網絡卡方面遇到了問題,於是便廣泛的查詢資料,雖然到最後還是沒有搞定,但是把過程中積累下來的東西和大家分享分享,有什麼錯誤的地方,歡迎大家回帖指正 如
JavaScript學習之小白篇(一)
好好學習 ,天天向上。Are you ready? 一、JS概述 1. 什麼是JS? Javascript是(基於物件)和(事件驅動)的(客戶端指令碼)語言。 2. 哪一年?哪家公司?誰?第一個名字? 1995 網景 布蘭登 livescript 3. W3C第一套標準:ECMA-262
Qt開發之中國象棋篇(一):工程概述
最近看一篇關於C++實現中國象棋的部落格,於是基於該博主的框架,自己嘗試實現了一個簡單基於Qt的中國象棋遊戲,只是實現了簡單的人人對戰,還沒有實現較為複雜的人機對戰。主要涉及Qt的重繪事件QPaintEvent,用來實現棋盤的
Java多執行緒之進階篇(一)
一、執行緒池 1.1 執行緒池的建立 1.1.1 ThreadPoolExecutor 1.1.2 執行緒池的分類
IT名企常見面試題總結之計算機網路篇(一)
1.OSI七層模型和 TCP/IP四層模型 osi七層模型和tcp/ip四層模型對比(圖片來源於網路) 下面是各層分別對應的一些協議: 2.TCP傳輸的三次握手與四次揮手 首先要理解TCP中兩個序
JAVA工程師成神之路--基礎篇(一)目錄
在網上看到一篇文章“java成神之路”,按照上面的要求大幹一番,看看能不能成神。 具體指標 一、基礎篇 1-1 JVM 1.1.1 JAVA記憶體 1.1.1.1 JAVA記憶體模型 1.1.1.2 JAVA記憶體管理
Hadoop(十)——hadoop之MapReduce理論篇(一)—— Writable序列化
一、序列化的概念 序列化就是把記憶體中的物件,轉換成位元組序列(或其他資料傳輸協議)以便於儲存(持久化)和網路傳輸。 反序列化就
Salesforce學習之路-admin篇(一)幾個簡單概念
Salesforce是一款非常強大的CRM(Customer Relationship Management)系統,國外企業使用十分頻繁,而國內目前僅有幾家在使用(當然,國內外企使用的依舊較多),因此相對來講,中文資料相對較少。這裡,結合之前參加的培訓和自己的一些理解,說說Salesforce的相關知識,如有
Salesforce學習之路-developer篇(一)利用VS Code結合Git開發Salesforce
Part 1: 從Git中克隆程式碼到本地 git clone https://github.com/git/git Part 2: 在VS Code中安裝Salesforce和Git外掛 在VS Code中開啟程式碼工程 安裝Salesforce Extension Pack 安裝
Strust2基礎之環境搭建篇
第一步 新建一個web專案 第二步 導包(以下包都在strust官網上下載),推薦下載struts-2.3.36-all 進入如下頁面,可以用win解壓縮.war檔案 或者 是把.war檔案放到tomcat-webapps下面,然後啟動to
阿里雲伺服器之Ubuntu環境搭建筆記(二)——軟體安裝
1.嘗試安裝screen,輸入命令:apt install screen 輸出:Reading package lists... Done Building dependency tree Reading state informatio