滑動驗證碼破解—python—以某東網站為例

阿新 • • 發佈：2018-12-02

目前很多網站的登入都需要採用驗證碼的方式進行登入，這一定程度上增大的爬蟲的難度。以極驗驗證碼為例，這家公司的驗證碼在國內的使用者很多，在業界也很出名。

在這裡插入圖片描述
出於好奇心和學術研究的目的，我嘗試了破解某東的驗證碼，也查了很多別人的部落格和資料，最後算是成功了吧。

一、破解過程分析

1. 首先我們到將使用者名稱和密碼輸入，點選登入

在這裡插入圖片描述

2.接下來就是重點了，網站會有機率彈出一個拼圖驗證碼，如果你頻繁的登入，就不會出現驗證碼。

在這裡插入圖片描述

3.接下來我們就要分析一下了，怎麼完成拼圖呢？

我選擇的方式是，先拿到缺口圖片和小塊圖片，進行拼接，得到小塊的位置，就可以確定滑塊的移動距離（實際上還需要檢視小塊圖片左側的距離），然後拖動滑塊，按照一定的軌跡進行移動，最後完成拼圖。這就是拼圖的過程。

二、程式碼分析

1.獲取圖片，下載到本地

檢視網頁的程式碼

在這裡插入圖片描述
通過網頁原始碼我們發現，圖片是一base64的編碼方式顯示在網頁中的，當然其他的網站可能是圖片連結，這種情況我們需要先將其解碼，然後寫入檔案中就好了。

下載圖片的程式碼

def pic_download(url,type):
    url = url
    root = "../img_db/"
    # path = root + str(time.strftime("%Y-%m-%d-%H-%M-%S", time.localtime()))+'.png'
    path = root + type + '.png' 

    try:
        if not os.path.exists(root):
            os.mkdir(root)
        if os.path.exists(path):
            os.remove(path)
        #如果圖片是url的格式
        # r = requests.get(url)
        # r.raise_for_status()
        #如果圖片是base64編碼的
        data=url.split(',')[1]
        img=base64.b64decode( 
data)
        # 使用with語句可以不用自己手動關閉已經開啟的檔案流
        with open(path, "wb") as f:  # 開始寫檔案，wb代表寫二進位制檔案
            f.write(img)
            print(f.name)
        print("下載完成")
        return f.name
    except Exception as e:
        print("獲取失敗!" + str(e))

2.合併圖片，找到位置

這裡我們使用了opencv的包，這個包在影象處理方便時非常強大的，可以做人臉識別等，功能十分強大，膜拜大牛。

def get_distance(small_url, big_url):
    # 引用上面的圖片下載
    otemp = pic_download(small_url, 'small')

    time.sleep(2)

    # 引用上面的圖片下載
    oblk = pic_download(big_url, 'big')

    # # 計算拼圖還原距離
    target = cv2.imread(otemp, 0)
    template = cv2.imread(oblk, 0)
    w, h = target.shape[::-1]
    temp = 'temp.jpg'
    targ = 'targ.jpg'
    cv2.imwrite(temp, template)
    cv2.imwrite(targ, target)
    target = cv2.imread(targ)
    target = cv2.cvtColor(target, cv2.COLOR_BGR2GRAY)
    target = abs(255 - target)
    cv2.imwrite(targ, target)
    target = cv2.imread(targ)
    template = cv2.imread(temp)
    result = cv2.matchTemplate(target, template, cv2.TM_CCOEFF_NORMED)
    x, y = np.unravel_index(result.argmax(), result.shape)
    # 缺口位置
    print((y, x, y + w, x + h))

    # 呼叫PIL Image 做測試
    image = Im.open(oblk)

    xy = (y + 20, x + 20, y + w - 20, x + h - 20)
    # 切割
    imagecrop = image.crop(xy)
    # 儲存切割的缺口
    imagecrop.save("../img_db/new_image.png")
    return y

這裡我們需要注意一點，我們計算出了缺口的位置，但是頁面顯示的圖片大小是通過css佈局的，所以和我們下載的圖片或寫入的圖片大寫是不一樣的，所以我們在移動的時候需要計算一個比例。

3.設計移動軌跡，移動滑塊

def move_mouse(browser,distance,element):
    has_gone_dist=0
    remaining_dist = distance
    # distance += randint(-10, 10)
    # 按下滑鼠左鍵
    ActionChains(browser).click_and_hold(element).perform()
    time.sleep(0.5)
    while remaining_dist > 0:
        ratio = remaining_dist / distance
        if ratio < 0.1:
            # 開始階段移動較慢
            span = random.randint(3, 5)
        elif ratio > 0.9:
            # 結束階段移動較慢
            span = random.randint(5, 8)
        else:
            # 中間部分移動快
            span = random.randint(15, 20)
        ActionChains(browser).move_by_offset(span, random.randint(-5, 5)).perform()
        remaining_dist -= span
        has_gone_dist += span
        time.sleep(random.randint(5, 20) / 100)

    ActionChains(browser).move_by_offset(remaining_dist, random.randint(-5, 5)).perform()
    ActionChains(browser).release(on_element=element).perform()

極驗的驗證碼會識別我們拖動的過程，分析我們的移動軌跡，但是雖然我們的移動軌跡是模擬人，先緩慢後加速最後減速的過程。但是這樣還是不夠的，我們還需要多設計幾個移動軌跡，根據我的測試經驗得出的結論。

結語

下面是要導的包，還需要把對應瀏覽器的webdriver安裝的python直譯器的路徑裡，這裡就不細講了，有問題可以留言交流。

import os
import random
import time
import base64
# import requests
import cv2
from selenium import webdriver
from selenium.webdriver import ActionChains
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.wait import WebDriverWait
import numpy as np
from PIL import Image as Im

完整的程式碼：https://github.com/onlyonedaniel/onlyone/blob/master/jd_test.py
轉載請標明出處，歡迎留言交流

滑動驗證碼破解—python—以某東網站為例

目前很多網站的登入都需要採用驗證碼的方式進行登入，這一定程度上增大的爬蟲的難度。以極驗驗證碼為例，這家公司的驗證碼在國內的使用者很多，在業界也很出名。出於好奇心和學術研究的目的，我嘗試了破解某東的驗證碼，也查了很多別人的部落格和資料，最後算是成功了吧。一、破解過程分析

滑動驗證碼破解（selenium+PIL）-嗶哩嗶哩bilibili

#本文思路通過selenium模擬瀏覽器空值瀏覽器進行驗證碼的操作，利用PIL圖片處理工具進行對圖片處理，識別到圖片要滑動過去的陰影距離小知識點： 1、ActionChains方法是捕捉控制滑鼠進行操作，click_and_hold 點選不放，move_by_offset 按座

極驗驗證的滑動驗證碼破解

題記——毛主席教導我們一切帝國主義都是紙老虎極驗驗證（http://www.geetest.com）是目前比較前沿新穎的一種驗證方式，相比傳統的字元型驗證碼更加人性化，使用者驗證的時間更短，更具互動

統計學習三：2.K近鄰法代碼實現（以最近鄰法為例）

數據集 learning pytho port 4.3 @property 存儲 uil github 通過上文可知感知機模型的基本原理，以及算法的具體流程。本文實現了感知機模型算法的原始形式，通過對算法的具體實現，我們可以對算法有進一步的了解。具體代碼可以在我的githu

如何刪除流氓軟體--以某壓縮檔案為例

如何刪除流氓軟體–以某壓縮檔案為例流氓軟體無法正常解除安裝的原因 1.部分軟體，如快壓存在無法解除安裝乾淨的情況，當你解除安裝的時候，會給出該程式正在被其他程式開啟，無法執行該操作。。。 2.如果你在把它的所有應用程式都已經關閉的情況下，還出現了這種狀況，那

小白如何入門Python? 制作一個網站為例

機器適合實用編寫 1.7 測試 tutorials 一定的感到以制作一個網站為例，聊一聊小白如何入門Python，具有一定的參考價值，感興趣的小夥伴們可以參考一下首先最重要的問題是為什麽要學習python？這個問題這個將指導你如何學習Python和學習的方式。以

高階Python爬蟲實戰：破解極驗滑動驗證碼

今天給大家帶來的是極驗驗證碼的selenium破解之法，是不是有點小激動呢，小夥伴們等不及了，讓

破解極驗滑動驗證碼

ora 十六 rgb 遊戲 form 保存過程每天網頁截圖閱讀目錄一介紹二實現三說明一介紹一些網站會在正常的賬號密碼認證之外加一些驗證碼，以此來明確地區分人/機行為，從一定程度上達到反爬的效果，對於簡單的校驗碼Tesseroc

Python + selenium + requests實現12306全自動搶票，驗證碼破解加自動點選！！！

Python + selenium + requests實現12306全自動搶票，驗證碼破解加自動點選！！！！！測試結果：整個買票流程可以再快一點，不過為了穩定起見，有些地方等待了一些時間完整程式，拿去可用整個程式分了三個模組：購票模組（主體）、驗證碼識別模組、餘票查

破解滑動驗證碼(極驗)

from selenium.webdriver import ActionChains from selenium.webdriver.support import expected_conditions as EC from selenium.webdriver.support.ui im

搭建CNN模型破解網站驗證碼！Python大法真的好！

專案介紹在文章CNN大戰驗證碼中，我們利用TensorFlow搭建了簡單的CNN模型來破解某個網站的驗證碼。驗證碼如下：網站驗證碼在本文中，我們將會用Keras來搭建一個稍微複雜的CNN模型來破解以上的驗證碼。資料集對於驗證碼圖片的處理過程在本文

Python網路爬蟲之極驗滑動驗證碼識別

驗證碼分析使用程式碼完成極驗驗證碼的識別，需要了解一下幾點：通過該驗證碼的識別動作為：點選並拖拽滑塊 - 滑動滑塊至缺口處 - 釋放滑鼠該驗證碼增加了機器學習來識別拖動的軌跡，即：

爬取有驗證碼的網站，（爬之前最好看一下君子協定）robots.txt,以人人網為例，每爬100條資料需要驗證一次（需要自己購買一個驗證碼破解會員，不是很貴，我這裡選擇的是超級鷹），簡版

#!/usr/bin/env python # -*- coding: utf-8 -*- # @Time : 2018/10/15 14:03 # @Author : zhangz # @File : day4_yanzhengma.py # @Software: Py

【2018.12.14】java + selenium 破解騰訊滑動驗證碼

最近開始新專案web自動化，登入頁面有個驗證碼，很難受。經過百度、谷歌、若干大法，終於實現了登入。欽此。下面是個老哥用python寫的 https://www.jianshu.com/p/832b76dfe6a1?from=timeline package com.answ

Python 批量下載驗證碼圖片及切割驗證碼圖片，識別驗證碼，並以識別的文字重命令驗證碼

1、Python 批量下載驗證碼圖片 2、批量切割驗證碼圖片 3、識別驗證碼，並以識別的文字重命令驗證碼 #!C:/Python27 #coding=utf-8 import pytesseract from pytesser import * from PIL imp

使用python的OpenCV模組識別滑動驗證碼的缺口

前面寫過一篇使用selenium模擬登入解決滑塊驗證問題，在該篇文章裡，使用selenium滑動模組找缺口主要靠“蒙”，最近終於找到一個好的方法，可以將滑動驗證碼中的缺口識別出來了，主要是學習了點選開啟

Python入門：驗證碼破解（二）

一、定位驗證碼元素二、下載驗證圖片三、破解驗證碼 #test.py from selenium import webdriver import os import urllib from PIL import Image import pytes

Python入門：PIL之驗證碼破解

環境介紹 1、當前檔案的路徑是：/Users/frankslg/PycharmProjects/cjb/ver/ver_code1.py 2、而存放圖片的路徑是：/Users/frankslg/PycharmProjects/cjb/img/*.jpeg

破解滑動驗證碼（selenium, opencv）

概述由於本人近期參加一個遊戲比賽，然後有個拉票的環節，票高者得人氣獎。又比較懶不想到處拉票麻煩別人。就想自己嘗試著破解驗證碼然後來達到刷票的目的。這個也純屬娛樂，最後發現是不可行的。最終目標：實現自動點選紅星，並且拖動完成驗證自動點選並且獲取

滑動驗證碼破解—python—以某東網站為例

目前很多網站的登入都需要採用驗證碼的方式進行登入，這一定程度上增大的爬蟲的難度。以極驗驗證碼為例，這家公司的驗證碼在國內的使用者很多，在業界也很出名。

一、破解過程分析

1. 首先我們到將使用者名稱和密碼輸入，點選登入

2.接下來就是重點了，網站會有機率彈出一個拼圖驗證碼，如果你頻繁的登入，就不會出現驗證碼。

3.接下來我們就要分析一下了，怎麼完成拼圖呢？

二、程式碼分析

1.獲取圖片，下載到本地

2.合併圖片，找到位置

3.設計移動軌跡，移動滑塊

結語

相關推薦