selenium補充及破解驗證碼的方法及高階案例

阿新 • • 發佈：2020-09-21

今日內容概要

selenium其他方法補充
requests-html模組
破解驗證碼的方法
研究高階爬蟲破解知乎登入

今日內容詳細

selenium其他方法補充

滑動驗證碼

"""滑動驗證碼其實用程式碼破解還不如自己手動劃一下，我們單純的瞭解一下程式碼破解的方式"""
#動作鏈(滑動驗證碼沒有程式碼破解的必要 不如手動滑獲取cookie即可)
from selenium import webdriver
from selenium.webdriver import ActionChains
import time
browser = webdriver.Chrome()
url = 'http://www.runoob.com/try/try.php?filename=jqueryui-api-droppable'
browser.get(url)
browser.switch_to.frame('iframeResult')
source = browser.find_element_by_css_selector('#draggable')
target = browser.find_element_by_css_selector('#droppable')
actions = ActionChains(browser)
# actions.drag_and_drop(source, target)
actions.click_and_hold(source)
time.sleep(3)
for i in range(5):
    actions.move_by_offset(xoffset=17,yoffset=0).perform()
    time.sleep(0.5)

actions.release()

"""
為什麼不直接一步到位 而需要設定間歇停頓?
	滑動驗證碼內部有檢測機制，如果你速度太快並且很準
	那麼後臺會認為你是一個程式從而讓你校驗不通過
"""

獲取cookie

url = 'https://account.cnblogs.com/signin?returnUrl=https%3A%2F%2Fwww.cnblogs.com%2F'
driver = webdriver.Chrome()
driver.get(url=url)
time.sleep(50)
driver.refresh()
c = driver.get_cookies()
print(c)
# 得到了登入之後網站給出的cookies
with open('xxx.txt','w') as f:
  json.dump(c,f)

"""
cookie池
	獲取同一個網站很多授權之後的cookie存放於某處
	之後再訪問該網站的時候都是從中隨機獲取一個訪問
"""


破解登入的思路其實很明確 就是想法設法的拿到登入之後對方給你的cookie資訊即可

驗證碼的破解

三種方式
	方式1(最繁瑣)
  	程式碼破解
    	軟體:Tesseract-ocr 
    	模組:pytesseract
  方式2
  	打碼平臺
    	eg:http://www.yundama.com
  方式3
  	人工打碼

requests-html模組

使用此庫時，您將自動獲得：
    全面的JavaScript支援！
    CSS選擇器（又名jQuery風格，多虧了PyQuery）。
    XPath Selectors，使您感到內fa。
    模擬的使用者代理（如真實的Web瀏覽器）。
    自動跟隨重定向。
    連線池和cookie永續性。
    您知道和喜歡的請求體驗具有神奇的解析能力。
  
http://requests-html.kennethreitz.org/
https://github.com/psf/requests-html
    
    
# 支援非同步
from requests_html import AsyncHTMLSession
asession = AsyncHTMLSession()
async def get_pythonorg():
    r = await asession.get('https://www.baidu.com/')
    return r
async def get_reddit():
   r = await asession.get('https://www.jd.com/')
   return r
async def get_google():
   r = await asession.get('https://www.sogo.com/')
   return r
results = asession.run(get_pythonorg, get_reddit, get_google)
# results # check the requests all returned a 200 (success) code
# [<Response [200]>, <Response [200]>, <Response [200]>]
# Each item in the results list is a response object and can be interacted with as such
for result in results:
     print(result.html.url)
        
# 支援js呼叫
r = session.get('http://python-requests.org/')
r.html.render()
r.html.search('Python 2 will retire in only {months} months!')['months']
'<time>25</time>'

同步非同步

同步
	提交完請求之後原地等待任務的返回結果，什麼時候有結果什麼時候繼續下一步操作

非同步
	提交完請求之後不願地等待任務的返回結果直接執行下一個動作，任務後期會通過非同步回撥機制獲取
    
"""
非同步效率肯定比同步高
"""

知乎登入

"""
知乎的特點如果沒有登入那麼該網站任何資源你都別想看
"""

補充

window.open('https://www.sogo.com','','height=400px,width=400px')

window.close()  # 關閉當前頁

selenium補充及破解驗證碼的方法及高階案例

今日內容概要 selenium其他方法補充 requests-html模組破解驗證碼的方法研究高階爬蟲破解知乎登入

C# ASHX生成驗證碼圖片及校驗

剛剛看博看到偶然儲存一下萬一以後用得到呢借鑑兩位老哥 https://www.cnblogs.com/ljmm/archive/2020/05/13/12877537.html

spring boot:spring security給使用者登入增加自動登入及圖形驗證碼功能(spring boot 2.3.1)

一，圖形驗證碼的用途? 1，什麼是圖形驗證碼？驗證碼（CAPTCHA）是“Completely Automated Public Turing test to tell Computers and Humans Apart”（全自動區分計算機和人類的圖靈測試）的縮寫，它是用

知識補充之面向物件魔法方法及mysql等相關內容

# 1 seo sem百度搜索充錢可以靠前的是sem不充錢靠前的seo谷歌，必應國際版百度搜不到，搜出來的10篇文章9篇一毛一樣，碰到一個問題，怎麼解決，知乎（2個），思否（1個），csdn（沒有）

Vue聯調，圖片及簡訊驗證碼

1.vue傳送簡訊邏輯前端函式如下,js方法程式碼無需更改，前端程式碼邏輯在components\\common\\lab_header.vue

vue3.0實現點選切換驗證碼(元件)及校驗

本文例項為大家分享了vue3.0實現點選切換驗證碼(元件)及校驗的具體程式碼，供大家參考，具體內容如下

C# 程式碼生成二維碼方法及程式碼示例（QRCoder）

背景二維碼是越來越流行了，很多地方都有可能是使用到。如果是靜態的二維碼還是比較好處理的，通過線上工具就可以直接生成一張二維碼圖片，比如：草料二維碼。但有的時候是需要動態生成的（根據動態資料生成），這個

Python爬蟲實戰演示：破解驗證碼識別和彈窗處理

前言在我們寫爬蟲的過程中，目標網站常見的干擾手段就是設定驗證碼等，本就將基於Selenium實戰講解如何處理彈窗和驗證碼，爬取的目標網站為某儀器預約平臺

超級鷹破解驗證碼

一、申請超級鷹賬號，獲得應用id 二、下載sdk(壓縮包，解壓後直接得到py檔案)

Python+Selenium隨機生成手機驗證碼並檢查頁面上是否彈出重複手機號碼提示框

1、隨機生成格式正確手機號碼 # 隨機產生格式正確的手機號碼 def create_phone(self):

selenum破解驗證碼要用到的程式碼

獲取驗證碼圖片程式碼 from selenium import webdriver from PIL import Image # 第一步：建立一個瀏覽器

selenium---使用cookie越過驗證碼

# 使用cookie跳過驗證碼登入網站 import time from selenium import webdriver driver=webdriver.Firefox()

爬蟲中手動輸入驗證碼方法無法獲取圖片src地址

技術標籤：定位python爬蟲爬蟲中手動輸入驗證碼方法無法獲取圖片src地址以登陸人民郵電出版社為例：https://www.ptpress.com.cn/login

使用muggle_ocr處理selenium登入管理後臺驗證碼問題

技術標籤：selenium測試影象識別seleniumpython驗證碼muggle_ocr 在使用selenium登入管理後臺時，會遇到驗證碼問題，若驗證碼相對簡單，則可以使用影象識別開源庫muggle_ocr來識別驗證碼

js的函式呼叫及dom獲取的方法及獲取日期的方法

JS操作CSS的樣式的四種方法方法一：使用obj.style.className來修改樣式表的類名 function changeStyle1() {undefinedvar obj = document.getElementById(\"btnB\");obj.style.backgroundColor= \"black\";}方法二：

Selenium +Java -獲取圖片驗證碼

package JoyReachAds; import java.io.File; import java.awt.image.BufferedImage; import java.io.IOException;

黑產用“未來武器”破解驗證碼，打碼小工都哭了

當我們正討論如何用AI推動產業升級、改變未來生活時，不法分子也在研究AI技術，並通過各種手段非法牟利。近日，騰訊守護者計劃安全團隊協助警方打掉市面上最大打碼平臺“快啊答題”，挖掘出一條從撞庫盜號、破解驗證

SpringMVC生成的驗證碼圖片不顯示問題及解決方法

近期用SSM框架寫一個專案，登入模組需要生成驗證碼圖片，我把相關的程式碼寫好了之後傳到 jsp ，但是圖片不顯示，檢視控制檯顯示404，反覆查詢了一下程式碼並沒有發現任何問題，程式碼如下：

vue實現四級導航及驗證碼的方法例項

實現效果: 首先建立五個介面 1.home.vue頁面 <template> <div id=\"home-wrapper\"> <h1>{{ name }}</h1>

Linux 安裝二進位制MySQL 及破解MySQL密碼的方法

1.確保系統中有依賴的libaio 軟體，如果沒有： yum -y install libaio 2.解壓二進位制MySQL軟體包

selenium補充及破解驗證碼的方法及高階案例

今日內容概要

今日內容詳細

selenium其他方法補充

滑動驗證碼

獲取cookie

驗證碼的破解

requests-html模組

同步非同步

知乎登入

補充

相關推薦