Selenium+Python自動化之如何繞過登入驗證碼
一、使用Fiddler抓包
1.一般登陸網站成功後,會生成一個已登入狀態的cookie,那麼只需要直接把這個值拿到,用selenium進行addCookie操作即可。
2.可以先手動登入一次,然後抓取這個cookie,這裡我們就需要用抓包工具fiddler了
3.先開啟部落格園登入介面,手動輸入賬號和密碼(不要點登入按鈕)
4.開啟fiddler抓包工具,此時再點部落格園登入按鈕
5.登入成功後,再檢視cookie變化,發現多了兩組引數,多的這兩組引數就是我們想要的,copy出來,一會有用
二、cookie操作
driver.add_cookie()
1.add_cookie(cookie_dict)方法裡面引數是cookie_dict,說明裡面引數是字典型別。
2.原始碼官方文件介紹:
add_cookie(self, cookie_dict)
Adds a cookie to your current session.
Args:
- cookie_dict: A dictionary object, with required keys - "name" and "value";
optional keys - "path", "domain", "secure", "expiry"
Usage:
driver.add_cookie({'name' : 'foo', 'value' : 'bar'})
driver.add_cookie({'name' : 'foo', 'value' : 'bar', 'path' : '/'})
driver.add_cookie({'name' : 'foo', 'value' : 'bar', 'path' : '/', 'secure':True})
3.從官方的文件裡面可以看出,新增cookie時候傳入字典型別就可以了,等號左邊的是name,等號左邊的是value。
4.把前面抓到的兩組資料(引數不僅僅只有name和value),寫成字典型別:
{'name':'.CNBlogsCookie','value':'2C3AE01E461B2D2F1572D02CB936D77A053089AA2xxxx...'}
{'name':'.Cnblogs.AspNetCore.Cookies','value':'CfDJ8Mmb5OBERd5FqtiQlKZZIG4HKz_Zxxx...'}
三、參考程式碼
# coding:utf-8
from selenium import webdriver
import time
driver = webdriver.Chrome()
driver.maximize_window()
driver.get("https://www.cnblogs.com/longronglang/")
# # 新增cookie
c1 = {u'domain': u'.cnblogs.com',
u'name': u'.CNBlogsCookie',
u'value': u'xxxx',
u'expiry': 15412950521,
u'path': u'/',
u'httpOnly': True,
u'secure': False}
c2 = {u'domain': u'.cnblogs.com',
u'name': u'.Cnblogs.AspNetCore.Cookies',
u'value': u'xxxx',
u'expiry': 15412950521,
u'path': u'/',
u'httpOnly': True,
u'secure': False}
# 新增2個值
driver.add_cookie(c1)
driver.add_cookie(c2)
time.sleep(3)
# 重新整理下頁面就見證奇蹟了
driver.refresh()
# 再來個登入後操作
driver.find_element_by_link_text(u"部落格園").click()
driver.find_element_by_link_text("Refain").click()
有幾點需要注意:
1.登入時候要勾選下次自動登入按鈕。
2.addCookie()只新增name和value,對於部落格園的登入是不成功。
3.本方法並不適合所有的網站,一般像部落格園這種記住登入狀態的才會適合。
轉自:https://mp.weixin.qq.com/s/HyIFOyPsQ5btxA0h_dXEWg