爬蟲中手動輸入驗證碼方法無法獲取圖片src地址

阿新 • • 發佈：2021-01-11

爬蟲中手動輸入驗證碼方法無法獲取圖片src地址

以登陸人民郵電出版社為例：https://www.ptpress.com.cn/login

驗證碼在html中圖片標籤內容：
在這裡插入圖片描述
<class=“verCodeImg” src="/kaptcha.jpg?v=0.234724039578059" οnclick=“verCode(this)”>

< class=“verCodeImg” src="/kaptcha.jpg?v=0.234724239578059" οnclick=“verCode(this)”>
可知獲取到驗證碼的src地址就能動態的

獲得驗證碼

import requests
from bs4 import BeautifulSoup

login_url = 'https://www.ptpress.com.cn/login'
req = requests.get(login_url)

#用bs4定位到元素
soup = BeautifulSoup(req.content,'lxml')
soup.select('#loginForm > div.row > div.col-md-4.col-sm-4.col-xs-4 > div > img')

但是執行後會發現它是沒有顯示src的
在這裡插入圖片描述
因為驗證碼是動態的！動態的！動態的！

用動態爬取網頁的方法：
要用到selenium庫

import requests
from selenium import webdriver

#通過動態解析獲得src
#selenium庫報錯[WinError 2] 系統找不到指定的檔案另一篇文章裡有些
path = 'G:/學習軟體/Python/Python/chromedriver.exe'
driver = webdriver.Chrome(path)
driver.get(login_url)

#定位到元素
search_src = driver.find_element_by_xpath('//*[@id="loginForm"]/div[3]/div[2]/div/img' 
)
#獲得元素的src屬性
code = search_src.get_attribute('src')

返回了src地址
在這裡插入圖片描述
但其實獲得了驗證碼的src地址，我還是沒能成功登陸
因為即使是相同的連結點進去，每一次重新整理都會有不同的驗證碼
通過動態網頁開啟是一張
解析src地址出來是另一張

爬蟲中手動輸入驗證碼方法無法獲取圖片src地址

爬蟲中手動輸入驗證碼方法無法獲取圖片src地址

Python3爬蟲中識別圖形驗證碼的例項講解

在Ant Design Pro登入功能中整合圖形驗證碼元件的方法步驟

Flask專案中實現簡訊驗證碼和郵箱驗證碼功能

JS如何實現手機端輸入驗證碼效果

vue專案中隨機生成驗證碼

scrapy在python爬蟲中搭建出錯的解決方法

Java專案中生成動態驗證碼的方式

關於flask_sqlalchemy中column 、Integer等方法無法使用問題

效能測試：Jmeter壓測過程中的簡訊驗證碼讀取

13Django-在使用者註冊程式碼中完成手機驗證碼的比對

爬蟲_request_cookie登入（驗證碼）

flowable中使用到的一些方法。獲取人員部門資訊

聯通簡訊出現大面積故障，大量使用者無法接收驗證碼，迴應：緊急處理中（附臨時解決方法）

YII2框架中驗證碼的簡單使用方法示例

java爬蟲（四）利用Jsoup獲取需要登陸的網站中的內容（無驗證碼的登入）

python爬蟲中或者字串中或者js檔案中遇到“\x”的解決方法，轉碼方法

php 驗證碼影象報錯無法找到/開啟字型(Warning: imagettftext(): Could not find/open font)的解決方法

手動實現js簡訊驗證碼輸入框

8 爬取EOS whales網站出現的ssl驗證問題以及無法建立websocket握手問題（北京大學出版社的《python 爬蟲與反爬蟲開發》書中錯誤）

爬蟲中手動輸入驗證碼方法無法獲取圖片src地址

相關推薦