python爬蟲登陸問題

阿新 • • 發佈：2019-07-13

根據騰訊課堂網頁登陸問題進行解說（需要安裝谷歌瀏覽器）：

1、匯入庫

import requests
from selenium import webdriver

2、根據騰訊課堂連結，進入頁面，獲取頁面中登陸的xpath，並進行點選操作

driver = webdriver.Chrome()
driver.get("https://ke.qq.com/course/403521")
driver.find_element_by_xpath('//*[@id="js_login"]').click()

3、進入登陸頁面之後獲取登陸方式，本次選擇使用qq進行登陸，獲取qq登陸的xpath並進行點選操作。

driver.find_element_by_xpath('/html/body/div[4]/div/div[2]/div[2]/a[1]').click()

4、點選使用賬號密碼登陸。在該登陸過程中出現以下錯誤。

主要原因是無法找到我們定位的xpath，需要先找到定位元素所處的frame，並從frame中尋找該元素。

driver.switch_to_frame("login_frame_qq")//引號中新增frame標籤中的name或id值
driver.find_element_by_xpath('//*[@id="switcher_plogin"]').click()

5、獲取到輸入賬號密碼以及登陸位置的xpath。當執行時再次出現定位不到xpath的情況，使用第四步的方法依舊沒能成功，提示所在框架不對，估計是跟第4步的frame標籤的name相同的原因吧。最後的解決方法是：先回到最外層框架，之後進入要定位元素的框架，最後對賬號密碼進行定位。

driver.switch_to.default_content()//回到最外層框架
driver.switch_to_frame("login_frame_qq")//進入定位元素的框架
driver.find_element_by_xpath('//*[@id="u"]').clear()
driver.find_element_by_xpath('//*[@id="u"]').send_keys("輸入自己的賬號")
driver.find_element_by_xpath('//*[@id="p"]').clear()
driver.find_element_by_xpath('//*[@id="p"]').send_keys("輸入自己的密碼")

6、點選登陸按鈕，至此就已經進入網頁版的騰訊課堂了。

driver.find_element_by_xpath('//*[@id="login_button"]').click()

完整程式碼如下：

import requests
from selenium import webdriver

driver = webdriver.Chrome()
driver.get("https://ke.qq.com/course/403521")
driver.find_element_by_xpath('//*[@id="js_login"]').click()
driver.find_element_by_xpath('/html/body/div[4]/div/div[2]/div[2]/a[1]').click()

driver.switch_to_frame("login_frame_qq")//引號中新增frame標籤中的name或id值
driver.find_element_by_xpath('//*[@id="switcher_plogin"]').click()

driver.switch_to.default_content()//回到最外層框架
driver.switch_to_frame("login_frame_qq")//進入定位元素的框架
driver.find_element_by_xpath('//*[@id="u"]').clear()
driver.find_element_by_xpath('//*[@id="u"]').send_keys("輸入自己的賬號")
driver.find_element_by_xpath('//*[@id="p"]').clear()
driver.find_element_by_xpath('//*[@id="p"]').send_keys("輸入自己的密碼")
driver.find_element_by_xpath('//*[@id="login_button"]').click()

python爬蟲登陸帶Cookie token

用python寫爬蟲整的很方便，弄了個模擬登陸，登陸後帶上token和cooke請求頁面就拿gitlab練下手了，這個還是有一丟丟麻煩的一、登陸介面獲取隱藏域中的token，構建表單的時候需要獲取到這個_gitlab_session，登陸校驗時需要帶著這個資訊準備好token

python爬蟲登陸豆瓣爬豆瓣電影短評

這個爬蟲的目的是爬取豆瓣電影短評和評分（從1星到5星），這些東西可以做情感分類。由於不登入的情況下只能看電影短評的前幾頁，所以要實現登陸豆瓣。登陸豆瓣的部分是在網上看的別人的程式碼，忘了從哪看的了。# -*- coding: utf-8 -*- f

python爬蟲登陸問題

根據騰訊課堂網頁登陸問題進行解說（需要安裝谷歌瀏覽器）： 1、匯入庫 import requests from selenium import webdriver 2、根據騰訊課堂連結，進入頁面，獲取頁面中登陸的xpath，並進行點選操作 driver = webdriv

Python爬蟲實例（四）網站模擬登陸

opener 運行 webkit zh-cn head window targe Coding 破解一、獲取一個有登錄信息的Cookie模擬登陸下面以人人網為例，首先使用自己的賬號和密碼在瀏覽器登錄，然後通過抓包拿到cookie，再將cookie放到請求之中發送請求即可

Python 爬蟲案例-web微信登陸與消息發送

recv 遺憾內部 set rmq view ons ats ascii 首先回顧下網頁微信登陸的一般流程　　1、打開瀏覽器輸入網址　　2、使用手機微信掃碼登陸　　3、進入用戶界面 1、打開瀏覽器輸入網址首先打開瀏覽器輸入web微信網址，並進行監控： h

Python爬蟲學習筆記之模擬登陸並爬去GitHub

過程 eight res 開發者工具 @value clas 之前自己 8.0 (1)環境準備: 請確保已經安裝了requests和lxml庫 (2)分析登陸過程: 首先要分析登陸的過程，需要探究後臺的登陸請求是怎樣發送的，登陸之後又有怎樣的

Python - 爬蟲爬取和登陸github

用API搜尋GitHub中star數最多的前十個庫，並用post方法登陸並點選收藏一用API搜尋GitHub中star數最多的前十個庫利用GitHub提供的API爬取前十個star數量最多的Python庫 GitHub提供了很多專門為爬蟲準

python爬蟲6——模擬登陸人人網

用python怎麼自動登入一個網站呢？之前我也有過這樣的疑問，老自己去填，多麻煩啊，接下來這篇文章將講解怎麼用python2模擬登陸人人網。一、用fiddler檢視登入資訊模擬登陸第一步，用fiddler檢視發出訪問資訊的請求：網頁：輸入多次後，會要求輸入驗證碼：

python 爬蟲之模擬登陸

import requests def run(): url = "http://jira.1handcar.com:14001/secure/BrowseProjects.jspa" headers = {'Host':'jira.1handcar.com:14001'

python 爬蟲 cookies設定，獲取登陸後介面。

前言 Cookie Cookie 是指某些網站伺服器為了辨別使用者身份和進行Session跟蹤，而儲存在使用者瀏覽器上的文字檔案，Cookie可以保持登入資訊到使用者下次與伺服器的會話。 Cookie原理 HTTP是無狀態的面向連線的協議, 為了保持連線狀態, 引入了

python 爬蟲如何通過scrapy簡單模擬登陸豆瓣網，手動進行圖形驗證碼的驗證

1.建立scrapy爬蟲程式，在terminal命令列輸入’scrapy startproject douban_login’ 2.建立爬蟲主程式，主要步驟都在這裡實現，以douban_login.py命名程式程式碼如下： import scrapy from

Python爬蟲(二十二)_selenium案例：模擬登陸豆瓣

本篇部落格主要用於介紹如何使用selenium+phantomJS模擬登陸豆瓣，沒有考慮驗證碼的問題，更多內容，請參考：Python學習指南 #-*- coding:utf-8 -*- from selenium import webdriver from selenium.webdriver.

用python爬蟲爬取和登陸github

一利用API簡單爬取利用GitHub提供的API爬取前十個star數量最多的Python庫 GitHub提供了很多專門為爬蟲準備的API介面，通過介面可以爬取到便捷，易處理的資訊。（這是GitHub官網的各種api介紹）使用到的庫 import re

python 爬蟲：利用selenium抓取cookie進行模擬登陸

說明： selenium抓取cookie模擬登陸，理論上可以登入任何網站。以下兩段程式碼分別介紹抓取cookie，和攜帶cookie登入。抓取cookie.json程式碼 import

模擬登陸CSDN -- Python爬蟲練習之正則表示式和cookie

　　這周學習的主題是正則表示式和cookie，原本是計劃每天晚上11點下班到家，練上一兩個鍾就把這部分過了，結果這周各種事情和不再狀態，所以沒整完，直至今天才把相關問題過掉。其實這部分也挺不錯的，也並沒有想象中容易，所以好事多磨。這周練習的綜合習題就是模擬登陸C

python爬蟲實現登陸簡單圖片驗證碼識別（Tesseract識別）

Tesseract下載與安裝附：德國曼海姆大學發行的3.05版本下載安裝與配置PATH環境變數安裝略，環境變數只要將目錄新增到PATH路徑，PATH路徑針對於命令列解析。 tesseract 1.png output-l eng -psm 7 -ps

python爬蟲模擬登陸知乎網

自從暑假學了大概一個月左右的爬蟲，開學之後就沒怎麼搞爬蟲了，當時也就學到scrapy框架就放下了，大致瞭解了一下框架，不是太理解，但是在這之前本人的爬蟲水平也僅僅侷限於爬取簡單頁面，爬取動態頁面也稍微瞭解下，但是一直沒有學模擬登陸，因為當時怎麼也搞不懂模擬登陸是

python爬蟲——基於selenium用火狐模擬登陸爬搜尋關鍵詞的微博

preface：最近的任務，還是爬微博。之前的用不上，post提交，還是不太熟悉，模擬登陸不了，故換種方式，用selenium模擬登陸，從此任何登入以及js呼叫都是浮雲，我模擬登入分分鐘解決。之前的時而有用，時而沒用，不穩定，寫得不夠魯棒。但這次，真能夠抓取微博，表示還是有

Python爬蟲----爬蟲入門（4）---urllib2 模擬登陸

開發環境，ubuntu 14.0.1自帶python 2.7.6 接下來要開始抓取需要登陸才能抓取的頁面：這裡先抓一個不需要驗證的網站：學校的官網：找到登陸框，輸入密碼賬號，登陸。（先開啟開發者工具）推薦谷歌和火狐瀏覽器： Network–>

Python爬蟲之模擬登陸知乎

在chrome瀏覽器下抓取登陸過程的包（注意把Preserve log勾上）：表單的結構主要包括_xsrf, password, phone_num 我們要找到_xsrf的值，重新載入zhihu.

python爬蟲登陸問題

相關推薦