python爬蟲6——模擬登陸人人網

阿新 • • 發佈：2018-11-19

用python怎麼自動登入一個網站呢？之前我也有過這樣的疑問，老自己去填，多麻煩啊，接下來這篇文章將講解怎麼用python2模擬登陸人人網。

一、用fiddler檢視登入資訊

模擬登陸第一步，用fiddler檢視發出訪問資訊的請求：

網頁：

輸入多次後，會要求輸入驗證碼：

密碼我這裡輸入的是123，找到這個訪問請求：

二、檢索相關元素

ok，找到了它的請求引數，下一步，我們檢索每一個引數對應的標題，採用谷歌瀏覽器檢視，如使用者名稱部分：

實際上有三個值是由必要傳的，如email、password和icode（驗證碼）

三、擼程式碼

1，構建session請求

# 構建一個Session物件，可以儲存頁面Cookie

sess = requests.Session()

# 請求報頭

headers = {"User-Agent" : "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.99 Safari/537.36"}

# 首先獲取登入頁面，找到需要POST的資料（_xsrf)，同時會記錄當前網頁的Cookie值

html = sess.get("http://www.renren.com/", headers = headers).text

2，解析出驗證碼地址

核心程式碼：bs.select("#verifyPic_login")[0].attrs.get(u'src')

bs = BeautifulSoup(html, 'html.parser')

# 這是驗證碼

icode = bs.select("#icode")

captcha_url = bs.select("#verifyPic_login")[0].attrs.get(u'src')

print "captcha_url",captcha_url

captcha_data = sess.get(captcha_url, headers=headers).content

3，根據url下載驗證碼，並手工輸入文字

def captcha(captcha_data):

with open("icode.jpg", "wb") as f:

f.write(captcha_data)

text = raw_input("請輸入驗證碼：")

# 返回使用者輸入的驗證碼

return text

4，構建data、傳送請求

檢視下下來的圖片：

返回的text可以用作構建data：

data = {

"email":"",

"password":"",

"icode":text

}

email和password填自己的就可以了

# 傳送登入需要的POST資料，獲取登入後的Cookie(儲存在sess裡)

response = sess.post("http://www.renren.com/ajaxLogin/login", data=data, headers=headers)

print response.text

之後再已同一個session發起請求就可以了！

python爬蟲6——模擬登陸人人網

用python怎麼自動登入一個網站呢？之前我也有過這樣的疑問，老自己去填，多麻煩啊，接下來這篇文章將講解怎麼用python2模擬登陸人人網。一、用fiddler檢視登入資訊模擬登陸第一步，用fiddler檢視發出訪問資訊的請求：網頁：輸入多次後，會要求輸入驗證碼：

PythonScript_003_通過Cookie模擬登陸人人網

#!/usr/bin/env python # -*- coding:utf-8 -*- import urllib.request import http.cookiejar # 相當於Python2的cookielib ''' 通過Cookie模擬登陸人人網，獲取請求總結：1、POS

python 爬蟲之模擬登陸

import requests def run(): url = "http://jira.1handcar.com:14001/secure/BrowseProjects.jspa" headers = {'Host':'jira.1handcar.com:14001'

python3模擬登陸人人網（史上最簡單用requests）

之前看別人一直模擬登陸人人網，我就想人人網有頭有臉的咋那麼好模擬登陸進去呢，，今天看了下發現真的超級容易登陸，可能人人太老了也好久不更新了吧。人人網一點防護措施都沒有，沒有驗證碼，沒有加密，沒有亂起八

Python爬蟲之模擬登陸知乎

在chrome瀏覽器下抓取登陸過程的包（注意把Preserve log勾上）：表單的結構主要包括_xsrf, password, phone_num 我們要找到_xsrf的值，重新載入zhihu.

python爬蟲(一):模擬登陸微博

最近花了不少時間來學python爬蟲，覺得還是有很多問題的，比如說requests.get獲得Pixiv的網頁原始碼，一直獲取不到，不過我猜測大概是headers的問題，準備之後處理。廢話少說我們先來講一講模擬登陸微博的問題。第一步:用Chrome來抓包

python 爬蟲如何通過scrapy簡單模擬登陸豆瓣網，手動進行圖形驗證碼的驗證

1.建立scrapy爬蟲程式，在terminal命令列輸入’scrapy startproject douban_login’ 2.建立爬蟲主程式，主要步驟都在這裡實現，以douban_login.py命名程式程式碼如下： import scrapy from

Python登陸人人網

msi web服務 urllib2 str mozilla 用戶名 http 正常 lib #!coding:utf-8 import urllib2 import urllib import cookielib def renrenBrower(url,us

python 直接用賬號密碼cookie登陸人人網獲取頁面

#coding:utf-8 import urllib import urllib2 import cookielib #通過CookieJar（）類構建一個cookieJar（）物件，用來儲存c

Python爬蟲(6):煎蛋網全站妹子圖爬蟲

上一篇文章中我們抓取了豆瓣圖書的資料，如果大家執行成功，並且看到資料夾下的 txt 檔案了。是不是有一種剛接觸程式設計，第一次輸出Hello world!時的欣喜。和上一篇實踐不同，我們這一次來爬取煎蛋網全站妹子圖，並且儲存到指定資料夾下。爬取流程從煎蛋網妹子圖第一頁開始抓取；爬取分頁標籤獲得最後一頁數字

Python爬蟲抓取東方財富網股票數據並實現MySQL數據庫存儲

alt 插入 pytho width 重新 tab 空值 utf word Python爬蟲可以說是好玩又好用了。現想利用Python爬取網頁股票數據保存到本地csv數據文件中，同時想把股票數據保存到MySQL數據庫中。需求有了，剩下的就是實現了。在開始之前，保證已經

[Python] [爬蟲] 6.批量政府網站的招投標、中標資訊爬取和推送的自動化爬蟲——網頁解析器

目錄 1.Intro 2.Source 1.Intro 檔名：pageResolver.py 模組名：網頁解析器引用庫： re lxml datetime sys retry

學習筆記（2）：模擬登陸抽屜網（ajax）

import requests ''' 目的：模擬登陸抽屜網工具：python3 所用模組：requests ----->模擬瀏覽器的請求，並且得到返回訊息 ''' # 1.登陸地址的獲取： # 抽屜網的登陸頁面並不是重新整理整個頁面，屬於ajax區域性請求，要首先

Python3爬蟲之模擬登陸

爬取一些不需要登陸的網址操作已經試過了，這次來用Python嘗試需要登陸的網址，來利用cookie模擬登陸我用的是火狐瀏覽器自帶的F12開發者工具，開啟網址輸入賬號，密碼，登陸，如圖可以看到捕捉到很多post和get請求，第一個post請求就是我們提交賬號和密

Python利用requests模擬登陸豆瓣

要抓取豆瓣電影的評論，我們需要登入自己的賬戶，才能爬取到所有的評論，豆瓣模擬登陸相對而言比較簡單，這裡我簡單分析一下，希望能夠對大家理解模擬登陸有所啟發。 Chorme瀏覽器輸入：https://www.douban.com,按下F12，點選Network選項，如下圖所示：按下F12

Python爬蟲教程：圖蟲網多執行緒爬取

我們這次也玩點以前沒寫過的，使用python中的queue，也就是佇列下面是我從別人那順來的一些解釋，基本爬蟲初期也就用到這麼多 Python學習資料或者需要程式碼、視訊加Python學習群：960410445 1. 初始化： classQueue.Queue(maxsize)FIFO

【Python爬蟲6】表單互動

嚴格來說，本篇表單互動和下一篇驗證碼處理不算是網路爬蟲，而是廣義上的網路機器人。使用網路機器人可以減少提取資料時需要表單互動的一道門檻。 1.手工處理髮送POST請求提交登入表單我們先在示例網站手工註冊一個賬號，註冊這個賬號需要驗證碼，下一篇會介紹處理驗證碼

打碼平臺-模擬登陸豆瓣網

from selenium import webdriver import time import requests from yundama.dama import indetify #實列化driver driver=webdriver.Chrome() driver.get("http://

python爬蟲爬取詩詞名句網

使用requests庫，xpath庫 import requests import time from lxml import etree # 去請求頁面的函式 def request_Header(url): headers = { 'User

python爬蟲（以國家菸草網新聞為例）

國家菸草專賣局的網址是：http://www.tobacco.gov.cn/html/ 要爬取的內容為各省級局的新聞。大部分的省的新聞頁url都是有規律的，比如貴州省的是 http://www.tobacco.gov.cn/html/36/3617/36

python爬蟲6——模擬登陸人人網

一、用fiddler檢視登入資訊

二、檢索相關元素

三、擼程式碼

1，構建session請求

2，解析出驗證碼地址

3，根據url下載驗證碼，並手工輸入文字

4，構建data、傳送請求

相關推薦