20170717_python爬蟲之requests+cookie模擬登陸
阿新 • • 發佈:2017-07-17
ssi alert 之前 lose net .html .net 裝載 onos
在成功登陸之前,失敗了十幾次。完全找不到是什麽原因導致被網站判斷cookie是無效的。
直到用了firefox的httpfox之後才發現cookie裏還有一個ASP.NET_SessionId 這個字段!!!.net網站應該都有這個字段,php網站的是phpsession
剛開始是用的alert(document.cookie)來獲取cookie的,這是個大坑!!!以後要用專業工具~~~
#-*-coding:utf-8-*- #編碼聲明
import requests
cookie = {}
cookies = ‘xxx=xxx;yyy=yyy‘#cookie大概是這麽一個格式
for line in cookies.split(‘;‘):
key,value = line.split("=", 1)
cookie[key] = value #格式化操作,裝載cookies
url = ‘http://xxx.com/user/allmessage.html‘ #重點來了!用requests,裝載cookies,請求網站 res = requests.get(url,cookies=cookie) content = res.content
f = open("h.txt",‘wb‘)#保存下來看看是否登錄成功 f.write(content) f.close()
cookie = {}
cookies = ‘xxx=xxx;yyy=yyy‘#cookie大概是這麽一個格式
for line in cookies.split(‘;‘):
url = ‘http://xxx.com/user/allmessage.html‘ #重點來了!用requests,裝載cookies,請求網站 res = requests.get(url,cookies=cookie) content = res.content
f = open("h.txt",‘wb‘)#保存下來看看是否登錄成功 f.write(content) f.close()
20170717_python爬蟲之requests+cookie模擬登陸