1. 程式人生 > >20170717_python爬蟲之requests+cookie模擬登陸

20170717_python爬蟲之requests+cookie模擬登陸

ssi alert 之前 lose net .html .net 裝載 onos

在成功登陸之前,失敗了十幾次。完全找不到是什麽原因導致被網站判斷cookie是無效的。 直到用了firefox的httpfox之後才發現cookie裏還有一個ASP.NET_SessionId 這個字段!!!.net網站應該都有這個字段,php網站的是phpsession 剛開始是用的alert(document.cookie)來獲取cookie的,這是個大坑!!!以後要用專業工具~~~ #-*-coding:utf-8-*- #編碼聲明 import requests
cookie = {}
cookies = ‘xxx=xxx;yyy=yyy‘#cookie大概是這麽一個格式
for line in cookies.split(‘;‘):
key,value = line.split("=", 1) cookie[key] = value #格式化操作,裝載cookies
url = ‘http://xxx.com/user/allmessage.html‘ #重點來了!用requests,裝載cookies,請求網站 res = requests.get(url,cookies=cookie) content = res.content
f = open("h.txt",‘wb‘)#保存下來看看是否登錄成功 f.write(content) f.close()

20170717_python爬蟲之requests+cookie模擬登陸