python3 requests 模擬登入狀態的兩種方式
阿新 • • 發佈:2018-11-26
python version: 3.6
模擬登入狀態,即有些操作是必須使用者登入後才可以進行的,技術上與cookie和session有關。
cookie是使用者登入後,伺服器返回給客戶端的,客戶端儲存cookie後,用於告訴服務端我是登入過的。
session是後端用以鑑定使用者是否處於登入狀態的一種機制(常見的是請求中加入sid,或將sid寫在cookie中)。
我遇到的情況是:
cookie的儲存可以使用登入請求的cookies方法來獲得(也是通用的)
sid是登入介面中響應的一個欄位,可以使用jsonpath解析json拿到。cookie中的內容和sid的值在後端都是儲存下來的,兩者要做匹配,匹配好了接口才可以正常訪問。
此文不是解決爬蟲登入失敗的~~只是用於工作需要
兩種方法:
1.requests的cookies方法
import requests
from jsonpath import jsonpath
login_api = 'https://xxx.xxx.com/api/user/login?sid='
login_email = '[email protected]'
login_params = {'verifyCode': 'xxxx', 'password': 'xxxxxx', 'email': login_email}
r1 = requests.post(login_api, data=login_params)
sid = jsonpath(r1.json(), '$..sid' )[0]
# print(r1.cookies)
user_detail_api = 'https://xxx.xxx.com/api/user/1?sid=%s' % sid
r2 = requests.get(user_detail_api, cookies=r1.cookies) # 要手動的傳下cookies
print(r2.text)
好處:簡單
缺點:需要在每個需要登入狀態的介面中傳入cookies,比較麻煩
2.requests.Session()方法
import requests
from jsonpath import jsonpath
login_api = 'https://xxx.xxx.com/api/user/login?sid='
login_email = '[email protected]'
login_params = {'verifyCode': 'xxxx', 'password': 'xxxxxx', 'email': login_email}
s = requests.Session()
r3 = s.post(login_api, data=login_params)
# print(r3.cookies)
# print(s.cookies)
sid = jsonpath(r3.json(), '$..sid')[0]
user_detail_api = 'https://xxx.xxx.com/api/user/1?sid=%s' % sid
r4 = s.get(user_detail_api) # 不用傳cookies了
print(r4.text)
解釋:定義requests.Session()的一個instance,基於這個例項的請求都會使用相同的cookies
好處:可以不直接操作cookie了
參考:
1.requests官方文件:http://docs.python-requests.org/en/master/user/quickstart/
2.requests官方文件:http://docs.python-requests.org/zh_CN/latest/user/advanced.html
3.JsonPath:https://github.com/json-path/JsonPath