python介面自動化4-繞過驗證碼登入(cookie)
前言
有些登入的介面會有驗證碼:簡訊驗證碼,圖形驗證碼等,這種登入的話驗證碼引數可以從後臺獲取的(或者查資料庫最直接)。
獲取不到也沒關係,可以通過新增cookie的方式繞過驗證碼。
一、抓登入cookie
1.登入後會生成一個已登入狀態的cookie,那麼只需要直接把這個值新增到cookies裡面就可以了。
2.可以先手動登入一次,然後抓取這個cookie,這裡就需要用抓包工具fiddler了
3.先開啟部落格園登入介面,手動輸入賬號和密碼(勾選下次自動登入)
4.開啟fiddler抓包工具,重新整理下登入首頁,就是登入前的cookie了
5.登入成功後,再檢視cookie變化,發現多了兩組引數,多的這兩組引數就是我們想要的,copy出來,一會有用
二、cookie組成結構
1.用抓包工具fidller只能看到cookie的name和value兩個引數,實際上cookie還有其它引數
2.以下是一個完整的cookie組成結構
cookie ={u'domain': u'.cnblogs.com',
u'name': u'.CNBlogsCookie',
u'value': u'xxxx',
u'expiry': 1491887887,
u'path': u'/',
u'httpOnly': True,
u'secure': False}
name:cookie的名稱
value:cookie對應的值,動態生成的
domain:伺服器域名
expiry:Cookie有效終止日期
path:Path屬性定義了Web伺服器上哪些路徑下的頁面可獲取伺服器設定的Cookie
httpOnly:防指令碼攻擊
secure:在Cookie中標記該變數,表明只有當瀏覽器和Web Server之間的通訊協議為加密認證協議時,
瀏覽器才向伺服器提交相應的Cookie。當前這種協議只有一種,即為HTTPS。
三、新增cookie
1.往session裡面新增cookie可以用以下方式
2.set裡面引數按括號裡面的引數格式
coo = requests.cookies.RequestsCookieJar()
coo.set('cookie-name', 'cookie-value', path='/', domain='.xxx.com')
s.cookies.update(c)
3.於是新增登入的cookie,把第一步fiddler抓到的內容填進去就可以了
c = requests.cookies.RequestsCookieJar()
c.set('.CNBlogsCookie', 'xxx')
c.set('.Cnblogs.AspNetCore.Cookies','xxx')
s.cookies.update(c)
print(s.cookies)
4.(敲黑板!!!)由於近期部落格園的登入機制變了,這裡需要多加2個cookie引數
c.set('AlwaysCreateItemsAsActive',"True")
c.set('AdminCookieAlwaysExpandAdvanced',"True")
四、參考程式碼
1.由於登入時候是多加2個cookie,我們可以先用get方法開啟登入首頁,獲取部分cookie
2.再把登入需要的cookie新增到session裡
3.新增成功後,隨便編輯正文和標題儲存到草稿箱
# coding:utf-8
import requests
# 先開啟登入首頁,獲取部分cookie
url = "https://passport.cnblogs.com/user/signin"
headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64; rv:44.0) Gecko/20100101 Firefox/44.0"
} # get方法其它加個ser-Agent就可以了
s = requests.session()
r = s.get(url, headers=headers,verify=False)
print s.cookies
# 新增登入需要的兩個cookie
c = requests.cookies.RequestsCookieJar()
c.set('.CNBlogsCookie', '這裡是抓到的') # 填上面抓包內容
c.set('.Cnblogs.AspNetCore.Cookies','這裡是抓到的') # 填上面抓包內容
c.set('AlwaysCreateItemsAsActive',"True")
c.set('AdminCookieAlwaysExpandAdvanced',"True")
s.cookies.update(c)
print s.cookies
# 登入成功後儲存編輯內容
r1 = s.get("https://i.cnblogs.com/EditPosts.aspx?opt=1", headers=headers, verify=False)
# 儲存草稿箱
url2= "https://i.cnblogs.com/EditPosts.aspx?opt=1"
body = {"__VIEWSTATE": "",
"__VIEWSTATEGENERATOR":"FE27D343",
"Editor$Edit$txbTitle":"這是3111",
"Editor$Edit$EditorBody":"<p>這裡111:http://www.cnblogs.com/yoyoketang/</p>",
"Editor$Edit$Advanced$ckbPublished":"on",
"Editor$Edit$Advanced$chkDisplayHomePage":"on",
"Editor$Edit$Advanced$chkComments":"on",
"Editor$Edit$Advanced$chkMainSyndication":"on",
"Editor$Edit$Advanced$txbEntryName":"",
"Editor$Edit$Advanced$txbExcerpt":"",
"Editor$Edit$Advanced$tbEnryPassword":"",
"Editor$Edit$lkbDraft":"存為草稿",
}
r2 = s.post(url2, data=body, verify=False)
print r.content