爬蟲day 04(通過登錄去爬蟲解決django的csrf_token)

阿新 • • 發佈：2017-11-11

ica lin urllib uil encode links 爬蟲 roc htm

#通過登錄去爬蟲
#首先要有用戶名和密碼
import urllib.request
import http.cookiejar
from lxml import etree
head = {
    ‘Connection‘: ‘Keep-Alive‘,
    ‘Accept‘: ‘text/html, application/xhtml+xml, */*‘,
    ‘Accept-Language‘: ‘en-US,en;q=0.8,zh-Hans-CN;q=0.5,zh-Hans;q=0.3‘,
    ‘User-Agent‘: ‘Mozilla/5.0 (Windows NT 6.3; WOW64; Trident/7.0; rv:11.0) like Gecko 
‘
}
# 給opener加上cookie
def makeMyOpener(head):
    cj = http.cookiejar.CookieJar()
    opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cj))
    header = []
    for key, value in head.items():
        elem = (key, value)
        header.append(elem)
    opener.addheaders = header
     
return opener
# 爬自己的頁面 
oper = makeMyOpener(head)
uop = oper.open(‘http://127.0.0.1:8000/index/loginHtml/‘, timeout = 1000)
data = uop.read()
html = data.decode()
# lxml提取 csrfmiddlewaretoken

 selector = etree.HTML(html) links = selector.xpath(‘//form/input[@name="csrfmiddlewaretoken"]/@value‘) for link in links: csrfmiddlewaretoken  
= link print(link) url = ‘http://127.0.0.1:8000/index/login/‘ datas = {‘csrfmiddlewaretoken‘:csrfmiddlewaretoken,‘email‘:‘aa‘,‘pwd‘:‘aa‘}
# 必須要把字符串改為二進制流
data_encoded = urllib.parse.urlencode(datas).encode(encoding=‘utf-8‘)
response = oper.open(url,data_encoded)
content = response.read()
html = content.decode()
print(html)

ica lin urllib uil encode links 爬蟲 roc htm #通過登錄去爬蟲 #首先要有用戶名和密碼 import urllib.request import http.cookiejar from lxml import etree head

第三百三十三節，web爬蟲講解2—Scrapy框架爬蟲—Scrapy模擬瀏覽器登錄—獲取Scrapy框架Cookies

pid 設置 ade form 需要 span coo decode firefox 第三百三十三節，web爬蟲講解2—Scrapy框架爬蟲—Scrapy模擬瀏覽器登錄模擬瀏覽器登錄 start_requests()方法，可以返回一個請求給爬蟲的起始網站，這個返回的請求相

python爬蟲之scrapy模擬登錄

這不 eight 搜索頁面 response dom cookie值知乎 blog 背景：　　初來乍到的pythoner，剛開始的時候覺得所有的網站無非就是分析HTML、json數據，但是忽略了很多的一個問題，有很多的網站為了反爬蟲，除了需要高可用代理IP地址池外，還

通過登錄檔修改鍵盤

本人電腦聯想E550,出於程式設計師的職業實在無法忍受Home與End鍵不與方向鍵挨在一起，而與方向鍵挨著的是PgUp和PgDn。經過研究，瞭解到可以通過修改登錄檔檔案來修改鍵盤按鍵。有兩種方法可以完美解決這個問題，不過這兩種方法的本質是一樣的。方法一：手動修改登錄檔來改鍵普及一個概

win7下通過登錄檔修改MAC的方法

步驟1：執行【開始】丨【執行】命令，在彈出的【執行】對話方塊中輸入regedit.單擊【確定】按鈕，開啟登錄檔編輯器，如圖1所示。　　圖1 登錄檔編輯器 2 步驟2：依次選擇H

Win10系統修改通過登錄檔修改網絡卡mac地址

win+R快捷鍵->輸入regedit開啟登錄檔定位到 HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\ Control\Class \{4D36E972-E325-11CE-BFC1-08002BE10318}\

如何通過登錄檔修改預設程式

小背景自從上次修改了登錄檔之後，不知道是手誤還是其他原因，每次開啟pdf的時候都要選擇開啟程式，就比較麻煩，於是就想通過window10 自帶的修改預設程式的元件進行修改，然並卵。只好開拓新思路----用登錄檔來改。系統引數 window10 64位專業版詳

VC++ 動態檢測串列埠的熱插拔(一)通過登錄檔實現

在上一篇文章中講述瞭如何通過迴圈遍歷的方法獲取可用串列埠，可是這樣的方法過於暴力，難免會想有沒有其他的辦法那，嘿嘿，那是肯定會有的，不管什麼問題，解決問題的方法永遠都不止一種。下面講述如何通過登錄檔來獲取可用串列埠。大家都知道，通過裝置管理器我們可以看到可用串列埠號的

C++ 通過登錄檔獲取Windows版本資訊

原理：通過訪問登錄檔 HKEY_LOCAL_MACHINE\\SOFTWARE\\Microsoft\\Windows NT\\CurrentVersion 下的鍵值資訊來獲取windows版本資訊。由於是訪問登錄檔獲取的資訊，所以準確性一般。 #include <

通過登錄檔設定預設印表機的方法

//獲取預設印表機 BOOL CPrinterInfo::GetTheDefaultPrinterByReg() { //通過登錄檔,獲取預設的印表機配置 HKEY defaultKey; DWORD bufferSize = 255; TCHAR *print

一種通過登錄檔獲取USB虛擬串列埠埠號的方法

在開發一個Modbus的串列埠監測工具軟體的時候，啟動工具軟體，希望一開始就能在下拉框檢測到當前有效的USB串列埠。剛開始做的時候是用的窮舉法，就是“COM0”~“COM15”一個一個嘗試開啟。但是，這樣做一個是效率低下，另一個是換了新的USB-串列埠介面卡，有可能虛擬串

通過登錄檔檔案進行配置WSUS自動更新

對於工作組環境，無法像域環境那樣通過配置將變動直接應用給大量的客戶端。為了簡化操作，可以針對自己搭建的WSUS伺服器，編寫包含伺服器相關資訊的.reg檔案，然後合併到所有的客戶端計算機上。但這並非最佳的解決辦法，因為在登錄檔檔案中可包含的資訊並不像組策略設定那麼豐富，而且依

win10 此電腦顯示多餘的資料夾通過登錄檔去除

win10 的此電腦，就是win7的計算機位置多了6個資料夾出來，說實話這個很不友好，因為如果資料夾沒有全屏那麼下面的磁碟會被遮擋住，讓人很有些不爽。其實右邊還好一些，可以點選收起將資料夾部分收起來，但是左側導航欄就不可以，沒有分類，也沒有部分收起的功能。所以我

通過登錄檔遮蔽WIN+L、登出、切換使用者等

[HKEY_CURRENT_USER\Software\Microsoft\Windows\CurrentVersion\Policies\System] "DisableLockWorkstation"=dword:00000001 "DisableTaskMgr"=d

遷移桌面程式到MS Store（15）——通過登錄檔開啟Developer Mode

沒想到該系列不僅沒有太監，還打算更新一個小短篇。在各種大廠小廠工作的各位想必都知道Windows域的概念。入域機器的設定由不得登入所用的域賬號，Windows的更新和安全等眾多的設定均被鎖定，由域管理員掌控。聞道有先後，術業有專攻。域管理員往往不懂軟體開發，公司統一的Group Policy設定也不會額外針對

SqlServer sa 用戶登錄失敗的解決方法

regedit 缺省 microsoft 決定 gedit 重新 local 驗證方式 word 一.控制面板-》服務-》MS SQL SERVER-》登錄--》本地系統帳戶--》重新啟動MS SQL SERVER用windows驗證登陸查詢分析器--》執行 sp_pass

sqlserver數據庫的服務器改名字後數據庫登錄不上解決方案

數據 sql數據庫問題解決方法 sqlserve lec 方案啟動 sys 計算機名稱修改後，sqlserver原來的windows驗證無法登錄標簽：數據庫2016-09-26 15:04 1491人閱讀評論(1) 收藏舉報分類： DB之路——sqlserver

redhat圖形界面啟動後出現桌面但是沒有登錄界面解決辦法

dha pid 今天 col pin 回車 height import oat redhat圖形界面啟動後出現桌面但是沒有登錄界面解決辦法2014年07月11日 10:50:10閱讀數：7931redhat Linux一直用著好好地，今天打開只有圖像界面背景，沒有出現登陸

redis免密登錄被入侵解決方式

kill 阿裏雲服務 pid $2 cpu ron nth oot 設置 redis免密登錄被入侵解決方式（部分來源：Kworkerd惡意挖礦分析，記錄阿裏雲服務器被minerd和kworkerds感染作祟）入侵最根本原因: redis沒有設置密碼，並且開放任意ip可以通

一次gitlab無法使用ssh登錄的問題解決

auth epo disabled author location sta x11 api g模式故障現象： [root@web-m data]# git clone ssh://[email protected]:22022/lxk/core.git Cl

爬蟲day 04(通過登錄去爬蟲 解決django的csrf_token)

相關推薦

爬蟲day 04(通過登錄去爬蟲解決django的csrf_token)