Scrapy 進行簡單的自動登錄

阿新 • • 發佈：2018-03-17

scrapy post login ourstep

前面豆子學習了用Scrapy進行基本的get請求，現在來看看如何進行簡單的post操作。以一個論壇為例，現在看看如何進行一個簡單的登錄請求。

豆子在澳洲經常上的一個論壇是新足跡論壇，網站是www.oursteps.com.au

簡單的自動登錄和跳轉

1. 創建新的項目和爬蟲文件

技術分享圖片

一個基本的模板就生成了
技術分享圖片

2. 抓包獲取登錄的URL和請求字段

打開firefox，代理指向fiddler，然後點開fiddler，開始登錄。fidder作為代理服務器，會把所有的請求內容都抓出來。

註意觀察fidder的界面，向右的箭頭代表是一個post請求
技術分享圖片

查看具體的textview可以看見他提交的內容
技術分享圖片

登錄以後的論壇界面是這樣

3. 編輯我們的爬蟲文件

# -*- coding: utf-8 -*-
import scrapy
from scrapy.http import Request,FormRequest

class LoginSpider(scrapy.Spider):
    name = ‘login‘
    allowed_domains = [‘oursteps.com.au‘]
        #這個默認的起點網址可以不用，因為我們下面配置了start-requests的方法，他們的功能類似，都是去爬第一個起始的網址
    #start_urls = [‘http://oursteps.com.au/‘]
        #這個header可以是任何瀏覽器的頭文件，用於偽裝
    header = {
        "User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/38.0.2125.122 Safari/537.36 SE 2.X MetaSr 1.0"
    }

    #裏面的查詢地址最好是使用在fidder裏面看見的地址，cookiejar設為真，parse是用一個回調函數，執行爬取信息之後對應的操作
    def start_requests(self):
        return [Request("http://www.oursteps.com.au/", meta={"cookiejar": 1}, callback=self.parse)]

    #發送一個post請求，數據是字典格式的，發送完了之後執行另外一個回調函數
    def parse(self, response):
        data = {
            "username": "beanxyz",
            "password": "Snake2013",
        }

        print("login…")
        # 通過FormRequest.from_response()進行登陸
        return [FormRequest.from_response(response,
                                          # 設置cookie信息
                                          meta={"cookiejar": response.meta["cookiejar"]},
                                          # 設置headers信息模擬成瀏覽器
                                          headers=self.header,
                                          # 設置post表單中的數據
                                          formdata=data,
                                          # 設置回調函數，此時回調函數為next()
                                          callback=self.next,
                                          )]

#回調函數，直接把返回的頁面保存下來
    def next(self,response):
        data=response.body
        #註意是二進制格式
        fh=open("C:/temp/ourstep/a.html","wb")
        fh.write(data)
        fh.close()
#登錄成功了之後，再跳轉到另外一個頁面去，記住帶著cookie的狀態
        yield Request("http://www.oursteps.com.au/bbs/home.php?mod=space&uid=19783",callback=self.next2,meta={"cookiejar": True})

#保存新頁面的內容
    def next2(self,response):
        data=response.body
        fh = open("C:/temp/ourstep/b.html", "wb")
        fh.write(data)
        fh.close()

4.執行爬蟲

技術分享圖片

5.確認結果

登錄成功後的界面
技術分享圖片

跳轉到個人檔案的界面
技術分享圖片

Scrapy 進行簡單的自動登錄

如何使用cookie進行簡單自動登錄

區別你在會有後來 bsp 新的自己的還需客戶 cookie的用法其實很簡單，為什麽要用cookie呢，說白了就是不用做太多重復的東西，比如你上個網站需要輸入密碼如果沒有用cookie，每次打開瀏覽器進入網站都要重復輸入密碼，如果有了cookie的話，你的用戶

Scrapy 進行簡單的自動登錄

scrapy post login ourstep 前面豆子學習了用Scrapy進行基本的get請求，現在來看看如何進行簡單的post操作。以一個論壇為例，現在看看如何進行一個簡單的登錄請求。豆子在澳洲經常上的一個論壇是新足跡論壇，網站是www.oursteps.com.au 簡單的自動登錄

簡單的登錄基於代碼的

上帝 logs password 賬號密碼 com 購物平臺 .com class usr 1 #!/usr/bin/env python 2 # -*- coding: utf-8 -*- 3 4 import getpass 5 print(‘歡迎來到不知

自己動手寫一個自動登錄腳本gg

簡單只需要自己不同 enum -s class rep 使用 1.下載一個sshpass工具 2.安裝sshpass，安裝到tools文件夾 3.把tools文件夾的路徑加入到/etc/bashrc vim /etc/bashrc

簡單的登錄權限驗證實現

prefix void 定向 exceptio clas 攔截登錄 scrip oca 1.登錄登錄時需要生成一個自定義的token，token的生成規則一般可以考慮混合多種因素，如userId+生成時間+UUID，再進行一定的編碼 String token=user

python自動化，自動登錄並且添加一個門店

con driver center web add keys utf sleep click ‘‘‘ 本文主要通過以前公司的對外平臺，測試自動登錄並且自動添加一個門店 ‘‘‘ # _*_ coding: utf-8 _*_ from selenium import webd

Python簡單的登錄註冊代碼

def 定義數據 gis 登錄註冊 hash %u 簡單的用戶名 python #-*- coding: utf-8 -*- import hashlib# 定義數據庫（聲明字典）#註冊登錄的簡單hash處理db={}def get_md5(password): md5

Filter自動登錄

表單 servle domain exception ioe direct cookie war 保存信息 Dao層略過 Domain略過 Service層過 Web層 Select邏輯獲取表單數據，Web—service——Dao返回用戶信息如果返回不為null否則，

iOS 自動登錄的講解

scheme 用戶登錄全場 bsp 比較 sso 大整數 nil 位置 iOS 的自動登錄就是先要用戶名和密碼登入成功後保存到本地的數據庫中然後下次打開的程序的時候直接取出本地數據庫中的用戶名和密碼 iOS登錄及token的業務邏輯登錄

windows 上用xshell使用 ssh自動登錄linux

xshell key說明：今天來了一個小夥伴，因為業務需要，要登錄一臺測試系統，問我密碼是多少，我說我配置的密鑰登錄的，估計他不太熟悉，所以我簡單的演示了一下配置過程給他看，順便也記錄了下整個配置過程。1、關於密鑰登錄系統的原理關於配置原理，可以參考https://help.aliyun.com/know

cookie技術實現自動登錄+驗證用戶名輸入是否正確

ets htm text cti 創建 sel turn 失去焦點 table login頁面 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% Strin

使用selenium自動登錄126/163郵箱並發送郵件

點擊 word tool mail 使用 table password python2 switch 我使用的是python2.7.13+selenium ps:幾天之前，我曾多次嘗試寫這段代碼，但是在點擊寫信的步驟時失敗了，我想我的問題應該大致是這幾點： 1

ftp自動登錄上傳下載文件

目錄登錄建立下載 name ascii use alac 批量上傳（1）ftp自動批量下載文件 #####從ftp服務器上的/data/localacc 到本地的/data/localacc#### #!/bin/bash ftp -n<<!

自動登錄——（三）

ccf vdh top not let ppr odin eol wmb 1.　　登錄頁面定義一個自動登錄復選框 <span id="auto"></span><input type="checkbox" name="autolo

Filter應用之-自動登錄

ews code 部分 this mov protected 用戶信息 mit deb 自動登錄，是為了幫助用戶多次使用這個網頁時，不用再次輸入用戶名和密碼就可以登錄。是指用戶將用戶的登錄信息，人，保存到本地的文件中Cookie中。 Name,value &ndash

12306自動登錄

校驗存儲 ssp 成功沒有 pen bin 驗證碼對象 #!/usr/bin/python2.7 # -*- coding:utf-8 -*- """ 12306自動登錄： - 先校驗驗證碼 - 再校驗用戶名密碼 """ imp

windows 2003自動登錄的具體步驟

windows 2003自動登錄自動登錄在windows系統中，使用最多的可能就是遠程操作了，關於遠程操作的那些事很多用戶還是有些迷茫的。如果win2003系統遠程重啟後，要重新登錄系統才能啟用遠程功能，這就十分的麻煩，如何才能實現重啟後的自動登錄呢?具體操作如下　　win2003操作系統，

通過 cookie 信息實現自動登錄

gen elf port http pro 構建 body 對象 color 什麽是 cookie：某些網站為了辨別用戶身份，進行 session 跟蹤而存儲在用戶本地上的數據，通過 cookie 可以訪問網站的其他頁面，否則是禁止訪問的如何獲取 cookie ：

自動登錄TP-LINK路由器，獲取所有信息，重啟等等，實用方法

cti host ads date output png ict .text 只有一個用Python自動登錄TP-LINK路由器，獲取信息，重啟等操作思路：想獲取TP-LINK裏面的所有信息，必須首先登錄，然後提交相應的操作（比如重啟） 1、做任何操作，首先得登錄到

賬戶註銷完自動登錄賬戶，並且不需要再點擊屏幕的賬戶頭像

col 需求彈出窗口 tps logo 現在密碼 nag 打開今天遇到一個客戶，提出了一個比較特殊的需求。他要求賬戶註銷完可以自動登錄賬戶，並且不需要再次點擊屏幕，讓一切都自動化。首先我們來做第一步，如何自動登錄 1、在開始菜單搜索框輸入 “netplwiz” 按回

Scrapy 進行簡單的自動登錄

簡單的自動登錄和跳轉

1. 創建新的項目和爬蟲文件

2. 抓包獲取登錄的URL和請求字段

3. 編輯我們的爬蟲文件

4.執行爬蟲

5.確認結果

相關推薦