Scrapy框架模擬登入之cookie登入

阿新 • • 發佈：2019-02-01

新建douban專案

通過charles 獲取到cookie後

貼上進入pycharm, 尼瑪格式混亂，無奈手工新增冒號，同時將=號換成:號。。。

cookies = {
    "bid": "EP3q1inffgg",
    "__yadk_uid" : "bIJElZgmoiojxX9iPANYuW69wOsqZtMC",
    "ll" : "118282",
    "_vwo_uuid_v2" : "FC33D3A160F773772BD0D3615F3DCAC3|744bce8c3d02e8ebcfe5c58fc91f033c",
    "ps" : "y",
    "push_noty_num" : "0",
    "push_doumail_num" : "0",
    "__utmv" : "30149280.18179",
    "ap" : "1",
    "_ga" : "GA1.2.980617011.1514707464",
    "_gid" : "GA1.2.394721026.1532612698",
    "ue" : " 
[email protected]",
    "douban-profile-remind" : "1",
    "__utma" : "30149280.980617011.1514707464.1532625684.1532662495.8",
    "__utmc" : "30149280",
    "__utmz" : "30149280.1532662495.8.6.utmcsr=baidu|utmccn=(organic)|utmcmd=organic",
    "dbcl2" : "181794852:W8i5o4WaLXE",
    "ck" : "Hm8k",
    "_pk_ref.100001.8cb4" : "%5B%22%22%2C%22%22%2C1532694810%2C%22https%3A%2F%2Fwww.baidu.com%2Flink%3Furl%3DrYWBcWG4VS_zim1mZVy7wTOi2J8PrON8INtoQurnDx6Vo3yiM1o3P12FUeOjmP36 % 26wd % 3D % 26eqid % 3D87bd504200001569000000035b5b1115 % 22 % 5D",
    "_pk_id.100001.8cb4" : "bd09bb9234658e2e.1514707463.8.1532694810.1532665176.",
    "_pk_ses.100001.8cb4" : "*",
    "__ads_session" : "46a/xu60Igm+tEEqLgA="
}

注意cookie粘貼後，會多出一些空格，會導致cookie無效;

原始碼如下:

# -*- coding: utf-8 -*-
import scrapy

'''
    豆瓣cookie登入
'''
class DbCookieSpider(scrapy.Spider):
    name = 'db_cookie'
    allowed_domains = ['douban.com']
    start_urls = ['https://www.douban.com/']

    headers = {
        "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36"
    }

    cookies = {
        "bid": "EP3q1inffgg",
        "__yadk_uid" : "bIJElZgmoiojxX9iPANYuW69wOsqZtMC",
        "ll" : "118282",
        "_vwo_uuid_v2" : "FC33D3A160F773772BD0D3615F3DCAC3|744bce8c3d02e8ebcfe5c58fc91f033c",
        "ps" : "y",
        "push_noty_num" : "0",
        "push_doumail_num" : "0",
        "__utmv" : "30149280.18179",
        "ap" : "1",
        "_ga" : "GA1.2.980617011.1514707464",
        "_gid" : "GA1.2.394721026.1532612698",
        "ue" : " 
[email protected]",
        "douban-profile-remind" : "1",
        "__utma" : "30149280.980617011.1514707464.1532625684.1532662495.8",
        "__utmc" : "30149280",
        "__utmz" : "30149280.1532662495.8.6.utmcsr=baidu|utmccn=(organic)|utmcmd=organic",
        "dbcl2" : "181794852:W8i5o4WaLXE",
        "ck" : "Hm8k",
        "_pk_ref.100001.8cb4" : "%5B%22%22%2C%22%22%2C1532694810%2C%22https%3A%2F%2Fwww.baidu.com%2Flink%3Furl%3DrYWBcWG4VS_zim1mZVy7wTOi2J8PrON8INtoQurnDx6Vo3yiM1o3P12FUeOjmP36 % 26wd % 3D % 26eqid % 3D87bd504200001569000000035b5b1115 % 22 % 5D",
        "_pk_id.100001.8cb4" : "bd09bb9234658e2e.1514707463.8.1532694810.1532665176.",
        "_pk_ses.100001.8cb4" : "*",
        "__ads_session" : "46a/xu60Igm+tEEqLgA="
    }

    def start_requests(self):
        return [scrapy.FormRequest(url="https://www.douban.com/people/xxxxx/", headers=self.headers, cookies=self.cookies, callback=self.parse_page)]

    def parse_page(self, response):
        print(response.status)

        with open("dbcookie.json", "w", encoding="utf-8") as f:
            f.write(response.text)

最後dbcookie.json 檔案會儲存douban的個人主頁資訊，success!

Scrapy框架模擬登入之cookie登入

新建douban專案通過charles 獲取到cookie後貼上進入pycharm, 尼瑪格式混亂，無奈手工新增冒號，同時將=號換成:號。。。 cookies = { "bid": "EP3q1inffgg", "__yadk_uid" : "bI

scrapy知乎模擬登入和cookie登入

模擬登入# -*- coding: utf-8 -*- import scrapy from scrapy import cmdline #from scrapy.spiders import CrawlSpider import scrapy from scrap

python爬蟲scrapy框架——人工識別知乎登入知乎倒立文字驗證碼和數字英文驗證碼

import requests try: import cookielib except: import http.cookiejar as cookielib import re import time def get_xsrf(): # 獲取xsrf code res

使用scrapy框架+模擬瀏覽器方法實現爬取智聯的職位資訊

由於智聯的頁面是由js動態載入的,一般的方法只能得到js載入前的頁面,為了得到載入過的頁面需要通過模擬瀏覽器來拿到完整的頁面. 下面的程式碼只是簡單的實現,爬取智聯頁面的部分功能,其他根據需要自己實現中介軟體(middleswares.py)程式碼: from scrapy.ht

Scrapy框架的使用之Scrapy對接Splash

之前我們實現了Scrapy對接Selenium抓取淘寶商品的過程，這是一種抓取JavaScript動態渲染頁面的方式。除了Selenium，Splash也可以實現同樣的功能。本節我們來了解Scrapy對接Splash來進行頁面抓取的方式。一、準備工作請確保Splash已經正確

淘淘商城系列——單點登入之使用者登入

我們先來看下使用者登入流程圖，如下圖所示。使用者登入涉及到三個部分，第一部分是淘淘商城前臺工程，第二部分是單點登入服務，第三部分是Redis服務。具體流程下圖已經說的很明白了，我就不再囉嗦一遍了，相比於傳統的登入，我們沒有把使用者登入資訊存在session當中，

淘淘商城系列——單點登入之使用者登入頁面實現

我們來看下login.jsp頁面，如下圖所示。可以看到<input .../>標籤中並沒有定義onclick方法，只是定義了個id="loginsubmit"，那麼onclick事件在哪兒定義了呢？其實是在js程式碼當中定義了，如下圖所示，頁

第三方登入之QQ登入（二）——OAuth2.0處理流程介紹（以QQ登入為例）

為了讓網站更快接入，騰訊提供了JS SDK的接入方案，具體點選這裡或者點選這裡進行檢視。不過也可以自己寫程式碼，當然你需要了解QQ的OAuth2.0的處理流程（Web Server Flow）。OAuth2.0的處理流程：點選這裡檢視官方Wiki。1.授權：獲取授權碼Auth

淘淘商城——單點登入之使用者登入

我們先來看下使用者登入流程圖，如下圖所示。使用者登入涉及到三個部分，第一部分是淘淘商城前臺工程，第二部分是單點登入服務，第三部分是Redis服務。具體流程下圖已經說的很明白了，我就不再囉嗦一遍了，相比於傳統的登入，我們沒有把使用者登入資訊存在session當中，而是存放到了Re

Scrapy框架爬蟲模擬瀏覽器登入—獲取框架Cookies

return [FormRequest.from_response(response, url='http://edu.iqianyue.com/index_user_login', #真實post地址

thinkphp框架之後臺登入頁面cookie有效期設定

目前開始學框架了，發現蠻有意思的，可能是由於人性天生對未知事物的好奇，居然感到樂趣叢生，可是也感覺要學的東西實在太多壓力山大；今天就碰到個後臺登入頁面設定cookie有效期的小問題

scrapy框架之cookie和代理操作

一，scrapy傳送post請求 scrapy框架中預設傳送的是get請求，原始碼： scrapy.Spider父類中的start_request方法： def start_requests(self): cls = self.__class__ if

python學習之網站的編寫（HTML，CSS，JS）（十七）----------示例，構造一個網頁的框架，上部標題，登入，logo，左側選單，右側內容，原始碼

結果：顏色為了明顯，所以較為難看，可以根據自己的需要進行更改原始碼： <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title

Django-Web框架之實現登入功能

我們開啟../sign/templates/index.html檔案，實現一個登入功能。新增如下程式碼： <!DOCTYPE html> <html> <head> <title>Django Page</title> <

Selenium新增Cookie模擬無驗證碼登入

最近爬蟲碰見需要用selenium模擬登入，有驗證碼滑塊+圖片點選驗證，在解決過程中發現一篇很好的示例，雖然是無驗證碼的那種，但是還不錯，先記下來！程式碼及註釋如下： #!coding=utf-8 import time from selenium import webdriver

（crm筆記2-6）使用者登入問題之cookie記住密碼

使用者登入問題之cookie記住密碼 1、需求這個功能其實隨處可見，任何一個網站都需要在使用者登入後為使用者記住密碼，哪怕使用者不用記住，你也要提供這個功能，而且需求很簡單，只要在使用者登入成功後，根據

Scrapy框架爬蟲登入與利用打碼介面實現自動識別驗證碼

if len(yzhm) > 0: print("出現驗證碼，請輸入驗證碼") print('驗證碼圖片地址：',yzhm) #將驗證碼圖片儲存到本地 file_path = os.path.join(os.

scrapy框架中實現登入人人網（二）（最新登入方式）

上篇部落格說到登入人人網的時候，如果同一個賬號出錯超過三次，那麼將會出現四個漢字的驗證碼，這裡我們利用打碼平臺來破解驗證碼並傳入（實際上，如果簡單點可以通過肉眼觀察出現的驗證碼，然後input輸入結果。）如下圖所示，通過上節的分析我們知道密碼是通過加密傳

scrapy框架中實現登入人人網（一）（最新登入方式）

最近在弄scrapy框架的問題，感覺裡面好玩的東西有很多，無意中在bilibili中看到關於在scrapy實現登入人人網的視訊，人人網可能使用者少，所以在現在的一些部落格和教程裡面看到最新的登入方法幾乎沒有，於是自己寫了這篇部落格。 &

Scrapy框架爬取有驗證碼的登入網站

使用Scrapy爬取91pron網站 **宣告：本專案旨在學習Scrapy爬蟲框架和MongoDB資料庫，不可使用於商業和個人其他意圖。若使用不當，均由個人承擔。** 首先，我們需要將scrapy框架所需的各種包，安裝好，我們就開始了！開啟將要放專

Scrapy框架模擬登入之cookie登入

相關推薦