scrapy知乎模擬登入和cookie登入

阿新 • • 發佈：2019-01-03

模擬登入

# -*- coding: utf-8 -*-
import scrapy

from scrapy import cmdline


#from scrapy.spiders import CrawlSpider

import scrapy
from scrapy.contrib.spiders.crawl import CrawlSpider
from astropy.io.fits.header import Header


class ZhihuUserSpider(CrawlSpider):
    name = "zhihu_user"
    allowed_domains = ['zhihu.com']
    start_urls = ["http://www.zhihu.com"]
    headers = {  
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2987.98 Safari/537.36'  
}  

    def start_requests(self):     #登陸
        return [scrapy.FormRequest(
            "http://www.zhihu.com/login/phone_num",
            
            formdata = {
                '_xsrf':'7ecec739ea7f9e42d3a605e2c44883d3',
                'remember_me':'true',
                'password':'******',
                'phone_num':'******'
                },
                headers=self.headers,
                #cookies = self.cook,
                
            callback = self.after_login,
            
            )]

    def after_login(self, response):
        print 'after login'
        yield scrapy.Request('https://www.zhihu.com/people/shuangyueliao-82/activities',callback=self.onetwo,headers=self.headers)
        
    def onetwo(self,response):
        print response.body
if __name__ == '__main__':
    scrapy.cmdline.execute(argv=['scrapy','crawl','zhihu_user'])

Cookie登入

# -*- coding: utf-8 -*-
import scrapy

from scrapy import cmdline


#from scrapy.spiders import CrawlSpider

import scrapy
from scrapy.contrib.spiders.crawl import CrawlSpider
from astropy.io.fits.header import Header


class ZhihuUserSpider(CrawlSpider):
    name = "zhihu_user1"
    allowed_domains = ['zhihu.com']
    start_urls = ["http://www.zhihu.com"]
    headers = {  
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2987.98 Safari/537.36'  
}  
    
    
    
    cook = {
        'z_c0':'Mi4wQUhDQ2dzeEhlQXNBQU1JWGNGVnJDeGNBQUFCaEFsVk5NYlAwV0FDS0VaWkppOXI4LWtPZzJ0V3E5MXlhcWh0MTh3|1489839665|2c583ba1ed021db1f404d335d5958102386285c6'
        }


    
    def start_requests(self):     #登陸
        return [scrapy.Request('https://www.zhihu.com/people/shuangyueliao-82/activities', cookies = self.cook,callback=self.after_login,headers=self.headers)]

    def after_login(self, response):
        
        print 'after login'
        print response.body
        
   
if __name__ == '__main__':
    scrapy.cmdline.execute(argv=['scrapy','crawl','zhihu_user1'])

scrapy知乎模擬登入和cookie登入

模擬登入# -*- coding: utf-8 -*- import scrapy from scrapy import cmdline #from scrapy.spiders import CrawlSpider import scrapy from scrap

Python-requests-知乎模擬登入

繼續我的python爬蟲旅程，開始寫部落格的時候，說一天一篇，真的只是動動嘴皮子，做起來還真的難，其實是自己給自己找理由… 不管怎樣，今天來更新一篇，寫個知乎的模擬登入，感覺最開始學習爬蟲的時候，大家都期盼著可以寫那種需要登入的網站，或者有各種驗證碼的，那時

python-知乎模擬登入

本篇文章用於記錄如何實現知乎模擬登入本篇採用firefox瀏覽器，按F12開發者工具來進行HTTP互動的獲取和分析。需要設定開發者工具中的preserve log選項，否則會因為HTTP互動過多，無法參考中間過程的HTTP請求和迴應該登入是通過p

Scrapy框架模擬登入之cookie登入

新建douban專案通過charles 獲取到cookie後貼上進入pycharm, 尼瑪格式混亂，無奈手工新增冒號，同時將=號換成:號。。。 cookies = { "bid": "EP3q1inffgg", "__yadk_uid" : "bI

Scrapy基礎(十四)————知乎模擬登陸

odin cookie page 表單 word sca -a 實例登錄限制 #-*-coding:utf-8 -*-__author__ = "ruoniao"__date__ = "2017/5/31 20:59" 之前我們通過爬取伯樂在線的文章,伯樂在線對爬取沒有

Filter過濾器+cookie實現自動登入和安全登入

實現思想：我們只要登陸成功就把登入資訊儲存到cookie中,將使用者名稱存入session中，下一次進入介面只要通過AutoLoginfilter攔截獲取cookie，如果有登入資訊的cookie就取出來，進行自動登入處理，每一次訪問通過secureLo

移動端APP第一次登入和自動登入流程

App登陸儲存資料流程App因為要實現自動登陸功能，所以必然要儲存一些憑據，所以比較複雜。 App登陸要實現的功能：密碼不會明文儲存，並且不能反編繹解密；在伺服器端可以控制App端的登陸有效性，防止攻擊者拿到資料之後，可以長久地登陸；使用者如果密碼沒有洩露

基於pyppeteer實現最新版知乎模擬登陸

現在還在爬知乎的同學，想必已經被知乎這個登陸搞得頭大了吧，哈哈哈哈哈！！用selenium吧，不行，會被檢測出來，用requests構造表單吧，提交的加密引數複雜，而且還不給出那些引數名，知乎的攻城獅為了反爬，很牛B好吧！！！我還試過用selenium結合mit

登入和退出登入的操作邏輯

登入功能的操作邏輯步驟如下：可以分為五個步驟來實現。 1、進入頁面先判斷使用者是否已經登入 private void isLogin() { //檢視本地是否有使用者的登入資訊 SharedPreferences sp

Linux last（檢視當前登入和過去登入的使用者資訊）命令

last：檢視當前登入和過去登入的使用者資訊 last命令預設是讀取/var/log/wtmp檔案資料命令輸出：使用者名稱

踩坑：App上傳GooglePlay後Google登入和FaceBook登入異常

這段時間開啟新專案需要整合Google和FaceBook登入到專案中，經過一個多月的埋頭加班終於搞定了，打包測試都OK，於是開心的上傳到GooglePlay，然後第二天發現，我靠Google登入和F

如何看待程式碼中濫用HashMap？-知乎問題讀後感和相關研究

昨天在知乎上看到了一個問題如何看待程式碼中濫用HashMap？ .日常工程中使用HashMap確實挺多的 ,簡單方便快捷(至少感覺上是這樣) ,但越是簡單好用的東西 ,底層封裝的越複雜 . 跟進去看了一下 ,朱文彬老師進行了比較直觀的對比實驗 ,我也查閱了其他

單點登入和第三方登入的實現原理

單點登入：我們的單點登入系統，主要包含了登入驗證，token校驗、登出、註冊幾大功能，單點登入系統提供了統一的登入和註冊頁面，提供了統一的登入token校驗介面。單點登入的主要原理就是在登入成功以後，生成一個令牌，這個領跑要求每次登入唯一不可重複，我們就簡單的

Windows登入--本地登入和域登入

登入到本機的過程 1. 使用者首先按Ctrl+Alt+Del組合鍵。　　2. Winlogon檢測到使用者按下SAS鍵，就呼叫GINA，由GINA顯示登入對話方塊，以便使用者輸入賬號和密碼。　3. 使用者輸入賬號和密碼，確定後，GINA把資訊傳送給LSA進行驗證。　　4

使用requests和scrapy模擬知乎登入

獲取登入傳遞的引數可以看到，這裡當登入的時候，是傳遞紅色部分標註出來的四個引數的,並且訪問的是https://www.zhihu.com/login/phone_num地址，但是這裡驗證碼需要使用者點選倒立的字，目前我還沒有辦法，但是可以使用手機端登入看

selenium 模擬登入知乎和微博

sleep https epo element select selenium clas .com -c pip install selenium __author__ = ‘admin‘ __date__ = 2017 / 11 / 3 from selenium im

Scrapy中使用cookie免於驗證登入和模擬登入

Scrapy中使用cookie免於驗證登入和模擬登入引言 python爬蟲我認為最困難的問題一個是ip代理，另外一個就是模擬登入了，更操蛋的就是模擬登入了之後還有驗證碼，真的是不讓人省心，不過既然有了反爬蟲，那麼就有反反爬蟲的策略，這裡就先介紹一個cookie模擬登陸，後續還有se

python爬蟲scrapy框架——人工識別登入知乎倒立文字驗證碼和數字英文驗證碼(2)

import scrapy import re import json class ZhihuSpider(scrapy.Spider): name = 'zhihu' allowed_domains = ['www.zhihu.com'] start_urls = ['http

[Python]網路爬蟲（三）：使用cookiejar管理cookie 以及模擬登入知乎

大家好哈，上一節我們研究了一下爬蟲的異常處理問題，那麼接下來我們一起來看一下Cookie的使用。為什麼要使用Cookie呢？ Cookie，指某些網站為了辨別使用者身份、進行session跟蹤而儲存在使用者本地終端上的資料（通常經過加密）比如說有些網站需要登入後才

scrapy 爬取知乎登入認證部分（採用cookie登入）

scrapy 爬蟲，為非同步io框架;因此此處選擇，先用requests請求，儲存cookie檔案，然後scrapy爬取前，在入口處載入cookie。 * 登入，儲存cookie方法見前兩節，此處展示的是scrapy讀取cookie * 首先要明確，

scrapy知乎模擬登入和cookie登入

相關推薦