Python爬蟲--使用cookies登入豆瓣網

阿新 • • 發佈：2019-01-26

用python做網路爬蟲時，有時需要登入某些網站。
例如使用requests請求登入豆瓣網的時候需要輸入使用者密碼，可能還需要輸入驗證碼，比較麻煩。
現在在請求豆瓣網連結www.douban.com的時候，使用post加上cookies，可以不用輸入賬號和密碼直接登入。

方法如下：
開啟瀏覽器，開啟豆瓣的主頁，按下鍵盤上的F12鍵（開啟瀏覽器的開發者工具），此時輸入賬號和密碼登入豆瓣網。檢視開發者工具中請求登入時的cookies資訊，如圖：
這裡寫圖片描述
把右側Cookies對應的內容儲存下來。

下面使用python程式登入豆瓣：

import requests

headers = {'User-Agent' 
: 'Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/44.0.2403.157 Safari/537.36'}
cookies = {'cookie': 'xxx'} #xxx是剛才儲存的cookies資訊，貼上在這裡
url = 'https://www.douban.com'
r = requests.get(url, cookies = cookies, headers = headers)
with open('douban.txt', 'wb+') as f:
    f.write(r.content) #把登陸主頁後返回的資料儲存到檔案中

檢視douban.txt檔案，如果檔案中”xxx的帳號”, xxx是你豆瓣的賬號名，即為登入成功。

Python爬蟲--使用cookies登入豆瓣網

用python做網路爬蟲時，有時需要登入某些網站。例如使用requests請求登入豆瓣網的時候需要輸入使用者密碼，可能還需要輸入驗證碼，比較麻煩。現在在請求豆瓣網連結www.douban.com

Python模擬登入豆瓣網，並爬取小組信息

count alias pass spa .post windows chrome apr ror import requests from bs4 import BeautifulSoup from PIL import Image headers = { ‘

Python爬蟲-爬取開心網主頁(有登入介面-利用cookie)

爬取開心網主頁內容 ========================================== ======================================= =================================== 1 ''' 2 登入開

Python 爬蟲-模擬登入知乎-爬取拉勾網職位資訊

用Python寫爬蟲是很方便的,最近看了xlzd.me的文章，他的文章寫的很到位，提供了很好的思路。因為他的文章部分程式碼省略了。下面是基於他的文章的三個程式碼片段: 基於Python3,Python2的話需要修改下input輸入函式和print的用法。爬取豆瓣電影top250 爬取拉勾網職位資訊模擬

python爬蟲練習1:豆瓣電影TOP250

import ria fff python top font beautiful code pen 項目1:實現豆瓣電影TOP250標題爬取: 1 from urllib.request import urlopen 2 from bs4 import Beaut

python爬蟲--下載煎蛋網妹子圖到本地

eve 元素 download down find .get fault log arc 1 #coding:utf-8 2 """ 3 下載煎蛋妹子到本地，通過selenium、正則表達式、phantomjs、Beautifulsoup實現 4 """ 5

Python爬蟲（二）網絡爬蟲的尺寸與約束

.cn 哪些 com 尺寸網頁 inf robot robots 搜索 Infi-chu: http://www.cnblogs.com/Infi-chu/ 一、網絡爬蟲的尺寸： 1.小規模，數據量小，爬取速度不敏感，Requests庫，爬取網頁 2.中規模，數據

用Python爬蟲爬取豆瓣電影、讀書Top250並排序

更新：已更新豆瓣電影Top250的指令碼及網站概述經常用豆瓣讀書的童鞋應該知道，豆瓣Top250用的是綜合排序，除使用者評分之外還考慮了很多比如是否暢銷、點選量等等，這也就導致了一些近年來評分不高的暢銷書在這個排行榜上高高在上遠比一些經典名著排名還高，於是在這裡打算重新給To

Python爬蟲系列之小說網爬取

今日爬蟲—小說網再次宣告所有爬蟲僅僅為技術交流，沒有任何惡意，若有侵權請☞私信☚ 此次爬取由主頁爬取到各本小說地址，然後通過這些地址獲取到小說目錄結構，在通過目錄結構獲取章節內容，同時以小說名字為資料夾，每一個章節為txt文字儲存到本地。話不多說，直接上程式碼

python爬蟲自動登入武漢大學校園網

#coding:utf-8 __author__ = 'zy' import urllib2 import cookielib import urllib import re import sys '''模擬登入''' PostUrl = "http://202.114.64.105:

Python爬蟲入門之豆瓣短評爬取

採用工具pyCharm，python3，工具的安裝在這就不多說了，之所以採用python3是因為python2只更新維護到2020年。新建python專案 File-Settings-project interpreter，點右上角+號，安裝requests，lx

python爬蟲--爬取豆瓣top250電影名

python爬蟲--爬取豆瓣top250電影名關於模擬瀏覽器登入的header，可以在相應網站按F12調取出編輯器，點選netwook，如下：以便於不會被網站反爬蟲拒絕。 1 import requests 2 from bs4 import BeautifulSoup

python 爬蟲 cookies設定，獲取登陸後介面。

前言 Cookie Cookie 是指某些網站伺服器為了辨別使用者身份和進行Session跟蹤，而儲存在使用者瀏覽器上的文字檔案，Cookie可以保持登入資訊到使用者下次與伺服器的會話。 Cookie原理 HTTP是無狀態的面向連線的協議, 為了保持連線狀態, 引入了

python 爬蟲獲取西刺網免費高匿代理ip

import chardet import requests from scrapy.selector import Selector import random from telnetlib import Telnet ip_list = [] def g

python爬蟲之雲片網國內簡訊介面爬取

安裝requests，lxml，openpyxl，pandas四個包。 requests爬取 lxml解析 panda轉換並儲存 openpyxl是讀寫excel檔案所用到的包程式碼奉上： import pandas as pandas import requests from lxm

零基礎Python爬蟲實戰：豆瓣電影TOP250

我們曾經抓取過貓眼電影TOP100，並進行了簡單的分析。但是眾所周知，豆瓣的使用者比較小眾、比較獨特，那麼豆瓣的TOP250又會是哪些電影呢？我在整理程式碼的時候突然發現一年多以前的爬蟲程式碼竟然還能使用……那今天就用它來演示下，如何通過urllib+BeautifulSoup來快

python爬蟲綜合篇，採集網易雲音樂全部歌手的熱門歌曲以及評論！

今天我給大家介紹一下用Python爬取網易雲音樂全部歌手的熱門歌曲.由於歌手個人主頁的網頁原始碼中還嵌入了一個子網頁(框架原始碼裡面包含了我們需要的資訊),因此我們不能使用requests庫來爬取,而使用selenium,接下來,讓我詳細講解整個爬取過程. 學習Pyt

爬蟲工程師教你如何用Python爬蟲模擬登入帶驗證碼網站！

問題分析： 1、爬取網站時經常會遇到需要登入的問題，這是就需要用到模擬登入的相關方法。python提供了強大的url庫，想做到這個並不難。這裡以登入學校教務系統為例，做一個簡單的例子。在這裡我還是要推薦下我自己建的Python開發學習群：483546416，都是學Python開發的，如果你

python爬蟲 -- 12306登入刷票

# -*- coding: utf-8 -*- from splinter.browser import Browser from time import sleep import traceback # Message: 'phantomjs' executable ne

【python爬蟲自學筆記】-----網易雲開放API

搜尋歌曲API：請求方式：post 請求地址：http://music.163.com/api/search/get/web?csrf_token= 請求資料：hlpretag=&hlposttag=&s=搜尋歌曲名或歌手名&type=1&