豆瓣爬蟲：模擬登入（可直接在cmd執行）

阿新 • • 發佈：2018-12-18

按[F12]開啟網頁原始碼 - 按[F8]尋找redir - 可將redir的value值設為你想跳轉的頁面。

手動登入後，跳轉到賬戶介面，如下：

按[F12]，開啟如下介面：

（1）檢視[Network] - [login] - [From Data]裡面的資訊，這就是我們要從程式碼中提交的資訊。

（2）其中[User-Agent]資訊為headers中的資訊。

程式碼：

1.配置環境：coding,packages,headers(cookies不需要設定)

# coding: utf-8
import urllib.request
import pandas as pd
from bs4 import BeautifulSoup
from bs4 import UnicodeDammit
import urllib.parse
import requests
import re
from urllib.request import urlretrieve
#根據自己的瀏覽器設定
headers = {"User-Agent":'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/43.0.2357.134 Safari/537.36'}

4.兩種登入模式：需要驗證碼和不需要驗證碼

（1）不需要驗證碼，輸入使用者名稱和密碼後，將會自動跳轉到個人賬戶介面

loginUrl = 'https://accounts.douban.com/login'
formData={
     "redir":"http://movie.douban.com/mine?status=collect",
     "form_email":input('請輸入使用者名稱/郵箱(格式為[email protected]):'),
     "form_password":input('請輸入密碼(格式為qazwsx123):'),
     "login":u'登入'}

r = requests.post(loginUrl,data=formData,headers=headers)

（2）如果有驗證碼，則從頁面中解析出驗證碼的ID和image，並儲存image到本地。為了方便，image直接從程式碼中顯示出來。

page = r.text
if r.url != 'https://movie.douban.com/mine?status=collect':
    soup = BeautifulSoup(page,"html.parser")
    captchaAddr = soup.find('img',id='captcha_image')['src']

    reCaptchaID = r'<input type="hidden" name="captcha-id" value="(.*?)"/'
    captchaID = re.findall(reCaptchaID,page)

    image_file = input('請輸入豆瓣登入的驗證碼圖片儲存地址，格式為  F:\\\\16.Job\\\\1.Scrapy\\\\image.jpg 注意：單斜槓\轉為雙斜槓\\\\   ：')

    urlretrieve(captchaAddr,image_file)
    print('提示：儲存後圖片會自動開啟，記住驗證碼並關閉圖片視窗，等待至出現提示後再輸入驗證碼。')

    import cv2
    import matplotlib.pyplot as plt 
    image = cv2.imread(image_file)
    plt.imshow(image)
    plt.show()
    print(formData)
    r = requests.post(loginUrl,data=formData,headers=headers)
    print(r.text)

5.登入成功與否的提示

if r.url == 'https://movie.douban.com/mine?status=collect':
    print(page)
    print('----------------------------------------登入成功----------------------------------------')
else:
    print('----------------------------------------登陸失敗----------------------------------------')

豆瓣爬蟲：模擬登入（可直接在cmd執行）

按[F12]開啟網頁原始碼 - 按[F8]尋找redir - 可將redir的value值設為你想跳轉的頁面。手動登入後，跳轉到賬戶介面，如下：按[F12]，開啟如下介面：（1）檢視[Network] - [login] - [From Data]

Python入門：模擬登入（二）或註冊之requests處理帶token請求

首先說一下使用python模擬登入或註冊時，對於帶token的頁面怎麼登入註冊模擬的思路： 1、對於帶token的頁面，需要先從最開始的頁面獲取合法token 2、然後使用獲取到的合法token進行

Python入門：模擬登入（一）urllib

我們很多時候需要用python寫測試web的指令碼，但現在很多網站都需要登入才能進行下一步操作的，所以python模擬登入在我們的日常操作中很重要，下來我給大家簡單介紹一下python是怎樣實現web登

藍橋杯：交叉排序（java直接排序實現）

package lanqiaobei; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /* 練習題：交叉排序蒜頭君很無聊，現在有 N 個數，其中第 i(1≤i≤N) 個數是 Ai。現在

Python爬蟲之模擬登入豆瓣獲取最近看過的電影

哈哈哈，模擬登入成功啦啦啦啦啦~~~~~ 重要的事本來要說三遍，不過還是算了== 先上效果圖：眾所周知，很多網站都設定了登入之後才能獲取檢視頁面的權利，因此模擬登入成了爬取資訊的第一步，這一步

Linux c++,用訊號量實現消費者生產者佇列（程式碼可直接通過編譯）

//用訊號量實現的一個消費者生產者佇列， #include <iostream> #include <pthread.h> #include <semaphore.h> #include <errno.h> #include <queue>

爬蟲：模擬瀏覽器對網站內容進行爬取

對於一些保護比較好的網站，他能識別你是用requests庫對其進行訪問，所以有些網站會禁止你用python對其進行訪問所以我們可以修改傳送給網站的頭部資訊，偽造瀏覽器對網站進行訪問檢視我們傳送給網站的頭部資訊：r.request.headers kv={'user-agent':

Telnet和Rlogin：遠端登入（26.5__4）

26.5.4 行方式：客戶中斷鍵看一下當用戶鍵入中斷鍵時 Te l n e t將發生什麼情況。假定在客戶主機 b s d i和伺服器 c a n g o g h . c s . b e r k e l e y . e d u之間建立了一個Te l n e t

Python練習：使用者登入（三次機會）

描述給使用者三次輸入使用者名稱和密碼的機會，要求如下： 1）如輸入第一行輸入使用者名稱為‘Kate’,第二行輸入密碼為‘666666’，輸出‘登入成功！’，退出程式； 2）當一共有3次輸入使用者

Telnet和Rlogin：遠端登入（26.4__3）

26.4.5 半雙工、一次一字元、一次一行或行方式對於大多數Te l n e t的伺服器程序和客戶程序，共有4種操作方式。 1. 半雙工 ----------------------- Page 13-----------------------

網路爬蟲_網頁登入（蘇寧有驗證碼）—基於HtmlUnit

輸入驗證碼： public static String getCode(){ System.out.println("請輸入驗證碼："); Scanner sc = new Scanner(System.in); String code = s

知乎爬蟲之模擬登入

爬蟲簡單的原理就是傳送一個請求到網站的伺服器，伺服器進行響應，然後從伺服器響應的內容解析出我們想要的資料這裡我們將用requests庫來發送請求（Windows上面在控制檯通過pip3 install requests 進行安裝），解析可以用beauti

在登入Linux時要執行檔案的過程（可設定開機啟動）

在登入Linux時要執行檔案的過程如下：在剛登入Linux時，首先啟動 /etc/profile 檔案，然後再啟動使用者目錄下的 ~/.bash_profile、 ~/.bash_login或 ~/.profile檔案中的其中一個，（NanoPiM1 .profil

轉載-Python爬蟲之模擬登入總結

備註：python 2.7.9，32位有些網站需要登入後才能爬取所需要的資訊，此時可以設計爬蟲進行模擬登入，原理是利用瀏覽器cookie。一、瀏覽器訪問伺服器的過程：（1）瀏覽器（客戶端）向Web伺服器發出一個HTTP請求（Http r

Springboot （打成jar執行）上傳圖片到伺服器，客戶端可直接通過url訪問

本地測試時，直接上傳圖片到resources/static 檔案下沒有問題，但是打成jar後，直接報錯 @RequestMapping(value = "/oldUploadImage",method = RequestMethod.POST) p

Python進階之爬蟲url去重（可用於檔案去重）

主要介紹幾個常用和目前瞭解的，當然還有其他方法，這裡只說目前本人自己能實現的幾種方法的基本思想:基於Hash演算法的儲存。對每一個給定的URL，都是用一個已經建立好的Hash函式，對映到某個實體地址上。當需要進行檢測URL是否重複的時候，只需要將這個URL進行Hash對映，如

Android自動化之adb模擬操作（可實現按鍵精靈和手機輸入法）

最近因為工作需要，需要實現某一應用自動操作android手機的業務場景。網上查了下，發現按鍵精靈早就有了Android版本，於是研究了下它。我們知道，手機連線電腦，在電腦上輸入adb命令是可以實現安裝應用、解除安裝應用、monkey等事件的，甚至可以指定點選

python--python3爬蟲之模擬登入知乎

程式碼在python3環境下測試通過： from bs4 import BeautifulSoup import requests url = 'http://www.zhihu.com' login_url = url+'/login/email' captcha_

從零寫一個編譯器（十）：編譯前傳之直接解釋執行

專案的完整程式碼在 C2j-Compiler 前言這一篇不看也不會影響後面程式碼生成部分現在經過詞法分析語法分析語義分析，終於可以進入最核心的部分了。前面那部分可以稱作編譯器的前端，程式碼生成程式碼優化都是屬於編譯器後端，如今有關編譯器的工作崗位主要都是對後端的研究。當然現在寫的這個編譯器因為水平有限

樹莓派3學習筆記（7）：7寸（分辨率800 480）顯示器配置

樹莓派、顯示器配置樹莓派3學習筆記（7）：7寸（分辨率800 480）顯示器配置樹莓派搭載分辨率為800X480的顯示器在顯示的時候可能會遇到無法全屏顯示的問題，顯示器只有部分能夠顯示，有一部分是黑邊，對於這一種情況，我們只需進入系統的boot目錄，找到config.txt文件，或者直接在命

豆瓣爬蟲：模擬登入（可直接在cmd執行）

相關推薦