linux curl模擬登入網頁

阿新 • • 發佈：2019-02-04

有時在批量抓取網站頁面內容時，是需要處於登入狀態的，否則無法獲取。curl這個強大的工具可以完成這個工作。之前最好也先了解一下http POST方法，網站登入大都是用這個辦法。

本文基本上參考這篇文章,來自依雲's Blog，是archlinux中文論壇的百合仙子大大寫的，他參考的gihub上一個百度網盤資源進行訪問的小程式。我只是根據理解改了幾個小地方，轉載請註明出處

以百度為例
先儲存使用者變數

$ ACCOUNT=百度帳號$ PASS=帳號的密碼

第一步

訪問百度，取得cookie,儲存到cookies. 檢視檔案可知cookie名為BAIDUID

$ curl -c cookies www.baidu.com

(#可以加 -sS 安靜模式，不顯示進度，其中S表示只顯示錯誤；-o /dev/null 將眼花的輸出扔掉)

第二步

帶著cookie訪問這個地址，得到$TOKEN$

$ TOKEN=$(curl -b cookies -sS "https://passport.baidu.com/v2/api/?getapi&tpl=mn&apiver=v3&class=login&tt=$(date +%s)&logintype=dialogLogin" | tr "'" '"' | json_pp -t dumper -json_opt pretty | grep token | cut -d\' -f4)

第三步

帶著cookie , $TOKEN$對這個地址訪問

$curl -b cookies -c cookies https://passport.baidu.com/v2/api/?logincheck&token=$TOKEN$&tpl=mn&apiver=v3&tt=$(date +%s)&username=$ACCOUNT&isphone=false

返回下面內容

{"errInfo":{ "no": "0" }, "data": { "codeString" : "", "vcodetype" : "" }}

要是讓輸入驗證碼的話就哭了…….但第一次登入一般沒問題
(#curl -b 和 -c 引數同時使用表示當前目錄下的cookies檔案讀取 cookie 資料，如果接收新的到的 cookie，就寫到同一個檔案裡去

第四步

使用使用者資訊登陸：

curl -b cookies -c cookies --compressed -sS 'https://passport.baidu.com/v2/api/?login' -H 'Content-Type: application/x-www-form-urlencoded' --data "staticpage=http%3A%2F%2Fpan.baidu.com%2Fres%2Fstatic%2Fthirdparty%2Fpass_v3_jump.html&charset=utf-8&token=$TOKEN&tpl=mn&apiver=v3&tt=$(date +%s083)&codestring=&safeflg=0&u=http%3A%2F%2Fpan.baidu.com%2F&isPhone=false&quick_user=0&logintype=basicLogin&username=$ACCOUNT&password=$PASS&verifycode=&mem_pass=on&ppui_logintime=57495&callback=parent.bd__pcbs__ax1ysj" | grep -F err_no

我這裡錯誤碼顯示為0,表示成功，可能是別的值

第五步

登陸成功之後就可以呼叫網盤 API了，驗證是否成功

獲取容量:
$curl -b cookies -c cookies 'http://pan.baidu.com/api/quota'
返回:
{“errno”:0,“used”:0,“total”:5368709120,“request_id”:4959306489643694116}
列出根目錄下的檔案資訊：
$ curl -b cookies -c cookies 'http://pan.baidu.com/api/list' | json_pp
$ curl -b cookies -c cookies 'http://pan.baidu.com/api/list?dir=/test' | json_pp
建立目錄:
$ curl -b cookies -c cookies 'http://pan.baidu.com/api/create' -F path=/測試curl -F isdir=1 -F size= -F block_list='[]' -F method=post

可看到返回中有這幾行：

"path" : "/測試curl",     "isdir" : 1,     "size" : 0,     "fs_id" : 1083516221491878,     "category" : 6,     "server_filename" : "測試curl",

附註：

第二步中取得TOKEN時，要解析返回的json資料，可以不用json_pp, 也可以用別的工具，網上可以搜到不少，作者原文用的是jshon
第四步登入中的使用者資訊，各欄位如下(參考原作):
staticpage:http://www.baidu.com/cache/user/html/v3Jump.html // baidu登入後跳轉的地址
charset:UTF-8 // 編碼字符集
token:$TOKEN$
tpl:mn
apiver:v3 //apiver 的值是固定的 API的版本號
tt:當前時間
codestring:留空
isPhone:false //如果用手機號碼登入則ture 否則為 false
safeflg:0
u:http://www.baidu.com/
quick_user:0
usernamelogin:1
splogin:rate
username:使用者名稱
password:密碼明文
verifycode: //驗證碼，如果沒要求驗證碼，就為空
mem_pass:on //記住密碼
ppui_logintime:5000 //是一些登入用時間的，給個7000~10000的隨機數就好了
callback:parent.bdpcbsoa36qm

linux curl模擬登入網頁

有時在批量抓取網站頁面內容時，是需要處於登入狀態的，否則無法獲取。curl這個強大的工具可以完成這個工作。之前最好也先了解一下http POST方法，網站登入大都是用這個辦法。本文基本上參考這篇文章,來自依雲's Blog，是archlinux中文論壇的百合仙子大大寫的，他參

linux curl 模擬提交表單

在遠端Linux伺服器上,通過firefox命令，通過X協議，在本地節點顯示瀏覽器，提交表單，操作十分緩慢。但是有時候只是操作一些簡單的post操作。這時候，可以使用curl命令，進行預設提交，可以產生相同的效果。示例：公司必須外網訪問之前需要認證。在開啟外部網頁時，會

curl模擬登入新浪微博

<?php header('Content-type:text/html;charset=utf-8'); $loginUrl = 'https://login.sina.com.cn/sso/login.php?client=ssologin.js (v1.4.15)&_=140313879

PHP CURL 模擬登入 SINA 微博

最近工作上有一個需求, 需要獲取 http://weibo.com/at/weibo 的資料, 就是 @我自己的資料, 沒有介面, 只能通過抓頁面. 下面貼下部分程式碼 <?php /** * 用於模擬新浪微博登入! by CJ ( ht

curl模擬登入,併發測試

開發各種軟體或系統都需要進行壓力測試等，近來有一個後臺web系統新需要進行測試，怎麼才能很方便的測試呢，curl就ok了。 curl是linux/unix下很強大的命令，全稱 command url，web測試中最重要的應該算是維持session，而客戶端實現的方式是使

Linux curl 命令模擬 POST/GET 請求

文件時間範圍 enc 響應頭 err continue out 引用什麽 curl 命令，是一個利用URL規則在命令行下工作的文件傳輸工具。 curl 支持文件的上傳和下載，所以是綜合傳輸工具，但按傳統，習慣稱curl為下載工具。作為一款強力工具，curl支持包括HT

模擬登入介面網頁原始碼

<!DOCTYPE html> <html> <head> <meta charset="utf-8" /> &

使用CURL進行採集或模擬登入

在資訊採集的時候，要採集的站點可能需要登入，這樣使用簡單的採集方式（例如file_get_contents）就無法做到了，我們可以利用PHP的CURL擴充套件庫來進行模擬登入，下面給出程式碼示例： <?php $cookie_path = './'; //設定coo

php curl 模擬微信公眾號登入

<span style="font-size:18px;"><?php //模擬微信登入 $cookie_file = tempnam('./temp','cookie'); $login_url = 'https://mp.weixin.qq.

Linux 下模擬Http 的get or post請求(curl和wget兩種方法)

一、get請求： 1、使用curl命令： curl "http://www.baidu.com" 如果這裡的URL指向的是一個檔案或者一幅圖都可以直接下載到本地 curl -i "http://www.baidu.com" 顯示全部資訊 curl -l "http://

Linux curl命令模擬Http請求(get/post),繫結host訪問

linux curl模擬http請求傳送資料： ①get方式提交資料： curl -G -d “name=value&name2=value2” http://www.baidu.com

Linux下curl模擬帶header的Http請求

curl -H "Accept:text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8 Accept-E

PHP之CURL實現含有驗證碼的模擬登入

博主最近在為學校社團寫一個模擬登入教務系統來進行成績查詢的功能，語言當然是使用PHP啦，原理是通過php資料傳輸神器—curl擴充套件，向學校教務系統傳送請求，通過模擬登入，獲取指定url下的內容。在開始實驗之前有必要對curl擴充套件進行

使用PHP-curl獲取驗證碼並模擬登入教務系統

首先說一下這篇文章的需求，當我們在一些沒有提供驗證介面的系統中，需要驗證使用者身份的時候，就可能需要使用者登入當前系統，從而確定該使用者是當前系統的合法使用者，校園的教務系統就是一個典型的例子，我們通過學生自己登入學校的教務系統從而確定該使用者為在校生。但是

Linux下使用CURL模擬使用者提交post表單

本文介紹在Linux下使用CURL命令提交post請求，在需要手動重複提交post表單時，使用本文介紹的方法可以達到事半功倍的效果。事情是這樣的：在只能藉助以下的運維介面的情況下，要通過此介面提供的入口查詢一批關鍵詞。關鍵詞的格式是msgtype:x

php curl儲存登入資訊模擬登入

在模擬論壇登入的時候，伺服器上會生成一個cookie 這個時候需要把cookie儲存，再每次請求的時候帶上這個cookie就可以

Linux curl 表單登入或提交與cookie使用

本文主要講解通過curl 實現表單提交登入。單獨的表單提交與表單登入都差不多，因此就不單獨說了。說明：針對curl表單提交實現登入，不是所有網站都適用，原因是有些網站後臺做了限制或有其他校驗。我們不知道這些網站後臺的限制或校驗機制具體是什麼，因此直接curl表單登入可能是不行的。當然，如下案

Python模擬登入豆瓣網，並爬取小組信息

count alias pass spa .post windows chrome apr ror import requests from bs4 import BeautifulSoup from PIL import Image headers = { ‘

linux c++模擬簡易網絡爬蟲

soc argv 爬蟲 and gethostby ddr rec cep use /* * To change this license header, choose License Headers in Project Properties. * To change t

curl抓取網頁內容php

dem windows grep 網頁資源網頁爬蟲 url 工具 () 動態獲取 1.cURL curl是客戶端向服務器請求資源的工具 2.cURL使用場景網頁資源：網頁爬蟲 webservice數據接口資源：動態獲取接口數據天氣號碼歸屬地 ftp資源：下載ftp

linux curl模擬登入網頁

第一步

第二步

第三步

第四步

第五步

附註：

相關推薦