1. 程式人生 > 實用技巧 >用易語言寫個簡單的小爬蟲其中的關鍵點

用易語言寫個簡單的小爬蟲其中的關鍵點

一.請求頭

ctrl+L快捷鍵建立變數

變數名 型別
協議引數 類_POST資料類
請求頭資料 文字型

協議引數.新增 (“v”, “4.52.0”)

請求頭資料 = 協議引數.獲取協議頭資料 ()

二.請求引數比如post

變數名 型別
請求data引數 類_POST資料類
請求data提交內容 文字型

請求data引數.新增 (“type”, “0”)

請求data提交內容 = 請求data引數.獲取JSON文字 ()

三.進行請求

呼叫網頁_訪問S方法

.子程式 網頁_訪問S, 文字型, , 原始碼由[洫蜘蛛]提供,使用WinHttp的 API方式訪問網頁,如果返回是“?”請查詢返回協議頭是否有“Content-Encoding: gzip“表示gzip壓縮過網頁,可用 網頁_GZIP解壓()命令解壓,如果返回是亂碼,則返回原始文字,請自行轉換編碼,失敗返回空文字,請取出狀態文字。
.引數 網址, 文字型, , 完整的網頁地址,必須包含http://或者https://
.引數 訪問方式, 整數型, 可空 , 0=GET 1=POST 2=HEAD  3=PUT  4=OPTIONS  5=DELETE  6=TRACE  7=CONNECT
.引數 提交資訊, 文字型, 可空 , POST專用
.引數 提交Cookies, 文字型, 參考 可空 , 設定提交時的cookie
.引數 返回Cookies, 文字型, 參考 可空 , 返回的Cookie
.引數 附加協議頭, 文字型, 可空 , 一行一個請用換行符隔開,建議填寫常量值或文字值,防止因傳參引發錯誤
.引數 返回協議頭, 文字型, 參考 可空 , 返回的協議頭
.引數 禁止重定向, 邏輯型, 可空 , 預設不禁止網頁重定向
.引數 網站登入使用者名稱, 文字型, 可空 , 自動登入網頁使用者名稱 如路由器
.引數 網站登入密碼, 文字型, 可空 , 
.引數 代理地址, 文字型, 可空 , 代理地址,格式為 8.8.8.8:88
.引數 代理帳號, 文字型, 可空 , 
.引數 代理密碼, 文字型, 可空 , 
.引數 超時時間, 整數型, 可空 , 可以被省略,單位:秒,預設30秒,如果提供大於0的數值,則修改操作超時時間。
.引數 返回重定向, 文字型, 參考 可空 , 可以被省略,提供引數時只能提供文字型變數,用於當發生重定向時取回頁面重定向的地址。
.引數 返回狀態文字, 文字型, 參考 可空 , 
.引數 返回原始資料, 位元組集, 參考 可空 , 可以被省略,返回原始網頁編碼
.引數 是否自動合併更新Cookie, 邏輯型, 可空 , 預設為真,自動合併更新
.引數 是否補全必要協議頭, 邏輯型, 可空 , 當附件協議頭為空時自動新增必要的UA協議頭 預設為真,假將不再新增非傳入協議頭
.引數 位元組集提交, 位元組集, 可空 , 提交位元組集資料
.引數 是否處理協議頭大小寫, 邏輯型, 可空 , 將協議頭中的鍵名首字母處理為大寫  預設為真

四.返回內容改成utf8編碼

編碼_utf8到gb2312(返回值)

五.展示效果圖(涉及一些加密打碼請諒解)