在python獲取網頁的代碼中添加頭信息模擬瀏覽器

阿新 • • 發佈：2018-01-14

alt 把他無法 app 兩種 port tex 方法 vpd

為什麽要添加頭部信息，因為有時候有些網頁會有反爬蟲的設置，導致無法獲取正常的網頁，在這裏，在代碼的頭部添加一個headers信息，模擬成瀏覽器去訪問網頁。

沒有添加頭部信息的代碼

import urllib2
url = "http://blog.51cto.com/lsfandlinux/2046467"
file = urllib2.urlopen(url)
html = file.read()
print html

接下來添加頭部信息，首先在瀏覽器打開百度一下，然後檢查網頁的頭部信息，找到User-Agent，這就是我們用來模擬瀏覽器要用到的信息，把他復制下來。
技術分享圖片

然後在代碼裏面添加頭部信息的變量存儲對應的headers信息，定義的格式為（“User-Agent”，具體信息）。

在代碼中添加頭部信息的方法有兩種：
方法1：使用build_opener()來添加

import urllib2
url = "http://blog.51cto.com/lsfandlinux/2046467"
headers = ("User-Agent","Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/60.0.3112.113 Safari/537.36")
opener = urllib2.build_opener()
opener.addheaders = [headers]
file = opener.open(url)
html = file.read()
print html

我們利用opener.open(url)就是打開網頁，這個opener就是具有頭部信息的操作了。

方法2：利用add_header()來添加

import urllib2
url = "http://blog.51cto.com/lsfandlinux/2046467"
req = urllib2.Request(url)
req.add_header("User-Agent","Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/60.0.3112.113 Safari/537.36")
file = urllib2.urlopen(req)
html = file.read()
print html

該方法是通過urllib2裏的Request來創建一個Request對象賦值給變量req，然後使用add_header添加頭部信息。

在python獲取網頁的代碼中添加頭信息模擬瀏覽器

alt 把他無法 app 兩種 port tex 方法 vpd 為什麽要添加頭部信息，因為有時候有些網頁會有反爬蟲的設置，導致無法獲取正常的網頁，在這裏，在代碼的頭部添加一個headers信息，模擬成瀏覽器去訪問網頁。沒有添加頭部信息的代碼 import urllib2

向班級集合中添加學生信息

length png nbsp 添加方法 view bubuko 代碼 col 實現效果：　　知識運用：　　　System.Collections命名空間下的ArrayList集合類的Add()方法　　　使用了 DataGridView 控件實現代碼：

貴陽SEO 教你建站中讓wordpress最新評論列表更美觀的代碼及添加方法

貴陽SEO 貴陽建站貴州建站貴陽SEO請添加鏈接描述教你建站中讓wordpress最新評論列表更美觀的代碼及添加方法在我們的網站建設過程中，使用wordpress默認的最新評論，大家是不是覺得太單調了，也不是很美觀，並且也不能按照我們的需求列表顯示最新評論的內容，貴陽SEO今天分享給大家一段修

JS 代碼中到底加不加分號

語句 ber UNC 結束 print 歧義允許 tomat -- 背景在寫自動執行函數時 vm.$watch(‘datas‘, function() { console.log(vm.datas); }) (function () { console.

Openck_Swift源代碼分析——添加、刪除設備時算法詳細的實現過程

add repl microsoft ring 磁盤掛載 span account family 1 初始加入設備後、上傳Object的詳細流程前幾篇博客中，我們講到環的基本原

為markdown代碼塊添加行號，復制和折疊按鈕

func radius 按鈕 function number adding 推薦 position ali js selection表示頁面中抹藍的選中文本區域 range表示包含節點和部分文本節點的文檔片段。復制的思路就是將要復制的元素納入range，將range納入s

Eclipse中導入JDK類庫的源代碼以及添加指定的API

window nis led install 名稱 chm api name 導入一、在Eclipse中導入JDK類庫的源代碼操作步驟：打開eclipse->“window”-> “Preferences”

無代碼軟件開發為輸入框添加提示信息

修改某個字段技術用法輸入提示自定義分享圖片記錄 -o 所有無代碼開發中的輸入框都可以添加一個<placehoder>保留變量名的變量元件（也是數據類型元件），來為輸入框設計顯示提示信息，可以將我們的輸入提示、輸入規則或格式要求等信息用一個字符常量定

SVN提交強制添加註釋信息

svn在SVN管理上很多同事為了方便直接提交，不填寫註釋，在日後的管理上造成很大的麻煩，在此通過pre-commit腳本進行控制，提交時不能少於5個字符，否則不予提交。REPOS="$1" TXN="$2" SVNLOOK=/usr/bin/svnlook LOGMSG=`$SVNLOOK log -t "

C# 後臺添加Log信息

code bsp 調用 str conf except rec .config 效果展示我們在做項目的時候，經常會使用到Log日誌，今天分享一下如何在後臺添加Log信息創建一個寫Log的方法： 1 public void WriteLog(string Acti

利用python獲取nginx服務的ip以及流量統計信息

服務 open contex int bin line define pytho repeat #!/usr/bin/python #coding=utf8 log_file = "/usr/local/nginx/logs/access.log" with open

vim 編寫腳本時自動配置添加版權信息

自動配置添加版權信息在編寫腳本時，可添加版權信息，以便腳本的最大實用性，也是個人勞動所在下面是vim 編寫腳本時自動配置添加版權信息在用戶的家目錄下（一般是root目錄）編輯.vimrc（註意是隱藏文件）編輯以下內容（若以下內容復制格式有問題，請將附件的vimrc拷貝並改名為.vimrc）ma

Eclipse4.7使用基礎修改生成的.java文件模板,添加作者信息與創建時間

file nbsp .com alt gen true clip ref 文件 os ：windows7 x64 jdk：jdk-8u131-windows-x64 ide：Eclipse Oxygen Release (4.7.0) referen

使用ul，添加新聞信息列表

class data code 沒有 mar 編輯 img lang 信息使用ul，添加新聞信息列表在瀏覽網頁時，你會發現網頁上有很多信息的列表，如新聞列表、圖片列表，如下圖所示。新聞列表圖片列表這些列表就可以使用ul-li標簽來完成。ul-li是沒有前後

pycharm查看代碼註釋的方法，代碼編寫日誌及作者信息等

快捷 pyc 編寫 http 代碼信息作者 class com 竟然在邊欄有個右鍵的快捷鍵。annotate可以查看代碼書寫日期及作者 pycharm查看代碼註釋的方法，代碼編寫日誌及作者信息等

LabVIEW--為控件添加說明信息

提高信息之前 clas 今天 body width info img 之前只知道為VI添加說明信息（在VI的屬性裏面添加，快捷鍵ctrl+I 打開），今天知道了控件也可以添加說明信息，這樣就方便了許多，極大的提高了程序的可讀性。 LabVIEW--為控件添加說明

通過Python 獲取Linux系統用戶的登錄信息

linux CentOS Python 通過Python腳本實現用戶登入Linux的時候自動發郵件通知管理員系統環境CentOS 7 #!/usr/bin/env python#coding:utf-8 #導入需要的庫，如果沒有自行安裝import osimport smtplibfrom ema

H5阻止默認氣泡，添加錯誤信息

var bmi ins tel ESS lec family for charset <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8">

添加學生信息並顯示

lds 圖片輪播方法 null 分享圖片 set方法對象 mes 思路思路分析第一，創建表單 <fieldset> <legend>學生信息添加</legend> <form id="mainForm"

OpenLayers 添加網格信息

加網 set wid openlayer var map rgba stroke 自帶 OpenLayers 官網提供了自帶的屬性添加網格信息，當地圖作為底圖時，如果添加了過多的圖層，各圖層之間由於沖突不會顯示出來，下面的方法能很好的解決。代碼如下： var gratic

在python獲取網頁的代碼中添加頭信息模擬瀏覽器

相關推薦