怎樣學好爬蟲的,選取爬蟲入手的瀏覽器，爬蟲認知篇（2）

阿新 • • 發佈：2018-11-07

選取一個瀏覽器,小白,網上得出結論谷歌瀏覽器OK!不是不讓用了嗎?怎麼還用谷歌??

為什麼爬蟲要用Chrome?

為什麼大家似乎都值得header應該怎麼寫？

為什麼大家都知道怎麼爬取網頁的路線？

為什麼....

如果你也跟我一樣，有過上面類似的疑問，那麼我覺得，這篇文章你可能值得看一下。

1. 設定谷歌

開啟設定--->有一個設定--->開啟設定

設定下滑到搜尋引擎選擇不是谷歌的,建議百度,把它設定成其他的引擎就行了,爬蟲用的是這個谷歌瀏覽器程式的功能,又不是谷歌瀏覽器介面對吧.

2.使用谷歌

用Chrome很容易看到網頁的原始碼輕鬆`右鍵` -> `檢查,`就可以看到這個原始碼.

`通過瀏覽器得到載入的資料`

`檢查`中還可以看網頁從伺服器上不斷載入包,雖然一開始我們點開的時候，網頁其實已經載入好了。對於所謂的`靜態網頁`在這個地方其實已經載入好了。（百度的首頁，一般會被認為是`靜態網頁`）,但是還可以通過這個來看。比如：重新整理一下網頁~~~~~不過，在那之前，我們要點之前`檢查`的最上面的 `network`，一般預設是選中`All`模式的，在中間偏上的部分。點好之後，我們就可以`重新整理`

了

比如：我們可以檢查之前的那個包,就可以看那些包的具體資訊。那樣，我們就可以得到了所有很多重要的資訊了

比如像上面的我們可以看到這個資訊，是通過上面header拿到的。不過這個，有些會把這個給隱藏掉。但基本是沒有問題的，一般我們只要知道一個就好了。還有其他的騷操作，比如：看看這個包是怎麼拿下來的，這樣我們就可以特定地拿資料了。

通過這個，我們可以看到這個，用的是`https://www.baidu.com/img/bd_logo1.png`

這個url，請求的方法是`get`,還可以得到對方的伺服器地址。

最後還可以通過最後的tim來看一下這個東西下載所用的時間
（可以算是測測速？）

這就是谷歌瀏覽器的設定及其用法,以後的爬蟲會經常使用的,也是作為爬蟲的一個基本技能.(沒設定的人趕緊去設定一下,沒用過的人趕緊去試一試!!!!)

怎樣學好爬蟲的,選取爬蟲入手的瀏覽器，爬蟲認知篇（2）

選取一個瀏覽器,小白,網上得出結論谷歌瀏覽器OK!不是不讓用了嗎?怎麼還用谷歌?? 為什麼爬蟲要用Chrome? 為什麼大家似乎都值得header應該怎麼寫？為什麼大家都知道怎麼爬取網頁的路線？為什麼....

怎樣學好爬蟲的,選擇自己的程式碼編譯的IDE，爬蟲認知篇（4）

一個專業的程式猿，必須要有符合自己的IDE環境；這樣，辦公效率會提高了很多。作為一個小白來說，很有必要的。能選專業版本就不選社群版，因為什麼呢？以後啊，你是要拿這個吃飯的！！！！記

如何學習爬蟲,我的爬蟲學習之路,怎樣學好爬蟲的,爬蟲認知篇（1）

作為一個小白來說,那就是---->我,看那多原理,等於天書,我看不懂,但是為啥是叫了解爬蟲,而不是懂裡邊內容,框架(Scrapy)怎麼寫的,我作為小白知道怎麼用,不就行了嗎,對不對,之後在瞭解深入.

第一個爬蟲開始前決定你的Python版本，你要使用什麼寫爬蟲，爬蟲認知篇（3）

Python入門當然建議直接學Python3了，畢竟是趨勢。而且Python3中對於字元編碼的改動會讓新手省掉很多很多很多關於字元編解碼問題的糾結。另一方面看你專案大小吧。如果自己寫程式碼，Python2和Python3沒啥區別。但是

爬蟲的編譯器的安裝，pycharm第三方庫的安裝和pip的安裝，爬蟲認知篇（5）

python之所以強大並逐漸流行起來，一部分原因要歸功於的Python的強大的第三方庫。這樣使用者就不用瞭解底層的思想，用最少的程式碼寫出最多的功能。

從第一個爬蟲建立起做蟲師的心，request物件，簡單使用，構造簡單的裝置請求頭，爬蟲簡單案例篇（2）

from urllib.request import urlopen from urllib.request import Request url ='http://www.baidu.com/' h

爬蟲入門，從第一個爬蟲建立起做蟲師的心，爬蟲的編譯器的安裝，pycharm第三方庫的安裝和pip的安裝，爬蟲的認知篇（5）

Python之所以強大並逐漸流行起來，一部分原因要歸功於Python強大的第三方庫。這樣使用者就不用瞭解底層的思想，用最少的程式碼寫出最多的功能。在PyCharm中安裝

Python網絡爬蟲實戰案例之：7000本電子書下載（2）

3.2 pytho oss 部署 .html http term ext 開發環境安裝一、前言本文是《Python開發實戰案例之網絡爬蟲》的第二部分：7000本電子書下載網絡爬蟲開發環境安裝部署。配套視頻課程詳見51CTO學院。二、章節目錄（1）Python開發環境

設計一套方案，解決不同瀏覽器的兼容問題（2）

normal github 直接下載帶來 src 我們比較廠商 png 移動端開發移動web開發,雖然瀏覽器的內核都是 webkit 但是不同的瀏覽器開發廠商 ,可能會為瀏覽器添加一些特殊的獨有樣式為了清除不同瀏覽器帶來的顯示差異我們有一

JS獲取瀏覽器視窗大小獲取螢幕，瀏覽器，網頁高度寬度（轉載）

網頁可見區域寬：document.body.clientWidth 網頁可見區域高：document.body.clientHeight 網頁可見區域寬：document.body.offsetWidth (包括邊線的寬) 網頁可見區域高：document

SQL Server橫向擴展：設計，實現與維護（2）- 分布式分區視圖

做的 img attach one 遠程 cnblogs ole out 不同的為了使得朋友們對分布式分區視圖有個概念，也為了方便後面的內容展開，我們先看看下面一個圖：講述分布式分區視圖之前，很有必要將之與我們常常熟悉的分區表和索引

C#指南，重溫基礎，展望遠方！（2）程序結構

system 兩個 -h static 說明所有順序 HR 相互 C# 中的關鍵組織結構概念包括程序、命名空間、類型、成員和程序集。 C# 程序由一個或多個源文件組成。程序聲明類型，而類型則包含成員，並被整理到命名空間中。類型示例包括類和接口。成員示例包括字段、方

Apache 流框架 Flink，Spark Streaming，Storm對比分析（2）

此文已由作者嶽猛授權網易雲社群釋出。歡迎訪問網易雲社群，瞭解更多網易技術產品運營經驗。 2.Spark Streaming架構及特性分析 2.1 基本架構基於是spark core的spark streaming架構。 Spark Streaming是將流式計算分解成一系列短小的批處理作業。這裡的批處

Ardupilot chibios編譯，啟動，main函式學習（2）

目錄文章目錄目錄摘要 1. Chibios編譯過程 2. Chibios啟動程式碼 1.startup_stm32f7xx.mk檔案 1.crt1.c 1.核心初始化函式

資料庫之redis篇（2）—— redis配置檔案，常用命令，效能測試工具

redis配置如果你是找網上的其他教程來完成以上操作的話，相信你見過有的啟動命令是這樣的：啟動命令帶了這個引數：redis.windows.conf，由於我測試環境是windows平臺，所以是這個，有的是redis.conf。顧名思義，redis.conf就是配置檔案，然後啟動時加

Java面試題，每日一總結（2）

1.字串String和StringBuilder 、StringBuffer的區別？StringBuilder和StringBuffer的區別？分析：java提供了String和StringBuilder 、StringBuffer三種表示和操作字串的類。字串就是有多個字

從新撿起c++，從stl開始（2）

list: list類似於連結串列，它的儲存空間不是連續的，但是可以快速的插入和刪除，但是隨機訪問比較慢。 assign() 給list賦值 back()返回最後一個元素 begin()返回指向第一個元素的迭代器 clear() 清空li

畢業3年，我辭職考研（2）

我的家庭其實還算是小康家庭，沒有過分的貧窮卻也從未富貴過。我從小一直是窮養大的，因為父親相信，兒子窮養長志氣，女兒富養懂規矩。也可能就是這樣的原因，我自認為懂事很早，6年級就學會自己生火做飯（那時候是煤火），初中高中到大學寄宿了將近10年，幾乎不會亂花一分錢，一

第三方Android 模擬器流暢速度快，適合開發人員（2）

介紹 Genymotion是一款出色的跨平臺的Android模擬器，具有容易安裝和使用、執行速度快的特點，是Android開發、測試等相關人員的必備工具。使用在Genymotion官網上註冊一個賬號下載安裝Genymotion 目前最新的版本為2

python科學計算學習二：matplotlib繪圖，圖標註釋（2）

圖標註釋對於搞研究的人來說是很重要的，一般的paper裡面也都會有。所以是很有必要要學習的。下面通過一個例子來說明python是怎麼做的。 1 import matplotlib.pyplot as plt 2 import numpy as n

怎樣學好爬蟲的,選取爬蟲入手的瀏覽器，爬蟲認知篇（2）

選取一個瀏覽器,小白,網上得出結論谷歌瀏覽器OK!不是不讓用了嗎?怎麼還用谷歌??

為什麼爬蟲要用Chrome?

如果你也跟我一樣，有過上面類似的疑問，那麼我覺得，這篇文章你可能值得看一下。

1. 設定谷歌

開啟設定--->有一個設定--->開啟設定

設定下滑到搜尋引擎選擇不是谷歌的,建議百度,把它設定成其他的引擎就行了,爬蟲用的是這個谷歌瀏覽器程式的功能,又不是谷歌瀏覽器介面對吧.

2.使用谷歌

用Chrome很容易看到網頁的原始碼輕鬆右鍵 -> 檢查,就可以看到這個原始碼.

通過瀏覽器得到載入的資料

比如：我們可以檢查之前的那個包,就可以看那些包的具體資訊。那樣，我們就可以得到了所有很多重要的資訊了

通過這個，我們可以看到這個，用的是https://www.baidu.com/img/bd_logo1.png 這個url，請求的方法是get,還可以得到對方的伺服器地址。

最後還可以通過最後的tim來看一下這個東西下載所用的時間 （可以算是測測速？）

這就是谷歌瀏覽器的設定及其用法,以後的爬蟲會經常使用的,也是作為爬蟲的一個基本技能.(沒設定的人趕緊去設定一下,沒用過的人趕緊去試一試!!!!)

相關推薦

用Chrome很容易看到網頁的原始碼輕鬆`右鍵` -> `檢查,`就可以看到這個原始碼.

`通過瀏覽器得到載入的資料`

通過這個，我們可以看到這個，用的是`https://www.baidu.com/img/bd_logo1.png`

這個url，請求的方法是`get`,還可以得到對方的伺服器地址。

最後還可以通過最後的tim來看一下這個東西下載所用的時間
（可以算是測測速？）