Python使用Chrome外掛實現爬蟲過程圖解

阿新 • • 發佈：2020-06-10

做電商時，消費者對商品的評論是很重要的，但是不會寫程式碼怎麼辦？這裡有個Chrome外掛可以做到簡單的資料爬取，一句程式碼都不用寫。下面給大家展示部分抓取後的資料：

可以看到，抓取的地址，評論人，評論內容，時間，產品顏色都已經抓取下來了。那麼，爬取這些資料需要哪些工具呢？就兩個：

1. Chrome瀏覽器；

2. 外掛：Web Scraper

外掛下載地址：https://chromecj.com/productivity/2018-05/942.html

最後，如果你想自己動手抓取一下，這裡是這次抓取的詳細過程：

1. 首先，複製如下的程式碼，對，你不需要寫程式碼，但是為了便於上手，複製程式碼還是需要的，後續可以自己定製和選擇，不需要寫程式碼。

{
  "_id": "jdreview","startUrl": [
    "https://item.jd.com/100000680365.html#comment"
  ],"selectors": [
    {
      "id": "user","type": "SelectorText","selector": "div.user-info","parentSelectors": [
        "main"
      ],"multiple": false,"regex": "","delay": 0
    },{
      "id": "comments","selector": "div.comment-column > p.comment-con",{
      "id": "time","selector": "div.comment-message:nth-of-type(5) span:nth-of-type(4),div.order-info span:nth-of-type(4)","delay": "0"
    },{
      "id": "color","selector": "div.order-info span:nth-of-type(1)",{
      "id": "main","type": "SelectorElementClick","selector": "div.comment-item","parentSelectors": [
        "_root"
      ],"multiple": true,"delay": "10000","clickElementSelector": "div.com-table-footer a.ui-pager-next","clickType": "clickMore","discardInitialElements": false,"clickElementUniquenessType": "uniqueHTMLText"
    }
  ]
}

2. 然後開啟chrome瀏覽器，在任意頁面同時按下Ctrl+Shift+i，在彈出的視窗中找到Web Scraper，如下：

Python使用Chrome外掛實現爬蟲過程圖解

3. 如下

Python使用Chrome外掛實現爬蟲過程圖解

4. 如圖，貼上上述的程式碼：

Python使用Chrome外掛實現爬蟲過程圖解

5. 如圖，如果需要定製網址，注意替代一下，網址後面的#comment是直達評論的連結，不能去掉：

Python使用Chrome外掛實現爬蟲過程圖解

6. 如圖：

Python使用Chrome外掛實現爬蟲過程圖解

7. 如圖：

Python使用Chrome外掛實現爬蟲過程圖解

8. 如圖，點選Scrape後，會自動執行開啟需要抓取得頁面，不要關閉視窗，靜靜等待完成，完成後右下方會提示完成，一般1000條以內的評論不會有問題：

Python使用Chrome外掛實現爬蟲過程圖解

9. 最後，點選下載到電腦，資料儲存好。

Python使用Chrome外掛實現爬蟲過程圖解

使用這個工具的好處是：

1. 不需要程式設計；

2. 京東的評論基本可以通用此指令碼，修改對應的url即可；

3. 如果需要爬取的評論不到1000條，這個工具會非常稱手，所有的資料完全自動下載；

使用的注意點：

1. 抓取過一次的資料會有記錄，立刻再次抓取將不會儲存，建議關閉瀏覽器重新開啟後再試；

2. 抓取數量:1000條以內沒有問題，可能是京東按照IP直接阻止了更多的爬取；

如果你的英語水平不錯，可以嘗試閱讀官方文件，進一步學習和定製自己的爬蟲。

官方教程：https://www.webscraper.io/documentation

以上就是本文的全部內容，希望對大家的學習有所幫助，也希望大家多多支援我們。

Python使用Chrome外掛實現爬蟲過程圖解

node-cheerio外掛實現爬蟲

本文將介紹node使用cheerio外掛，使jquery可以在服務端解析結構，實現精準查詢並爬取資料

Jmeter配置代理實現錄製過程圖解

1、谷歌瀏覽器配置管理在代理伺服器中，按上圖進行設定，可以把localhost換成 127.0.0.1 ，埠換成你想設定的，但是不要與別的埠進行衝突，一般四位數的埠衝突比較少

SpringBoot路徑對映實現過程圖解

這篇文章主要介紹了SpringBoot路徑對映實現過程圖解,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

MVC頁面之間引數傳遞實現過程圖解

這篇文章主要介紹了MVC頁面之間引數傳遞實現過程圖解,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

String split方法實現過程圖解

這篇文章主要介紹了String split方法實現過程圖解,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

python爬蟲爬取筆趣網小說網站過程圖解

首先：文章用到的解析庫介紹 BeautifulSoup： Beautiful Soup提供一些簡單的、python式的函式用來處理導航、搜尋、修改分析樹等功能。

springboot自定義starter實現過程圖解

這篇文章主要介紹了springboot自定義starter實現過程圖解,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

SpringBoot實現傳送郵件功能過程圖解

首先建立一個郵箱賬號，建議@126.com，@163.com，@qq.com 都可以開啟smtp，以下是使用圖解：

Java基於jeeplus vue實現簡單工作流過程圖解

jeeplus 是一款基於程式碼生成器的快速開發平臺。前後端分離、maven多模組開發，方便多人協同開發

Java跨session實現token介面測試過程圖解

這套框架的報告是自己封裝的一般token會在登入介面返回結果中呈現，從程式碼層面獲取token的方式有很多種，我是使用jsonpath這個json路徑語言去匹配token所在路徑的key值

springCloud服務註冊Eureka實現過程圖解

介紹　Eureka 是Netfix開發的，一個基於Rest服務的，服務註冊與發現的元件。　　　主要包括兩個元件：Eureka Server和Eureka Client

基於jmeter實現跨執行緒組傳遞token過程圖解

遇到一些綜合場景的設定，每個不同的請求併發數設定不同的時候，可以用多個執行緒組的組合來實現，但是這個時候，會遇到一個問題，那就是jmeter各個執行緒組之間是相互獨立的，各個執行緒互不影響，所以執行緒組A中輸

Vue釋出訂閱模式實現過程圖解

vue專案中不同元件間通訊一般使用vuex，通常情況下vuex和EventBus不應該混用，不過某些場景下不同元件間只有訊息的互動，這時使用EventBus訊息通知的方式就更合適一些。

Python實現UDP程式通訊過程圖解

執行流程：編輯好程式碼後，通過cmd開啟檔案執行。例：C:\\Users\\小李酷少>C:\\Users\\小李酷少\\Desktop\\傳送端.py hello

Java飛行記錄器JFR功能實現過程圖解

JFR 如果要深入分析問題，可以選擇使用內建的Java飛行記錄器:Java Mission Control。

Spring bean物件例項化實現過程圖解

好了我們聊聊 Bean 的例項化過程的幾個重要角色 BeanDefinitionRegistryPostProcessor 介面

Spring實現原始碼下載編譯及匯入IDEA過程圖解

一、環境準備 idea版本：IntelliJ IDEA 2019.3.4 gradle版本：gradle-4.10.3 jdk版本：jdk-8u251-windows-x64.exe(1.8.0_251)

Python資料視覺化實現漏斗圖過程圖解

專案實現知識點： Pandas庫及pyecharts庫 Pandas：資料分析和處理工具。 pd.read_csv()：讀取csv檔案。

Tomcat Nginx Redis實現session共享過程圖解

一、準備工作中介軟體：Tomcat、Redis、Nginx jar包：commons-pool2-2.4.2.jar、jedis-2.8.0.jar、tomcat-redis-session-manager-2.0.0.jar

Python使用Chrome外掛實現爬蟲過程圖解

相關推薦