Python工具 | 9個用來爬取網絡站點的 Python 庫

阿新 • • 發佈：2019-04-26

解析器交互 als spider 分布式協作環境 python開發簡單

1??Scrapy

一個開源和協作框架，用於從網站中提取所需的數據。以快速，簡單，可擴展的方式。

官網

2??cola

一個分布式爬蟲框架。

GitHub

3??Demiurge

基於 PyQuery 的爬蟲微型框架。

官網

4??feedparser

通用 feed 解析器。

官網

5??Grab

Grab 是一個用於構建 Web scraper 的 python 框架。使用 Grab，您可以構建各種復雜性的 Web scraper，從簡單的5行腳本到處理數百萬個 Web 頁面的復雜異步網站爬蟲。 Grab 提供用於執行網絡請求和處理所接收內容的 API。與 HTML 文檔的 DOM 樹交互。

官網

6??MechanicalSoup

用於自動和網絡站點交互的 Python 庫。

GitHub

7??portia

Scrapy 可視化爬取。允許你在不需要任何編程知識的情況下直觀地抓取網站。使用 Portia 可以註釋一個網頁以識別您想要提取的數據，Portia 將根據這些註釋了解如何從類似頁面中抓取數據。

GitHub

8??pyspider

一個強大的爬蟲系統。

官網

9??RoboBrowser

一個簡單的，Python 風格的庫，用來瀏覽網站，而不需要一個獨立安裝的瀏覽器。

官網

如果大家想找一個Python學習環境，可以加入我們的Python學習群： 784758214 ，自己是一名高級python開發工程師，這裏有我自己整理了一套最新的python系統學習教程，包括從基礎的python腳本到web開發、爬蟲、人工智能、機器學習等。送給正在學習python的小夥伴！每天會準時的講一些項目實戰案例，分享一些學習的方法和需要註意的小細節，,這裏是python學習者聚集地

點擊：加入

Python工具 | 9個用來爬取網絡站點的 Python 庫

解析器交互 als spider 分布式協作環境 python開發簡單 1??Scrapy 一個開源和協作框架，用於從網站中提取所需的數據。以快速，簡單，可擴展的方式。官網 2??cola 一個分布式爬蟲框架。 GitHub 3??Demiurge 基於

Python工具 | 9個用來爬取網絡站點的 Python 庫

2??cola

3??Demiurge

4??feedparser

5??Grab

6??MechanicalSoup

7??portia

8??pyspider

9??RoboBrowser

Python工具 | 9個用來爬取網絡站點的 Python 庫

python設置代理IP來爬取拉勾網上的職位信息，

Java爬蟲爬取網易汽車車型庫

用python來爬取中國天氣網北京，上海，成都8-15天的天氣

通過python的urllib.request庫來爬取一只貓

我用Python爬取網易雲音樂上的Hip-hop歌單，分析rapper如何押韻

Python爬蟲：現學現用Xpath爬取豆瓣音樂

Python騷操作！利用Python來爬取IP代理！偷偷給文章刷閱讀量！

Python 利用BeautifulSoup和正則表示式來爬取旅遊網資料

利用Python來爬取空姐私密照！把它做成了一款軟體！人人可用哦！

python 模擬滑鼠點選+bs4爬取多個網頁新聞（題目、媒體、日期、內容、url）

python爬蟲建立代理池，爬取5000個代理IP並進行驗證！

Python又來爬取妹子圖啦，一個T的硬盤都不夠用

推薦｜23個Python爬蟲開源專案程式碼：爬取微信、淘寶、豆瓣、知乎、微博等

Swaggy教你用python實現NBA資料統計的爬取

5個開發必備的 Python 工具，你用過幾個？

用網路爬蟲爬取新浪新聞----Python網路爬蟲實戰學習筆記

用python爬取網貸之家p2p平臺數據

python 用BeautifulSoup爬取貼吧圖片

用python爬取網易雲音樂，新手看了也能操作

Python工具 | 9個用來爬取網絡站點的 Python 庫

2??cola

3??Demiurge

4??feedparser

5??Grab

6??MechanicalSoup

7??portia

8??pyspider

9??RoboBrowser

相關推薦