Python領域最偉大工程師Kenneth Reitz又出來搞事了！

阿新 • • 發佈：2018-08-18

undefined xpath 過來人攝影 containe may strip 但是 -html

Python 程序員，特別是做爬蟲的同學都知道 HTTP 請求庫 Requests，Requests 完美體現了 “for Humans” 這個詞要表達的意思。

它的作者是高顏值的攝影愛好者 kennethreitz ，kennethreitz 寫過很多的庫，除了 Requests 、還有 pipenv，一個更好的集成了包管理和環境管理的工具。日期時間庫 maya 等等。

這兩天他又搞出一個新項目叫 Requests-HTML，HTML Parsing for Humans 鏈接：https://github.com/kennethreitz/requests-html ，顧名思義，它是用於解析 HTML 文檔的。短短兩天項目的 Star 已經超過3000

以前我們寫爬蟲，解析 HTML 頁面通常會選擇 BeautifulSoup 或者是 lxml 庫，雖然 BeautifulSoup 的 API 比較友好，但是它的解析性能低下，而 lxml 使用 xpath 語法，解析速度快，但是代碼沒什麽可讀性，現在 kennethreitz 搞出來的這個 html 解析庫繼承了 requests 庫的優良傳統 —- for humans。

我們知道 requests 只負責網絡請求，但不對響應結果進行解析，你可以把 requests-html 理解為可以解析 html 文檔的 requsts 庫。

Requests-HTML 的代碼量其實非常少，目前不到 200 行，都是基於現有的框架進行二次封裝，使得開發者使用的時候更方便調用。它依賴於 PyQuery、Requests、lxml 等庫。

安裝

pip install requests-html

使用方法

>>> from requests_html import session

# 返回一個Response對象

>>> r = session.get(‘https://python.org/‘)

獲取所有鏈接

>>> r.html.links

{‘/users/membership/‘, ‘/about/gettingstarted/‘}

# 使用css選擇器的方式獲取某個元素

>>> about = r.html.find(‘#about‘)[0]

>>> print(about.text)

About

Applications

Quotes

Getting Started

Help

Python Brochure

另外，還有一個非常吸引人的特點是，它能將html轉換為markdown文本

# 將html轉換為Markdown文本

>>> print(about.markdown)

* [About](/about/)

* [Applications](/about/apps/)

* [Quotes](/about/quotes/)

* [Getting Started](/about/gettingstarted/)

* [Help](/about/help/)

* [Python Brochure](http://brochure.getpython.info/)

其實通過python的學習，小編也體會到了很多，雖然上手容易，可是進階難！作為一個過來人，小編整理了一些學習資料，希望會對個位的學習起到幫助！
有需要的小夥伴可以掃下方微信二維碼，或者直接添加微信號：kele22558！

Python領域最偉大工程師Kenneth Reitz又出來搞事了！

undefined xpath 過來人攝影 containe may strip 但是 -html Python 程序員，特別是做爬蟲的同學都知道 HTTP 請求庫 Requests，Requests 完美體現了 “for Humans” 這個詞要表

Python領域最偉大工程師Kenneth Reitz又出來搞事了！

獲取所有鏈接

Python領域最偉大工程師Kenneth Reitz又出來搞事了！

Python 大神 kennethreitz 又搞事了

Python Web怎麽學，看這篇就夠了！

Python資料分析很難學？60天就夠了！

Android 專案中用得最多最火的第三方框架可能都在這裡了！你有沒有錯過？

#程式設計師又被人黑了！大叔你確定才25歲不是52歲嗎？

手機裡的APP玩膩了?最奇葩好玩的APP可都在這兒了！

程式設計師捅過的婁子，最牛氣的竟然“差點把公司搞黃了”

我的畢設終於搞定了！題為：利用Python開發一款遊戲！

AToken全觀：波場TRX支援TRC10 Token 孫宇晨又要搞事

百度“丘比特”進軍社交了？軟件測試工程師有“三“點要註意了！

Python Community Interview With Kenneth Reitz

Python實現最小均方算法(lms)

【面試題】Python高級開發工程師面試題

【轉】用Python建立最簡單的web服務器

世界上最偉大的十個公式（轉載）

13歲出道,16歲被小紮看中,19歲成臉書最年輕工程師，如今跳槽谷歌只為了.……

Python 普通最小二乘法（OLS）進行多項式擬合

小白學PYTHON時最容易犯的6個錯誤，看看你遇到過幾個

python實現最短路徑問題

Python領域最偉大工程師Kenneth Reitz又出來搞事了！

獲取所有鏈接

相關推薦