python xpath 獲取指定頁面中指定區域的html代碼

阿新 • • 發佈：2018-10-12

pytho sts clas xpath nbsp install .get element XML

　　最近一個朋友問我怎麽把一個指定區域的內容轉成pdf，網上查了一下python裏面有個wkhtmltopdf模塊可以將str、file、url轉成pdf，我們今天不聊怎麽轉PDF，聊聊怎麽獲取頁面中指定區域的html源碼。用到的模塊是lxml和requests這兩個模塊，沒有裝的小夥伴可以裝一下 pip install lxml requests

主要思想是利用xpath獲取到指定區域的Element對象，然後再將Element對象傳給etree.tostring()，即可得到指定區域的html代碼，看一下需求:

　　　　1、我們要得到 http://www.w3school.com.cn/ w3c首頁中的這個位置的html代碼：

　　　　　　技術分享圖片

　　　　　看一下頁面源碼是這樣的

　　　　　　　　　技術分享圖片

　　　2、下面開始編碼：　　　　

1 from lxml import etree
2 import requests
3 
4 res=requests.get(‘http://www.w3school.com.cn/‘)
5 tree=etree.HTML(res.content)
6 div=tree.xpath(‘//div[@id="d1"]‘)[0]
7 div_str=etree.tostring(div,encoding=‘utf-8‘)
8 print div_str

3、結果如下：

　　　　技術分享圖片

4、成功獲取到了指定區域的html代碼。

python xpath 獲取指定頁面中指定區域的html代碼

pytho sts clas xpath nbsp install .get element XML 　　最近一個朋友問我怎麽把一個指定區域的內容轉成pdf，網上查了一下python裏面有個wkhtmltopdf模塊可以將str、file、url轉成pdf，我們今天不聊

python xpath 獲取指定頁面中指定區域的html代碼

python xpath 獲取指定頁面中指定區域的html代碼

js中嵌入jsp(html)代碼的雙引號轉換問題--事件沒反應

vue專案列印頁面中指定區域的內容

python刪除字符串中指定字符

js 獲取url字串中指定引數值

C# 如何獲取SQL Server 中指定資料表的所有欄位名和欄位型別

Python爬蟲獲取貼吧中的郵箱

指定字串中指定部分進行反轉 abcdefg-->abcgfed

python實現獲取檔案列表中每個檔案關鍵字

jq、js獲取一個頁面中的ajax資料，傳到另一個頁面顯示(通過url傳參方式)

Angular 利用路由跳轉到指定頁面的指定位置

在servlet中獲取jsp頁面中選中的複選框的值，並對其值進行操作。

C# 獲取aspx頁面中所有隱藏控制元件的兩種方法

js獲取jsp頁面中嵌入的java程式碼中的變數

獲取java中當前運行代碼類名，行號，方法名

web頁面中http返回的狀態碼解釋

c# mvc 在控制器中動態解析cshtml文件並獲取對應的html代碼

java調用Linux執行Python爬蟲，並將數據存儲到elasticsearch中--（java後臺代碼）

《FlaskWeb開發基於Python的Web應用開發實戰第2版》中英PDF+源代碼等4本書學習

《python計算機視覺編程》高清中英PDF+源代碼+數據 Learn together

python xpath 獲取指定頁面中指定區域的html代碼

相關推薦