1. 程式人生 > >Python如何利用Xpath進行解析

Python如何利用Xpath進行解析

用Python做網路爬蟲的時候,會對網頁的資訊進行提取,筆者接觸的有正則表示式,BeautifulSoup,Xpath,前面兩個都是在國內能夠使用的,而Xpath是Chrome的一個外掛,因此需要“FQ”就可以獲取到。

筆者在這裡提供了Xpath的檔案。

一、安裝Xpath

連結:https://pan.baidu.com/s/1FsAEKWhqEosMNcaXvxXevg
提取碼:y9jv

下載下來後

開啟擴充套件程式,將檔案拖進去就可以了Crtl+Shift+X就可以開啟Xpath

二、使用Xpath

匯入lxml和etree

1     mytree = lxml.etree.HTML(content)
2 # 獲取電影的基本資訊: 3 name = mytree.xpath('*//div[@class="movie-brief-container"]//h3[@class="name"]//text()')

通過上述方法,就可以建立Xpath的查詢。

三、Xpath的解析方法

  在使用Xpath進行解析的時候,需要對它進行解析,這裡附上一些解析的介紹,可以根據他的提示來寫Xpath語句

  https://blog.csdn.net/uvyoaa/article/details/80998271

 https://blog.csdn.net/qq_41338249/article/details/81029717


  基本解析方式都一樣抓住要點。