Python如何利用Xpath進行解析
阿新 • • 發佈:2019-01-12
用Python做網路爬蟲的時候,會對網頁的資訊進行提取,筆者接觸的有正則表示式,BeautifulSoup,Xpath,前面兩個都是在國內能夠使用的,而Xpath是Chrome的一個外掛,因此需要“FQ”就可以獲取到。
筆者在這裡提供了Xpath的檔案。
一、安裝Xpath
連結:https://pan.baidu.com/s/1FsAEKWhqEosMNcaXvxXevg
提取碼:y9jv
開啟擴充套件程式,將檔案拖進去就可以了Crtl+Shift+X就可以開啟Xpath
二、使用Xpath
匯入lxml和etree
1 mytree = lxml.etree.HTML(content)2 # 獲取電影的基本資訊: 3 name = mytree.xpath('*//div[@class="movie-brief-container"]//h3[@class="name"]//text()')
通過上述方法,就可以建立Xpath的查詢。
三、Xpath的解析方法
在使用Xpath進行解析的時候,需要對它進行解析,這裡附上一些解析的介紹,可以根據他的提示來寫Xpath語句
https://blog.csdn.net/uvyoaa/article/details/80998271
https://blog.csdn.net/qq_41338249/article/details/81029717
基本解析方式都一樣抓住要點。