1. 程式人生 > >資料提取之xpath

資料提取之xpath

xpath中節點選擇的工具

  • Chrome外掛 XPath Helper
    • 把檔案的字尾名crx改為rar,然後解壓到xpath_....
    • 把解壓後的資料夾拖入到已經開啟開發者模式的chrome瀏覽器擴充套件程式介面
    • 重啟瀏覽器
  • Firefox外掛 XPath Checker

注意: 這些工具是用來學習xpath語法的,他們都是從elements中匹配資料,elements中的資料和url地址對應的響應不相同,所以在程式碼中,不建議使用這些工具進行資料的提取

選取節點

XPath 使用路徑表示式來選取 XML 文件中的節點或者節點集。這些路徑表示式和我們在常規的電腦檔案系統中看到的表示式

非常相似。

使用chrome外掛選擇標籤時候,選中時,選中的標籤會新增屬性class="xh-highlight"

下面列出了最有用的表示式:

表示式 描述
nodename 選中該元素。
/ 從根節點選取、或者是元素和元素間的過渡。
// 從匹配選擇的當前節點選擇文件中的節點,而不考慮它們的位置。
. 選取當前節點。
.. 選取當前節點的父節點。
@ 選取屬性。
text() 選取文字。

選取未知節點

XPath 萬用字元可用來選取未知的 XML 元素。

萬用字元 描述
* 匹配任何元素節點。
@* 匹配任何屬性節點。
node() 匹配任何型別的節點。