資料提取之xpath
阿新 • • 發佈:2019-01-08
xpath中節點選擇的工具
- Chrome外掛 XPath Helper
- 把檔案的字尾名crx改為rar,然後解壓到xpath_....
- 把解壓後的資料夾拖入到已經開啟開發者模式的chrome瀏覽器擴充套件程式介面
- 重啟瀏覽器
- Firefox外掛 XPath Checker
注意: 這些工具是用來學習xpath語法的,他們都是從elements中匹配資料,elements中的資料和url地址對應的響應不相同,所以在程式碼中,不建議使用這些工具進行資料的提取
選取節點
XPath 使用路徑表示式來選取 XML 文件中的節點或者節點集。這些路徑表示式和我們在常規的電腦檔案系統中看到的表示式
使用chrome外掛選擇標籤時候,選中時,選中的標籤會新增屬性class="xh-highlight"
下面列出了最有用的表示式:
表示式 | 描述 |
---|---|
nodename | 選中該元素。 |
/ | 從根節點選取、或者是元素和元素間的過渡。 |
// | 從匹配選擇的當前節點選擇文件中的節點,而不考慮它們的位置。 |
. | 選取當前節點。 |
.. | 選取當前節點的父節點。 |
@ | 選取屬性。 |
text() | 選取文字。 |
選取未知節點
XPath 萬用字元可用來選取未知的 XML 元素。
萬用字元 | 描述 |
---|---|
* | 匹配任何元素節點。 |
@* | 匹配任何屬性節點。 |
node() | 匹配任何型別的節點。 |