xpath語法總結
阿新 • • 發佈:2019-01-08
最近再看爬蟲,用到了xpath提取內容,接下來記錄一下xpath語法:
1 ‘/’ 從根節點選取。
假如路徑起始於正斜槓( / ),則此路徑始終代表到某元素的絕對路徑!
2 // 從匹配選擇的當前節點選擇文件中的節點,而不考慮它們的位置。
也就是說以//開頭的不會考慮這個元素在那個位置,在任何位置都可以匹配到
3 . 選取當前節點。
4 .. 選取當前節點的父節點。
5 @ 選取屬性。
/book/@title 代表的是book下title元素的值
6 星號*表示選擇所有由星號之前路徑所定位的元素
比如:/book/title/* 代表的是在title下的所有元素都匹配
/* /* /* 代表的是有兩個父節點的任意元素
@*表示匹配任何屬性節點。
//title[@*]表示選取所有帶有屬性的 title 元素。
//BBB[not(@*)],選擇所有沒有屬性的BBB節點
7 /AAA/BBB[1]代表選擇AAA的第一個BBB元素
/AAA/BBB[last()]一看就懂
/bookstore/book[last()-1]一看就懂
/bookstore/book[price>35.00]
/bookstore/book[price>35.00]/title代表的是選擇bookstore中book元素大於35下的title元素
8 通過在路徑表示式中使用“|”運算子,可以選取若干個路徑。
//title | //price 表示選擇文件中的所有title或者price元素
——————————–end