1. 程式人生 > >【轉載儲存】Jsoup解析html常用方法

【轉載儲存】Jsoup解析html常用方法

首先我們要清楚 class的繼承關係

Document 繼承於  Element  繼承於 Node  繼承於 Object

首先 我們先研究一下 Element 中的函式作用:

01 addClass(String className)   --> 新增一個class名字 到這個元素的class屬性上.

02 after(Node node)  --> 將指定的節點新增到當前Element的後面

03 after(String html) --> 指定的html加添到當前Element的後面

04 append(String html) --> 新增這個html到這個元素中

05 appendChild(Node child)  --> 新增一個子節點到這個元素.

06 appendElement(String tagName) --> 建立一個有標籤名的新元素,並新增到最後一個節點.

07 appendText(String text)  --> 建立和新增一個新的文字節點到這個元素.

08 attr(String attributeKey , String attributeValue) 在這個元素中設定一個屬性值.

09 before(Node node) 將此節點新增到當前元素的前面

10 before(String html) 將此html字串新增到當前元素的前面

11 child(int index)  通過索引 定位到子元素.

12 children() 獲取這個元素的所有子孩子

13 className()  獲取這個元素的class屬性的名字

14 classNames() 獲取所有元素的class名字 返回值: Set

15 classNames(Set classNames ) 通過提供的class名字來設定元素的class屬性

16 clone()  克隆

17 data()  獲取這個元素的結合資料

18 elementSiblingIndex()  獲取當前元素在他的兄弟列表中的索引 (返回值是Integer)

19 empty() 移除這個元素的所有孩子資料節點.

20 firstElementSibling() 獲取當前元素 同一級別的第一個兄弟元素.

21 getAllElements() 拿到當前元素下的所有元素 ( 包括 自己 , 孩子 , 孩子的孩子)

22 getElementById(String id)  通過id屬性找到元素

23 getElementsByAttribute(String key)  通過屬性名稱 查詢當前html下的所有元素

24 getElementsByAttributeStarting(String keyPrefix)  查詢當前元素下 , 所有以String 開頭的字串 屬性名稱的所有集合

25 getElementsbyAttributeValue(String key , String value) 通過屬性和屬性值, 獲取所有元素.

26 getElementsByAttributeValueContaining(String key , String match) 通過屬性和屬性值(屬性值可以模糊查詢) 獲取所有元素

27 getElementsByAttributeValueEnding(String key , String end) 通過屬性和屬性值(已String結尾的值) 查詢所有元素

28 getElementsByAttributeValueMatching(String key, Pattern pattern) 通過屬性值得正則表示式來查詢所有元素

29 getElementsByAttributeValueNot(String key, String value) 查詢屬性值不是我們提供的屬性值的所有元素

30 getElementsByAttributeValueStarting(String key, String valuePrefix)  通過查詢已valuePrefix的屬性值開始的所有元素

31 getElementsByClass(String className)  當前元素是否有此class 或者在這個元素下面是否有這個class

32 getElementsByIndexEquals(int index) 查詢當前元素同一級別的元素索引和提供的index相同的元素.

33 getElementsByIndexGreaterThan(int index) 查詢同一級別元素索引大於當前索引的所有元素.

34 getElementsByIndexLessThan(int index)  查詢同一級別元素索引小於當前索引的所有元素.

35 getElementsByTag(String tagName) 查詢當前元素或者當前元素之下的相同標籤的元素.

36 getElementsContainingOwnText(String searchText) 查詢當前元素直接包含的文字內容的元素

37 getElementsContainingText(String searchText) 查詢當前元素包含的文字String

38 getElementsMatchingOwnText(Pattern pattern) 查詢當前元素直接包含的文字的正則表示式

39 getElementsmatchingText(Pattern pattern) 查詢當前元素下 包含文字的正則表示式

40 hasClass(String className)  通過class屬性名字來查詢所有元素

41 boolean   hasText()  測試 當前元素下是否有一些文字

42 html() 檢索檔案內的Html

43 id() 返回當前元素的id值

44 insertChildren(int index , Collection<? extends Node> children)  在元素指定的位置, 插入子孩子

45 isBlock()  測試這個元素是不是層級元素

46 lastElementSibling() 獲取這個元素的同一級別元素的最後一個

47 nextElementSubling() 獲取這個元素的同一級別元素的下一個

48 nodeName() 標籤名字

49 ownText() 獲取到當前元素的文字 , 而不是子孩子的文字

50 parent() 獲取這個節點的父節點

51 prepend(String html)  新增這個html到這個元素

52 parents() 獲取到父節點 ,一直到節點的根節點

53 prependChild(Node child)  新增一個節點到子節點開始位置

54 prependElement(String tarName)  建立一個新的節點 , 並且作為第一個子節點

55 PrependText(String text)  建立和前置一個新的文字節點到這個元素

56 previousElementSibling() 獲取到當前元素的上一個元素

57 removeClass(String className)  把當前元素的class屬性刪除

58 select()  選擇器方法 , 萬能的

59 siblingElements() 獲取所有的兄弟元素(不包含自己)

60 返回值 Tag  tag() 獲取這個標籤物件

61 tagName() 獲取這個標籤的名字

62 tagName(String tagName)  改變這個標籤名字

63 text() 獲取這個元素和所有孩子的文字內容

64 textNodes() 獲取這個元素的孩子文字標籤集合

65 toggleClass(String className)  如果元素有當前引數的 class屬性名 , 刪除它  .如果沒有 新增它

66 val() …

67  wrap()  包裝這個元素的html


作者:動吉
來源:CSDN
原文:https://blog.csdn.net/zhangboy1234/article/details/38893955
版權宣告:本文為博主原創文章,轉載請附上博文連結!