Jsoup文件--提取資料(元素中提取屬性、文字和HTML)
阿新 • • 發佈:2018-12-13
元素中提取屬性、文字和HTML
問題
完成解析文件並找到一些元素後,想要從這些元素中獲取資料。
解決方案
- 獲取屬性值:使用
Node.attr(String key)
方法 - 獲取文字:使用
Element.text()
- 獲取HTML:使用
Element.html()
,或合理使用Node.outerHtml()
String html = "<p>An <a href='http://example.com/'><b>example</b></a> link.</p>"; Document doc = Jsoup.parse(html); Element link = doc.select("a").first(); String text = doc.body().text(); // "An example link" String linkHref = link.attr("href"); // "http://example.com/" String linkText = link.text(); // "example"" String linkOuterH = link.outerHtml(); // "<a href="http://example.com"><b>example</b></a>" String linkInnerH = link.html(); // "<b>example</b>"
描述
上述方法是獲取元素資料的核心方法,還有一些附加的方法:
Element.id()
Element.tagName()
Element.className()
和Element.hasClass(String className)
所有這些訪問資料的方法都提供有相應的setter方法來改變資料。