Jsoup對HTML的基本處理【提取資訊】【個人筆記】
阿新 • • 發佈:2019-02-08
- 從一個URL獲取HTML
Document document1 = Jsoup.connect("https://www.baidu.com").get();
- 獲取標題
Document document1 = Jsoup.connect("https://www.baidu.com").get(); document1.title();
- 獲取整個網頁文字
Document document1 = Jsoup.connect("https://www.baidu.com").get(); document1.text();
- 獲取網頁編碼
Document document1 = Jsoup.connect("https://www.baidu.com").get(); document1.charset();
- 根據標籤名獲取節點
Elements elements = document.getElementsByTag("a");//獲取所有a標籤
- 根據標籤屬性名稱獲取屬性值
element.attr("href");