以獲取網上某篇文章的標題為例,介紹Jsoup常用的四種選擇器
阿新 • • 發佈:2018-12-26
jsoup常用的四種選擇器
第一種選擇方式:通過節點名稱以及class來屬性來進行選擇
第二種選擇方式:通過節點id來進行選擇
第三種方式:通過文件節點順序來進行選擇
第四種方式:通過谷歌瀏覽器來進行幫助選擇
public void getNewsTitle() throws Exception { // 通過呼叫parse方法,傳遞url就可以解析網頁內容 // 請求網站,獲取網頁內容,封裝成Document 物件 Document document = Jsoup.parse(new URL("http://news.163.com/17/1114/07/D36G5U1D0001875P.html"), 50000); // 第一種方式,通過節點名稱或者class屬性來進行選擇 // 通過select方法,告訴我們的document按照什麼方式去查詢 Elements select = document.select("h1"); // 通過節點名稱來進行查詢 System.out.println(select.toString()); // 通過class屬性來進行選擇 Elements select2 = document.select(".post_content_main"); Elements select3 = select2.select("h1"); System.out.println(select3.toString()); // 一步到位,通過 > 繼續往下選擇 Elements select4 = document.select("div.post_content_main > h1"); System.out.println(select4.toString()); // 第二種方式:通過節點的id來進行選擇 Elements select5 = document.select("#epContentLeft > h1"); // 獲取文字內容,去掉標籤 String text1 = select5.text(); System.out.println(text1); // 第三種方式選擇:通過節點的順序來進行選擇 Elements select6 = document .select("body > div.post_header > div.post_content.post_area.clearfix > div.post_content_main >h1"); String text2 = select6.text(); System.out.println(text2); // 第四種選擇方式,通過谷歌瀏覽器幫助選擇 Elements select7 = document.select("#epContentLeft > h1"); String text3 = select7.text(); System.out.println(text3); System.out.println(select3.toString()); }