Jsoup抓取到頁面A標籤中的href路徑
阿新 • • 發佈:2019-01-10
直接上程式碼,註釋很全乎
public static void main(String[] args)throws Exception{ //抓取的網址 String url = "http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2017/index.html"; //編碼格式的轉換 Document document = Jsoup.parse(new URL(url).openStream(), "GBK", url); //根據class獲取到 頁面的 元素內容 Elements tables = document.getElementsByClass("provincetr"); //根據td標籤來劃分 Elements td = tables.select("td"); for(int j=0;j<td.size();j++){ //獲取到標籤中的內容 String text = td.get(j).text(); System.out.println(text); //獲取A標籤的href 網址 select 獲取到當前A標籤 attr href 獲取到地址 String s = td.get(j).select("a").attr("href"); System.out.println(s); } }
<!-- https://mvnrepository.com/artifact/org.jsoup/jsoup -->
<dependency>
<groupId>org.jsoup</groupId>
<artifactId>jsoup</artifactId>
<version>1.11.3</version>
</dependency>
需要引入以上jar包
也可以去這個網址下載,
輸出的時候會抓到 "" 空字串,大家自己判斷下就好了