1. 程式人生 > >java 爬蟲外掛 jsoup 在springboot 下的使用

java 爬蟲外掛 jsoup 在springboot 下的使用

引言:jsoup 在 java 基礎上實現爬取靜態網站資訊是非常方便的,只要明白原理就可以為所欲為了,廢話不多說,上程式碼!

1.先在pom.xml 中引入依賴包 

        <dependency>
            <groupId>org.jsoup</groupId>
            <artifactId>jsoup</artifactId>
            <version>1.10.3</version>
        </dependency>

2.把你要爬的網址放到這裡來,生成一個 document

Document doc = Jsoup.connect(url).get();
// 根據 class 查詢節點
doc.getElementsByClass("class")

// 根據 id 查詢節點
doc.getElementById("id")

// 根據標籤型別,入查詢 <a> 標籤
doc.select("a");

// 獲取 a 標籤中的連結
doc.select("a").attr("href");

懂得這些基本就可以爬取一個簡單的網站了 skr!