java 爬蟲外掛 jsoup 在springboot 下的使用
阿新 • • 發佈:2019-02-20
引言:jsoup 在 java 基礎上實現爬取靜態網站資訊是非常方便的,只要明白原理就可以為所欲為了,廢話不多說,上程式碼!
1.先在pom.xml 中引入依賴包
<dependency>
<groupId>org.jsoup</groupId>
<artifactId>jsoup</artifactId>
<version>1.10.3</version>
</dependency>
2.把你要爬的網址放到這裡來,生成一個 document
Document doc = Jsoup.connect(url).get();
// 根據 class 查詢節點
doc.getElementsByClass("class")
// 根據 id 查詢節點
doc.getElementById("id")
// 根據標籤型別,入查詢 <a> 標籤
doc.select("a");
// 獲取 a 標籤中的連結
doc.select("a").attr("href");
懂得這些基本就可以爬取一個簡單的網站了 skr!