java爬蟲：jsoup的簡單案例

阿新 • • 發佈：2019-01-31

package jsoup;

import java.io.IOException;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

//jsoup跟JavaScript有些類似，主要用於爬取靜態的網頁。需要自己下載一個jar包jsoup-1.8.1.jar
public class GetLinks {

public static void getLinks(String url) {

try {

//此處使用迴圈來遍歷連結(如果存在多個連結的話)

for(int h=1;h<=8;h++){

//對連結進行拼接(格式需要自己重新定義，每個網站的格式都不相同)

//此處timeout設定了延遲，減少被網站識別爬蟲的機率

Document doc = Jsoup.connect(url+"o"+h+"/")
.timeout(14000)
.get();
//此處需要自己填寫網頁中標籤對應的id屬性值
Element content = doc.getElementById("id屬性值");

//用於儲存連結
String linkHref="";
//獲取連結(因為連結是多個所以使用"Elements")
Elements links=content.getElementsByTag("a");

for(int i=0;i<links.size();i++){

//獲取連結的全稱

linkHref = links.get(i).attr("abs:href");

//對獲取的連結進行一些簡單的操作

if(linkHref.indexOf("gongsi")==-1)
System.out.println(linkHref)；
}
}
}
} catch (IOException e) {
e.printStackTrace();
}
}
//主程式main

public static void main(String[] args) {

//需要自己填寫一個url地址

String first="";
getLinks(first);
}
}

java爬蟲：jsoup的簡單案例

java爬蟲：jsoup的簡單案例

簡單地學習Java爬蟲->使用Jsoup

java爬蟲入門jsoup 框架

flask學習：一個簡單案例綜合之前學到的知識

java併發：CopyOnWriteArrayList簡單理解

java爬蟲中jsoup的使用

[Java爬蟲] 使用 Jsoup + HttpClient 爬取網頁圖片

java爬蟲（Jsoup）爬取某站點評論

[筆記]python網路爬蟲：一個簡單的定向爬取大學排名資訊示例

Java爬蟲初體驗:簡單抓取IT之家熱評(整合Spring Boot+Elasticsearch+Redis+Mybatis)

Java 爬蟲工具Jsoup解析

java 爬蟲外掛 jsoup 在springboot 下的使用

一個java使用redis的簡單案例

java爬蟲--jsoup簡單的表單抓取案例

java爬蟲Jsoup簡單學習

Java爬蟲專案實戰案例四之Jsoup使用

Java爬蟲學習:利用HttpClient和Jsoup庫實現簡單的Java爬蟲程式

Java爬蟲-使用HttpClient+Jsoup實現簡單的爬蟲爬取文字

網路採集器Demo：Jsoup+Java多執行緒實現[爬蟲]（上）

Java爬蟲實踐：Jsoup+HttpUnit爬取今日頭條、網易、搜狐、鳳凰新聞

java爬蟲：jsoup的簡單案例

相關推薦