Java中用爬蟲進行解析的例項方法

阿新 • • 發佈：2020-12-25

我們都知道可以用爬蟲來找尋一些想要的資料，除了可以使用python進行操作，我們最近學習的java同樣也支援爬蟲的執行，本篇小編就教大家用java爬蟲來進行網頁的解析，具體內容請往下看：

1、springboot專案，引入jsoup

<dependency>
<groupId>org.jsoup</groupId>
<artifactId>jsoup</artifactId>
<version>1.10.2</version>
</dependency>

2、準備解析物件

Content.java
package com.asia.pojo;
import lombok.AllArgsConstructor;
import lombok.Data;
import lombok.NoArgsConstructor;
@Data
@NoArgsConstructor
@AllArgsConstructor
public class Content {
 private String title;
 private String img;
 private String price;
}

3、爬蟲工具類

HtmlParseUtil.java
package com.asia.utils;
import java.net.URL;
import java.net.URLDecoder;
import java.util.ArrayList;
import java.util.List;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import com.asia.pojo.Content;
public class HtmlParseUtil {
public static void main(String[] args) throws Exception {
new HtmlParseUtil().parseJD("西瓜").forEach(System.out::println);
}
public List<Content> parseJD(String keywords) throws Exception {
String url = "https://search.jd.com/Search?keyword=" + URLDecoder.decode(keywords,"GBK");
// 解析網頁.（Jsoup返回Document就是瀏覽器的Document物件）
Document document = Jsoup.parse((new URL(url)),30000);
Element element = document.getElementById("J_goodsList");
Elements elements = element.getElementsByTag("li");
List<Content> list = new ArrayList<Content>();
for (Element el : elements) {
String src = el.getElementsByTag("img").eq(0).attr("data-lazy-img");
String price = el.getElementsByClass("p-price").eq(0).text();
String name = el.getElementsByClass("p-name").eq(0).text();
list.add(new Content(name,src,price));
}
return list;
}
}

到此這篇關於Java中用爬蟲進行解析的例項方法的文章就介紹到這了,更多相關Java中如何使用爬蟲進行解析內容請搜尋我們以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援我們！

Java中用爬蟲進行解析的例項方法

我們都知道可以用爬蟲來找尋一些想要的資料，除了可以使用python進行操作，我們最近學習的java同樣也支援爬蟲的執行，本篇小編就教大家用java爬蟲來進行網頁的解析，具體內容請往下看：

python爬蟲beautifulsoup解析html方法

用BeautifulSoup 解析html和xml字串例項： #!/usr/bin/python # -*- coding: UTF-8 -*- from bs4 import BeautifulSoup

Java多執行緒狀態及方法例項解析

這篇文章主要介紹了Java多執行緒狀態及方法例項解析,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

通過例項解析Java分散式鎖三種實現方法

分散式鎖三種實現方式：一，基於資料庫實現分散式鎖 1. 悲觀鎖利用select … where … for update 排他鎖

Java lock同步鎖使用例項解析

這篇文章主要介紹了Java lock同步鎖使用例項解析,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

java常用資料流應用例項解析

這篇文章主要介紹了java常用資料流應用例項解析,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

java判斷字串包含某個字元的例項方法

java判斷字串是否包含某個字元的方法：一、contains方法 1：描述 java.lang.String.contains() 方法返回true，當且僅當此字串包含指定的char值序列

Java執行緒死鎖例項及解決方法

這篇文章主要介紹了Java執行緒死鎖例項及解決方法,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

Java HashMap兩種簡便排序方法解析

這篇文章主要介紹了Java HashMap兩種簡便排序方法解析,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

python建構函式init例項方法解析

這篇文章主要介紹了python建構函式init例項方法解析,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

Java執行緒池ForkJoinPool例項解析

這篇文章主要介紹了Java執行緒池ForkJoinPool例項解析,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

java中物件呼叫成員變數與成員例項方法

使用物件訪問類中的成員：物件名.成員變數；物件名.成員方法(); 成員變數的預設值：

java判斷class子類或父類的例項方法

我們首先看程式碼： Class c = ArrayList.class; c.isPrimitive(); //判斷c是否為基本資料型別

Java switch使用原理及例項解析

這篇文章主要介紹了Java switch使用及例項解析,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

Java類庫BeanUtils元件使用方法及例項詳解

BeanUtils BeanUtils是Apache commens元件裡面的成員，由Apache提供的一套開源api，用於簡化對javaBean的操作，能夠對基本型別自動轉換。

Java System類兩個常用方法程式碼例項

1.System.currentTimeMills()：得到當前時間距離時間原點的毫秒數，返回值是Long型別的整數。

Java 動態生成類和例項, 並注入方法操作示例

本文例項講述了Java 動態生成類和例項,並注入方法。分享給大家供大家參考，具體如下：

JAVA swing佈局管理器例項解析

元件在容器（比如Jframe）中的位置和大小是由佈局管理器來決定的。所有的容器都會使用一個佈局管理器，通過它來自動進行元件的佈局管理。

java將String字串轉換為List<Long>型別例項方法

在一些應用場景當中，我們可能會遇到以下的場景，我們要使用的型別是List型別，但是接收到的引數是Stirng型別如1,2,3,4等這樣的形式

Java Spring專案國際化(i18n)詳細方法與例項

Spring國際化概述國際化基本規則國際化資訊”也稱為“本地化資訊”，一般需要兩個條件才可以確定一個特定型別的本地化資訊，它們分別是“語言型別”和“國家/地區的型別”。如中文字地化資訊既有中國大陸地區的中文