jsoup解析xml常用selector

阿新 • • 發佈：2020-08-19

selector可以讓我們篩選自己想要的資料從而提升開發效率

其中 document.select方法會返回一個elements集合我們可以通過在select方法裡面填寫不同的引數來篩選，抽取我們想要的資料然後再處理結果

具體實現步驟:

　　1、匯入jar包

　　2、解析文件

　　　　2.1獲取路徑

　　　　　　Stringpath =className.class.getClassLoader.getResourse("documentName.xml").getPath;

　　　　2.2得到文件

　　　　　　其中一種解析方法:

　　　　　　Document document=Jsoup.parse(new File(path),"utf-8");

　　　　　　其他:

　　　　　　　　Jsoup.parse(String html):解析xml或html的文件物件

　　　　　　　　Jsoup.parse(URL url,int timeoutMillis):通過網路路徑指定的html或xml的文件物件

　　3、使用select方法提供的一系列選擇器來對文件進行對應的操作

　　原始碼:

　　　　xml文件原始碼:

<?xml version='1.0' encoding='utf-8'?>
<students>
    <student id="1" class="man">
        <name>李富貴</name>
        <age>18</age>
        <addr>湖南</addr>
    </student>
    <student id="2">
        <name color="pingk">黃呀冬</name>
        <age>17</age>
        <addr>湘潭</addr>
    </student>
    <student id="3">
        <name color="blue">馬冬梅</name>
        <age>33</age>
        <addr>四川</addr>
    </student>
    <student id="4" class="man">
        <name>袁華</name>
        <age>22</age>
        <addr>南京</addr>
    </student>
    <student id="5"></student>
    <student id="6"></student>
</students>

DocumentUtil類原始碼:

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.select.Evaluator;

import java.io.File;
import java.io.IOException;

public class DocumentUtil {
    public static Document getDocument(String path){
        try {
           return Jsoup.parse(new File(path),"utf-8");
        } catch (IOException e) {
            e.printStackTrace();
        }
        return null;
    }
}

常用selector操作原始碼:

 //獲取student.xml文件路徑
        String  path =Main.class.getClassLoader().getResource("student.xml").getPath();

            //獲取student.xml文件
             Document document= DocumentUtil.getDocument(path);

            //獲取id為2的同學
             Elements stu2 =document.select("#2");
             System.out.println("id為2的同學:\n"+stu2+"\n============================");

             //獲取id為1的同學的姓名(E F    an F element descended from an E element) 獲取e 下面所有的 f
            Elements stu1Name=document.select("#1 name");
            String stu1NameStr=stu1Name.text();
            System.out.println("id為1的同學的姓名:"+stu1NameStr+"\n============================");

            //根據class獲取同學
            Elements mans=document.select(".man");
            System.out.println("class為man的同學:\n"+mans+"\n============================");

　　　　　　//輸出第一個學生
        　　System.out.println(document.select("student:first-child"));

　　　　　　//獲取第二個學生(xx:eq(n)    elements whose sibling index is equal to n) 獲取第n+1個xx元素
        　　System.out.println("第二個學生:\n"+document.select("student:eq(1)"));

　　　　　　//輸出student.xml中含有冬的名字
      　　　System.out.println(document.select("name:contains(冬)").text());

　　　　　　　//輸出屬性有 color的元素 [attr]    elements with an attribute named "attr" (with any value) 屬性名為“attr”的元素(任意值)
        　　System.out.println("屬性有color的元素:\n"+document.select("[color]")+"\n==============================");

        　　//輸出屬性以c開頭的元素
       　　 System.out.println("屬性以co開頭的元素:\n"+document.select("[^co]")+"\n==============================");

        　　//屬性為“color”，值為“blue”的元素
        　　System.out.println("屬性為“color”，值為“blue”的元素:\n"+document.select("[color=blue]")+"\n==============================");

        　　//color屬性的值以p開頭的元素
        　　System.out.println("屬性的值以p開頭的元素:\n"+document.select("[color^=p]")+"\n==============================");

　　　　　　//輸出students所有的name元素
　　　　　　　System.out.println("students下所有的name元素:+\n"+document.select("students name")+"\n=================");

　　　　　　//輸出students直接子類name(包含兒子 不包含孫子)
　　　　　　System.out.println("students直接子類name:\n"+document.select("students>name")+"\n=================");

　　　　　　//輸出所有的name,age元素
　　　　　　System.out.println("所有的name，age元素:\n"+document.select("name,age"));

注意事項:

　　xml文件千萬不要放在中文目錄下

　　如果使用ideaUTF-8 編碼設定,需要設定兩個地方,1， setting　2，otherSetting如果只在setting裡面設定編碼新建專案則容易出現中文亂碼問題因為在setting中只針對於當前　專案

jsoup解析xml常用selector

selector可以讓我們篩選自己想要的資料從而提升開發效率其中 document.select方法會返回一個elements集合我們可以通過在select方法裡面填寫不同的引數來篩選，抽取我們想要的資料然後再處理結果

JavaWeb12.4【XML：Jsoup解析器物件的使用】

1 <?xml version=\"1.0\" encoding=\"UTF-8\" ?> 2 <students> 3<student number=\"itcast_0001\">

JavaWeb12.3【XML：XML解析、Jsoup解析器快速入門】

1 <?xml version=\"1.0\" encoding=\"UTF-8\" ?> 2 <students> 3<student number=\"itcast_0001\">

Python3使用xml.dom.minidom和xml.etree模組兒解析xml檔案封裝函式的方法

總結了一下使用Python對xml檔案的解析，用到的模組兒如下：分別從xml字串和xml檔案轉換為xml物件，然後解析xml內容，查詢指定資訊欄位。

JAVA DOM解析XML檔案過程詳解

這篇文章主要介紹了JAVA DOM解析XML檔案過程詳解,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

python解析xml檔案方式(解析、更新、寫入)

Overview 這篇部落格內容將包括對XML檔案的解析、追加新元素後寫入到XML，以及更新原XML檔案中某結點的值。使用的是python的xml.dom.minidom包，詳情可見其官方文件：xml.dom.minidom官方文件。全文都將圍繞以下的cu

Android實現向本地寫入一個XML檔案和解析XML檔案

在網路儲存過程中有很多時候會遇到XML檔案解析和使用XML儲存一些資訊，解析XML檔案用的比較多的方法是pull解析和SAX解析，但是我一般只用pull解析，下面就向cd卡寫入一個XML檔案，然後再使用pull解析的方法對檔案進行

c++中用TINYXML解析XML檔案

TinyXML介紹最近做一個負載均衡的小專案，需要解析xml配置檔案，用到了TinyXML，感覺使用起來很容易，給出一個使用TinyXML進行XML解析的簡單例子，很多複雜的應用都可以基於本例子的方法來完成。

java解析XML學習總結——SAXReader解析xml檔案資料

第一種方式： 1. 加入jar包注意 1.1 xml檔案解析時編碼要一致（預設UTF-8），出現報錯可以在記事本中另存為來更改編碼格式。

mybatis原始碼配置檔案解析之五：解析mappers標籤（解析XML對映檔案）

在上篇文章中分析了mybatis解析<mappers>標籤，《mybatis原始碼配置檔案解析之五：解析mappers標籤》重點分析瞭如何解析<mappers>標籤中的<package>子標籤的過程。mybatis解析<mappers>標籤

Spring解析Xml註冊Bean流程

有道無術,術可求; 有術無道,止於術; 讀原始碼是一個很枯燥的過程，但是Spring原始碼裡面有很多值得學習的地方

python 解析xml檔案

https://www.cnblogs.com/handsome1013/p/10058838.htmlET.Parser 用法https://www.cnblogs.com/yezuhui/p/6853323.html

java.net.*爬取網頁，Jsoup解析網頁內容

java.net.* 建立網路連線 Jsoup解析網頁內容 package com.sun.util; import java.io.BufferedReader;

sqlserver使用sql解析xml 欄位

當資料庫某一欄位儲存xml 資訊時,我們想獲取xml 中的其中的值時,可以使用兩種方式獲取

Python利用名稱空間解析XML文件

問題你想解析某個XML文件，文件中使用了XML名稱空間。解決方案考慮下面這個使用了名稱空間的文件：

Java 解析XML資料的4種方式

解析的四種方式 DOM 解析 SAX 解析 JDOM 解析 DOM4J 解析案例實操 DOM 解析 DOM（Document Object Model，文件物件模型），在應用程式中，基於 DOM 的 XML 分析器將一個 XML 文件轉換成一個物件模型的集合（通

通過例項解析JavaScript常用排序演算法

氣泡排序氣泡排序是我們在程式設計演算法中，算是比較常用的排序演算法之一，在學習階段，也是最需要接觸理解的演算法，所以我們放在第一個來學習。

sql server解析xml欄位

declare @t nvarchar(max) set @t=\'<ApplicationInfo xmlns:xsd=\"http://www.w3.org/2001/XMLSchema\" xmlns:xsi=\"http://www.w3.org/2001/XMLSchema-instance\">

解析xml檔案利用反射建立物件並給物件賦值

1、先準備model類，我用lombok了，所以getter和setter方法等自動產生 import lombok.Data;

學習Mybatis xml 常用關鍵語法

1.<where>和<if>  <select id=\"queryUserByWhere\" parameterType=\"user\" resultType=\"user\">

jsoup解析xml常用selector

相關推薦