XML可擴展標記語言

阿新 • • 發佈：2017-12-14

xml dom4j解析 sax解析 xmlpull解析

一、XML可擴展標記語言

1、概念：

XML推出初衷是為了替換HTML，標簽名可以直接定義，不能用數字開頭不能使用純數字區分大小寫，後用做配置文件封裝數據

因為xml具有良好的格式，所以用途非常廣泛，比如持久化存儲數據數據交換數據配置

xml和html的區別：

1)html的標簽是固定的，不能擴展。xml的標簽是不固定的，可擴展的。

2)html側重於顯示的信息。xml側重於標識信息的結構。

3)html是不區分大小寫的。xml是區分大小寫的。xml的語法比html更嚴謹。

2、組成部分

文檔聲明：<?xml version="1.0" encoding="utf-8"?>

必須頂行頂格寫

根標簽：有且僅有一個根標簽

其他標簽：有開始標簽一定要有結束標簽

標簽屬性：一個標簽可以有多個屬性，每個屬性都有它自己的名稱和取值，例如：<Student name="text">

註解： //Comment註釋對象

標簽裏的內容 egg張三：<name>張三</name>

XML標簽中出現的所有空格和換行，XML解析程序都會當作標簽內容進行處理

3、解析思想

DOM解析思想：Document Object Model 文檔對象模型(dom4j解析)

將文檔一次性加載進內存然後將文檔各個組成部分抽取為對象

優點：能夠對文檔進行增刪改查

缺點：耗內存適用於PC端

SAX解析思想：基於事件逐行解析，一次讀取一行，釋放一行(sax解析、pull解析)

優點：不占內存適用於移動端

缺點：只能查不能增刪改

二、dom4j解析

讀取xml文件步驟：

1、導入DOM4J jar包

2、創建解析器對象

SAXReader reader = new SAXReader();

Document doc = reader.read(new FileInputStream("xml文件名.xml"));

3、獲取根標簽對象

Element rootElement = doc.getRootElement();

1) rootElement.node(第幾個節點);//獲取單個節點對象

獲取根標簽下的子節點(不能獲取孫子節點)，空白地方也算一個子節點對象

rootElement.nodeIterator();//獲取多個節點對象

2) rootElement.element("標簽名");//獲取第一個子標簽對象

rootElement.elements();//獲取所有的子標簽對象

rootElement.elementIterator();//通過叠代器的方式獲取所有的子標簽對象

4、獲取標簽屬性對象

Element element = rootElement.element("標簽名");

Attribute attribute = element.attribute(第幾個屬性/"屬性名");

attribute.getName();//獲取屬性的鍵

attribute.getValue();//獲取屬性的值

//element.attributes();獲取所有的屬性對象

//element.attributeIterator();通過叠代器的方式獲取所有的屬性對象

//element.attributeValue(第幾個屬性/"屬性名");直接獲取屬性對象的值

5、獲取標簽內文本

List<Element> list = element.elements();

for(Element ele:list){

String text = ele.getText();//獲取文本內容

System.out.println(text);

}

用代碼寫xml文件步驟：

導入DOM4J jar包

//通過文檔幫助類create doc
		Document doc = DocumentHelper.createDocument();
		
		//添加一個根標簽
		Element rootEle = doc.addElement("students");
		//添加一個子標簽
		Element ele = rootEle.addElement("student");
		//給student標簽添加一個屬性
		ele.addAttribute("id", "9527");
		//給student添加一個名字和學號標簽及內容
		Element element1 = ele.addElement("sname");
		element1.addText("張三");
		Element element2 = ele.addElement("sid");
		element2.addText("007");
		
		//把內存中doc 寫到硬盤上
		OutputFormat format1 = OutputFormat.createCompactFormat();
		OutputFormat format2 = OutputFormat.createPrettyPrint(); //漂亮的格式
		// 在開發階段 利於我們調試 可以使用漂亮的格式
		// 項目開發好之後上線，我們要調整成緊湊格式 減小xml文件的體積
		XMLWriter writer = new XMLWriter(new FileOutputStream("mydoc.xml"), format2);
		writer.write(doc);
		writer.close();

用代碼修改xml文件步驟：

//找到你想修改的節點

1)修改屬性的值

attribute.setValue("新屬性值");

2)修改文本

element.setText("新文本");

3)刪除標簽、屬性

element.detach();

attribute.detach();

// 重新寫入到硬盤覆蓋掉原文件

XMLWriter xmlWriter = new XMLWriter(new FileOutputStream("xml文件名.xml"));

xmlWriter.write(doc);

xmlWriter.close();

附：XPath:主要是用於xml快速獲取所需的節點對象

1、導入Dom4j 的jar包和支持xPath技術的jar包

2、使用xpath方法：

List<Node> list = rootElement.selectNodes("xpath表達式"); 查詢多個節點對象

Node nade = rootElement.selectSingleNode("xpath表達式"); 查詢一個節點對象

3、xpath表達式

/ 絕對路徑選擇該標簽下子標簽

// 相對路徑該標簽下所有標簽，表示不分任何層次結構的選擇元素。

* 通配符表示匹配所有元素

[] 條件表示選擇什麽條件下的元素

@ 屬性表示選擇屬性節點,定位一個屬性名

and 關系表示條件的與關系（等價於&&）

not() 取反

text() 文本表示選擇文本內容

egg：String path = "//user[@id='2']/name"; //選出所有user標簽中id="2"的user標簽下的name標簽

三、sax解析

sax解析有兩個部分，解析器和事件處理器

解析器就是XMLReader接口，負責讀取XML文檔，和向事件處理器發送事件(也是事件源)

事件處理器ContentHandler接口，負責對發送的事件響應和進行XML文檔處理

為了簡化開發提供了ContentHandler的實現類DefaultHandler類

//事件處理器

public class MyContentHandler extends DefaultHandler{
			//文檔解析開始時調用，該方法只會調用一次
			@Override
			public void startDocument() throws SAXException {
				super.startDocument();
			}
			//標簽開始時調用
			@Override
			public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
				 //uri：xml文檔的命名空間(用不到)
				 //localName：標簽的名字(用不到)
				 //qName：帶命名空間的標簽的名字(使用標簽名用這個)
				 // attributes：標簽的屬性集
				super.startElement(uri, localName, qName, attributes);
			}
			//解析標簽的內容的時候調用
			@Override
			public void characters(char[] ch, int start, int length) throws SAXException {
				//ch：當前讀取到的TextNode(文本節點)的字節數組
				//start：字節開始的位置，為0則讀取全部
				//length：當前TextNode的長度 
				super.characters(ch, start, length);
			}
			//標簽結束時調用
			@Override
			public void endElement(String uri, String localName, String qName) throws SAXException {
				super.endElement(uri, localName, qName);
			}
			//文檔解析結束後調用，該方法只會調用一次
			@Override
			public void endDocument() throws SAXException {
				super.endDocument();
			}
		}

//解析器

//獲取解析器工廠對象，從而獲取解析器對象

SAXParserFactory factory = SAXParserFactory.newInstance();

SAXParser parser = factory.newSAXParser();

//使用指定的DefaultHandler解析指定文件

parser.parse(new File("文件名.xml"), new MyContentHandler());

四、pull解析

Xmlpull比Sax更簡明，而且不需要掃描完整個流

步驟：

//導入kxml2-2.3.0.jar xmlpull_1_1_3_4c.jar第三方jar包

//獲取解析器工廠對象，從而獲取解析器對象
	XmlPullParserFactory factory = XmlPullParserFactory.newInstance();
	XmlPullParser parser = factory.newPullParser();
	//關聯xml文件	
	parser.setInput(new FileInputStream("文件名.xml"), "utf-8");
	//獲取事件類型
	int type = parser.getEventType();
		//XmlPullParser.START_DOCUMENT;	文檔開始事件0
		//XmlPullParser.END_DOCUMENT;	文檔結束事件1
		//XmlPullParser.START_TAG; 	開始標簽事件2
		//XmlPullParser.END_TAG; 	結束標簽事件3
		//XmlPullParser.TEXT;	代表文本4
	while (type != XmlPullParser.END_DOCUMENT) {
		String tagName = parser.getName();
		switch (type) {
			case XmlPullParser.START_TAG:
				if("標簽名".equals(tagName)){
					//操作（javabean）
				}else if("標簽名".equals(tagName)){
					//...
				}
				break;
			case XmlPullParser.END_TAG:
				if("標簽名".equals(tagName)){
					//操作（add）
				}
				break;
		}
		//讓指針跳到下一行，重新給type賦值，不然就會死循環
		type = parser.next()
	}
	//把內存中的數據序列化到硬盤上去永久保存
	//獲取解析器工廠對象，從而獲取序列化器
	XmlPullParserFactory factory = XmlPullParserFactory.newInstance();
	XmlSerializer serializer = factory.newSerializer();
	//設置輸出流關聯xml文件
	serializer.setOutput(new FileOutputStream("文件名.xml"), "utf-8");
	//寫入文檔聲明（文檔開始）
	serializer.startDocument("utf-8", true);//參數二：文檔是否獨立
	//寫入開始根標簽
	serializer.startTag(null, "students");//參數1 命名空間一般給null 參數2 標簽名稱
	//寫入根標簽的子標簽student開始標簽
	serializer.startTag(null, "student");
	serializer.attribute(null, "id", "id值");//寫入屬性
	//寫入student標簽的子標簽name開始標簽
	serializer.startTag(null, "name");
	//寫入name標簽內文本
	serializer.text("文本內容");
	//寫入name結束標簽
	serializer.endTag(null, "name");
	//同樣方法寫student標簽的子標簽age
	//寫入student結束標簽
	serializer.endTag(null, "student");
	//同樣方法寫多個student，一般使用循環
	//寫入結束根標簽
	serializer.endTag(null, "students");
	//文檔結束
	serializer.endDocument();

XML可擴展標記語言

xml dom4j解析 sax解析 xmlpull解析一、XML可擴展標記語言 1、概念： XML推出初衷是為了替換HTML，標簽名可以直接定義，不能用數字開頭不能使用純數字區分大小寫，後用做配置文件封裝數據因為xml具有良好的格式，所以用途非常廣泛，比如持久化存儲數據數據交換

可擴展標記語言XML（淅淅瀝瀝的小雨）

ogr 部分 cti AD 標簽引入 throws jdom 官方 XML簡述　　XML用於描述數據，是當前處理結構化文檔信息的有力工具。與操作系統編程語言的開發平臺無關，可以實現不同系統之間的數據交互。　　xml文件結構： 1 <?xml version="

15套java架構師、集群、高可用、高可擴展、高性能、高並發、性能優化、Spring boot、Redis、ActiveMQ、Nginx、Mycat、Netty、Jvm大型分布式項目實戰視頻教程

mycat 擴展並發解決方案入門到 -1 高端資料 src nio * { font-family: "Microsoft YaHei" !important } h1 { background-color: #006; color: #FF0 } 15套java

java架構師課程、性能調優、高並發、tomcat負載均衡、大型電商項目實戰、高可用、高可擴展、數據庫架構設計、Solr集群與應用、分布式實戰、主從復制、高可用集群、大數據

慢查詢主從復制難題 jms 整合大數數據庫設計企業級 nginx網站 15套Java架構師詳情 * { font-family: "Microsoft YaHei" !important } h1 { background-color: #006; color:

Spring可擴展Schema標簽

details spring http -c a標簽 .net 無法找到 ber cau 基於Spring可擴展Schema提供自己定義配置支持 http://blog.csdn.net/cutesource/article/details/5864562

15套java架構師、高並發、集群、高可用、高可擴展、高性能、性能優化Redis、ActiveMQ、Mycat、Netty、Jvm

高並發集群分布式多線程項目實戰 15套Java架構師詳情15套java架構師、集群、高可用、高可擴展、高性能、高並發、性能優化、Spring boot、Redis、ActiveMQ、Nginx、Mycat、Netty、Jvm大型分布式項目實戰視頻教程視頻課程包含：高級Java架構

英特爾發布至強可擴展處理器，業界十年來技術最大進步（核心思想：數據洪流出現）

strong 中心結合的人目的表示 png 高度最終集微網 7月12日報道今天，英特爾公司在北京正式發布了至強可擴展處理器。該處理器可為計算、網絡和存儲帶來針對工作負載優化的性能，向下一代雲基礎設施提供堅實基礎，並賦能數據分析、人工智能、高性能計算、網絡轉型等各

Amazon DynamoDB, 面向互聯網應用的高性能、可擴展的NoSQL數據庫

單個相對分布式系統強一致性數據集 osql 搭建 dynamodb ngs DynamoDB是一款全面托管的NoSQL數據庫服務。客戶能夠很easy地使用DynamoDB的服務。同一時候享受到高性能，海量擴展性和數據的持久性保護。 DynamoDB數據

高性能可擴展的python自動化運維框架

互聯網計算機語言遇到瓶頸：1、一直在用Python寫各種腳本，想做自動化運維平臺卻有心無力，沒有見過大的運維平臺怎麽做，2、自己寫的腳本在大的場景下是否靠譜，每當討論說一些基於ssh獲取數據執行操作的方式都會被鄙視。茅塞頓開：迷茫大半年找不到方向，最近在reboot系統學習了下，收獲很多，很多疑惑

高性能可擴展MySQL數據庫設計及架構優化電商項目_1

電商一數據庫設計規範1 命名規範所有數據庫對象名稱必須用小寫字母並下劃線分割對象名稱禁止使用MySQL保留關鍵字命名要做到見名識義，不超過32字節臨時表必須tmp前綴日期後綴備份庫表bak前綴日期後綴所有存儲相同數據的列名和類型必須一致2 數據庫基本設計規範所有表必須用innodb引擎數據庫和表字符集

菜鳥的Xamarin.Forms前行之路——按鈕的按下擡起事件的監控(可擴展至其他事件)

override 點擊 names div prot tco nco nbsp 容易提問:監控按鈕的點擊事件,可以通過按鈕的Click事件,或者Command綁定,那麽如何監控按鈕的按下與擡起,或者移動,長按,雙擊等事件? 解決方法:各個平臺自定義渲染依賴註入. 共享項目

菜鳥的Xamarin.Forms前行之路——實現按鈕的字體圖標(可擴展)

方法所有 blank render 背景圖片 list cer 元素 ren 在實際的APP中,帶有圖標的按鈕用到地方還是蠻多的,字體圖標往往能更快更生動的傳達信息,並且相對於背景圖片,字體圖標也有著絕對的優勢,所以實現按鈕的字體圖標是值得嘗試的. 實現方法:各平臺自定義

C#可擴展編程之MEF學習筆記（一）：MEF簡介及簡單的Demo（轉）

com ring this exec hosting code .cn 引用展開在文章開始之前，首先簡單介紹一下什麽是MEF，MEF,全稱Managed Extensibility Framework（托管可擴展框架）。單從名字我們不難發現：MEF是專門致力於解決擴展性

C#可擴展編程之MEF學習筆記（三）：導出類的方法和屬性（轉）

學習說了如何 mod ati dem ont num imp 前面說完了導入和導出的幾種方法，如果大家細心的話會註意到前面我們導出的都是類，那麽方法和屬性能不能導出呢？？？答案是肯定的，下面就來說下MEF是如何導出方法和屬性的。　　還是前面的代碼，第二篇中已經提供了下

讓我為你介紹一個神器：Chimee，一套可擴展的 H5 視頻播放器解決方案

包括 api 人員保持打包需求解耦日常開發 Chimee（讀“奇米”, [t??‘m?:]）是由奇舞團開源的一套 H5 視頻播放器解決方案，由奇舞團視頻雲前端團隊結合在業務和視頻編解碼方向的沈澱積累傾心打造。 Chimee 支持 MP4、M3U8、FLV 等

Effective Java 第三版——38. 使用接口模擬可擴展的枚舉

rem 第一時間輔助類 [] 接口類 img IT 基本類 value Tips 《Effective Java, Third Edition》一書英文版已經出版，這本書的第二版想必很多人都讀過，號稱Java四大名著之一，不過第二版2009年出版，到現在已經將近8年的時

聊聊Dubbo - Dubbo可擴展機制實戰

Java摘要：在Dubbo的官網上，Dubbo描述自己是一個高性能的RPC框架。今天我想聊聊Dubbo的另一個很棒的特性, 就是它的可擴展性。1. Dubbo的擴展機制在Dubbo的官網上，Dubbo描述自己是一個高性能的RPC框架。今天我想聊聊Dubbo的另一個很棒的特性, 就是它的可擴展性。如同羅馬不

數據庫可擴展設計方案

table 行數據 ol3 成長升級上線程序高並發留空數據庫表的字段擴展方案傳統方案一. 預留字段預留字段就是在數據庫表設計之初，預先留一定的字段用於後續的業務擴充，例如在設計之初用戶表為user(uid,name,col1,col2,col3....)。當需

一個實現瀏覽器網頁與本地程序之間進行雙向調用的輕量級、強兼容、可擴展的插件開發平臺—本網通

特殊 git 運行環境 mac office文檔 linu 網頁中繼安全通過本網通插件平臺可實現在網頁中的JavaScript腳本無障礙訪問本地電腦的硬件、調用本地系統的API及相關組件，同時可徹底解決ActiveX組件在Chrome、FireFox、Opera、Ed

基於OAS設計可擴展OpenAPI

not format urn design 通配默認 rms 核心消費者前言隨著互聯網行業的興起，開發模式已逐步轉換為微服務自治：小團隊開發微服務，然後通過Restful接口相互調用。開發者們越來越渴望能夠使用一種“官話”進行流暢的溝通，甚至實現多種編程語言系統的自

XML可擴展標記語言

相關推薦