Linux Shell | 解析xml節點

01 xml檔案

# user.xml
<user>
    <name>Toy</name>
    <sex>man</sex>
    <room/>
</user>

其中第 5 行的<room/> xml 節點是空節點，是比較特殊的格式。

02 多條命令解析xml節點

採用多條命令和管道符也可以解析xml節點，方式如下：

[~]$ cat user.xml | grep name | sed 's/^.*<name>//g' | sed 's/<\/name>.*$//g'
Toy
[~]$ cat user.xml | grep name | sed 's/^.*<sex>//g' | sed 's/<\/sex>.*$//g'

[~]$ cat user.xml | grep room | sed 's/^.*<room>//g' | sed 's/<\/room>.*$//g'
    <room/>

上面的方式無法解析 <room/> 這種特殊格式的 xml 節點，雖然用多個命令和管道符是可以實現解析正常格式的xml節點的值，但是過多的管道符是會降低執行效率的。

因為管道符是會為連線的命令產生子程序，從而加大CPU的開銷。

03 一行 awk 命令解析xml節點

awk 命令解析所有特殊的 xml 節點的值，只需要一行命：

[~]$ awk  '/<\/*name\/*>/{gsub(/[[:space:]]*<\/*name\/*>/,"");print $0}' user.xml 
Toy
[~]$ awk  '/<\/*sex\/*>/{gsub(/[[:space:]]*<\/*sex\/*>/,"");print $0}' user.xml 
man
[~]$ awk  '/<\/*room\/*>/{gsub(/[[:space:]]*<\/*room\/*>/,"");print $0}' user.xml 

[~]$

上面的 awk 方式可以相容所有特殊的 xml 節點，並且只需要一條命令就能解析出 xml 的值。

簡單說明下命令的意思：

awk '/匹配的字串/{print $0}'表示在文字中，找到匹配的字串所在的行記錄，可以替代grep "匹配的字串"
gsub(/匹配的字串/,"")是 awk 內部的函式，表示將匹配到的字串替換成""，也就是替換成空字串，可以替代 sed 's/匹配的字串//g'
</*name/*> 中的 * 號是正則表示式，*號表示可以重複前面字元 0 個或多個，所以</*name/*> 可以間接的表示<name>、</name> 和<name/>

等
[[:space:]] 表示匹配空格、製表格等空白符，[[:space:]]*表示匹配空白字元0個或多個
$0 表示取記錄的所有記錄

所以，awk 解析 xml 節點的命令小結成如下：

awk  '/<\/*節點名字\/*>/{gsub(/[[:space:]]*<\/*節點名字\/*>/,"");print $0}' xml檔案

04 小結

我們在編寫指令碼時，需要解析文字檔案時，儘量避免使用多命令和管道符的方式去解析，因為使用了管道符就會產生子程序，會加大了 CPU 的開銷。

大部分情況下只需要一條 awk 命令就完成解析的工作，相比較起多命令和管道符的方式效率會更高，並且CPU開銷小。

通過以上的兩個解析xml節點的案例，我們可以總結出：

awk '/匹配的字串/{print $0}' 可以替代 grep "匹配的字串"
awk  '{gsub(/匹配的字串/,"");print $0}' 可以替代 sed 's/匹配的字串/""/g'

awk '/匹配的字串/{gsub(/匹配的字串/,"");print $0}' <xml檔案> 
可以替代
cat <xml檔案> | grep "匹配的字串" | sed 's/匹配的字串/""/g' 
 
              
           
              
              
            
            相關推薦
			   
            
            
            
 

    

    
    Linux Shell | 解析xml節點
      01 xml檔案
# user.xml
<user>
    <name>Toy</name>
    <sex>man</sex>
    <room/>
</user>
其中第 5 行的<room/> xml  

  
 

    

    
    DOMDocument方法解析xml節點
      
                


可用php解析，也可用js解析。php和js直接的區別是，一個是用 . ，一個是 -> ，其他都一樣

php中loadXML方法中引數是xml的字串，load方法中引數是xml檔案路徑

$dom = new DOMDocument();
$dom->lo 

  
 

    

    
    Dom4j解析xml複雜多節點報文
       
 
 
 XML是一種通用的資料交換格式,它的平臺無關性、語言無關性、系統無關性、給資料整合與互動帶來了極大的方便。XML在不同的語言環境中解析方式都是一樣的,只不過實現的語法不同而已。 
 XML的解析方式分為四種： 
     1、DOM解析； 
     2、 

  
 

    

    
    Linux shell命令解析器(二),命令
       
 
 環境： 
 Ubuntu14-4   核心 4.4.0-135 
 vim編輯器 7.4  
 gcc  4.8.4  
 1.1 知識點 
 
  Shell 的基本概念 
  檔案相關函式,記憶體相關函式 
 
  
 &nb 

  
 

    

    
    用DOM解析XML ，用xpath快速查詢XML節點
      XPath是一種快速查詢xml節點和屬性的一種語言，Xpath和xml的關係就像是sql語句和資料庫的關係。用sql語句可以從資料庫中快速查詢出東西同樣的用xPath也可以快速的從xml中查詢出東西。 
下面的示例演示了怎麼用jdk自帶的rt.jar完成dom解析 
程式碼如下： 
test.xml的程式碼如 

  
 

    

    
    java w3c解析xml檔案，獲取指定節點內容，讀取外部配置檔案。
       
 
 原始碼： 
 package com.ys.adage.utils;

import com.ys.adage.message.CodeObjectResult;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import org. 

  
 

    

    
    使用jaxp解析器dom方式對xml節點進行操作
       
 
     作為一名初學者，對一些程式語言感覺不是很簡單。尤其是正在學習的Javaweb這一部分的內容，非常駁雜，讓人頭大。 
     看過一些書，也包括聽一些人說，寫部落格有利於理解和記憶。作為一名初學者，我抱著學習和積累的心理，開始我的部 

  
 

    

    
    Linux Shell 判斷塊裝置節點是否存在
       
 
 /*************************************************************************
 *                   Linux Shell 判斷塊裝置節點是否存在
 * 說明：
 *     能牌問shell指令碼-f不能判 

  
 

    

    
    Linux shell命令解析器(一),bash終端
      
                環境：

Ubuntu14-4   核心 4.4.0-135

vim編輯器 7.4 

gcc  4.8.4 

1.1 知識點

Shell 的基本概念
	程序控制相關的系統呼叫的使用（如 fork,exec函式族）
整理框架:

1.命令直譯器首先是一個死迴圈。

2. 

  
 

    

    
    dom4J解析XML，並改變節點資料
       
 
  
  
 使用dom4j解析XML字串，並將部分節點的資料做處理 
 //將XML字串轉為Document物件
Document document= DocumentHelper.parseText("需要解析的XML字串");
//得到根節點
Element rootElement = docu 

  
 

    

    
    Java接收Cordys中webservice介面的返回資料並解析xml獲取相應節點資料
      
							
							
							在做專案的過程中，需要用Java呼叫Cordys的webservice介面的返回資料，眾所周知，webservice返回的資料是xml形式的，那麼我們怎樣獲取相關節點下的資料呢？

處理之前返回的資料格式如下：



<soap:Envelope xmln 

  
 

    

    
    Linux下使用libxml2解析XML配置檔案
      
                

這是一個專案過程中所遇到的問題。有多個商品種類，每個商品種類有著不同的基本資訊，現在我們需要對這些基本資訊進行驗證。但是每個種類會有自己獨特的驗證需求(不同種類需要驗證的欄位可能不一樣)，如果我們使用程式碼來判斷每個種類需要驗證哪些欄位會非常麻煩，而且需求稍一變動就要修改 

  
 

    

    
    利用dom4j解析XML報文，解析出所有的節點以及內容
      
                先說一下最開始自己的需求吧，我需要把一段xml的報文裡面最裡面一層的所有節點以及內容全部取出來，按照常規方法都是根據節點名字去取吧  雖然寫出來了 但是很繁瑣  覺得程式碼很冗餘  後來想到了遞迴  用遞迴去取 果然簡單了很多   下面直接貼程式碼了import java.u 

  
 

    

    
    soap傳送報文請求和dom4j解析XML並且獲得指定名稱的節點資訊
      
                
package com.lzw.b2b.soap;

import java.io.ByteArrayInputStream;
import java.io.InputStream;
import java.util.HashMap;
import java.util.It 

  
 

    

    
    xstream解析xml轉換java物件，過濾掉不需要的節點
      
							
							
							public class ETLXstream extends XStream { 
    protected MapperWrapper wrapMapper(MapperWrapper next) { 
        return new MapperW 

  
 

    

    
    Linux Shell經典例項解析
      
                
該篇部落格作為對之前Linux Shell常用技巧和高階技巧系列部落格的總結，將以Oracle資料庫伺服器啟動指令碼為例，逐行進行解釋和說明，以幫助我們能夠更好的學習和理解Shell指令碼的慣用技巧和強大之處。      Oracle的啟動指令碼從功能上講主要分為兩個部分， 

  
 

    

    
    org.w3c.dom 解析XML檔案 可以解析出節點屬性
      
                xml檔案如下：
<smilxmlns="http://www.w3.org/2000/SMIL20/CR/Language">
<head>
<layout>
<root-layoutheight="100%"width="100% 

  
 

    

    
    Andorid中使用Jsoup解析庫解析XML、HTML、Dom節點---第三方庫學習筆記（三）
      
							
							
							XML介紹：

XML簡介：


XML,可擴充套件標記語言，標準通用標記語言的子集。
一種用於標記電子檔案使其具有結構性的標記語言。
它可以用來標記資料、定義資料型別
是一種允許使用者對自己的標記語言進行定義的源語言。
非常適合全球資訊網傳輸
提供統一方法描述 

  
 

    

    
    Linux C]利用libxml2解析xml檔案
      
                為了解析xml，可以使用Linux下預設安裝的libxml2。/*     a.c     功能：利用libxml2解析xml檔案 */#include <stdio.h>#include <stdlib.h>#include <string.h 

  
 

    

    
    dom4j 解析xml 獲取節點值和節點屬性
      
								
								            
						
                
Document document = null;
//xmlString為String型別的xml格式的資料
String xmlString="<?xml version=\"1.0\" e