1. 程式人生 > >正則表示式matcher.group用法--轉自winter8

正則表示式matcher.group用法--轉自winter8

正則表示式matcher.group用法

 

本貼來自       http://hi.baidu.com/cnjsp/blog/item/f5449d824c5102b46c8119cb.html 

 原來,group是針對()來說的,group(0)就是指的整個串,group(1) 指的是第一個括號裡的東西,group(2)指的第二個括號裡的東西。 
最近學習正則表示式,發現Java中的一些術語與其他地方描述的有所差異。比如Java正則表示式中的“組”概念與《正則表示式必知必會》一書中講述的“子表示式”其實是一樣的,只是表述不同而已。由此也引發了使用JavaAPI時對group(int group)、start(int group)、end(int group)不是太理解。在閱讀了關於正則表示式問題:有誰用過Matcher類的group()方法沒有 之後徹底明白,並寫了一個小程式測試。 

程式如下 
Java程式碼 

 收藏程式碼

  1. package cn.mingyuan.regexp.singlecharacter;  
  2.   
  3. import java.util.regex.Matcher;  
  4. import java.util.regex.Pattern;  
  5.   
  6. public class GroupIndexAndStartEndIndexTest {  
  7.   
  8. /** 
  9. * @param args 
  10. */  
  11. public static void main(String[] args) {  
  12.    // TODO Auto-generated method stub  
  13.    String str = "Hello,World! in Java.";  
  14.    Pattern pattern = Pattern.compile("W(or)(ld!)");  
  15.    Matcher matcher = pattern.matcher(str);  
  16.    while(matcher.find()){  
  17.     System.out.println("Group 0:"+matcher.group(0));//得到第0組——整個匹配  
  18.     System.out.println("Group 1:"+matcher.group(1));//得到第一組匹配——與(or)匹配的  
  19.     System.out.println("Group 2:"+matcher.group(2));//得到第二組匹配——與(ld!)匹配的,組也就是子表示式  
  20.     System.out.println("Start 0:"+matcher.start(0)+" End 0:"+matcher.end(0));//總匹配的索引  
  21.     System.out.println("Start 1:"+matcher.start(1)+" End 1:"+matcher.end(1));//第一組匹配的索引  
  22.     System.out.println("Start 2:"+matcher.start(2)+" End 2:"+matcher.end(2));//第二組匹配的索引  
  23.     System.out.println(str.substring(matcher.start(0),matcher.end(1)));//從總匹配開始索引到第1組匹配的結束索引之間子串——Wor  
  24.    }  
  25. }  
  26.   
  27. }  


程式的執行結果為: 
Java程式碼 

 收藏程式碼

  1. Group 0:World!  
  2. Group 1:or  
  3. Group 2:ld!  
  4. Start 0:6 End 0:12  
  5. Start 1:7 End 1:9  
  6. Start 2:9 End 2:12  
  7. Wor  


總結:其實group(),start(),end()所帶的引數i就是正則表示式中的子表示式索引(第幾個子表示式),由於剛開始對Java正則表示式中的組的概念不清晰,導致理解困難。當將“組”的概念與“子表示式”對應起來之後,理解matcher的group,start,end就完全沒有障礙了。