正則表示式matcher.group用法--轉自winter8
阿新 • • 發佈:2018-11-06
正則表示式matcher.group用法
- 部落格分類:
- 演算法
本貼來自 http://hi.baidu.com/cnjsp/blog/item/f5449d824c5102b46c8119cb.html
原來,group是針對()來說的,group(0)就是指的整個串,group(1) 指的是第一個括號裡的東西,group(2)指的第二個括號裡的東西。
最近學習正則表示式,發現Java中的一些術語與其他地方描述的有所差異。比如Java正則表示式中的“組”概念與《正則表示式必知必會》一書中講述的“子表示式”其實是一樣的,只是表述不同而已。由此也引發了使用JavaAPI時對group(int group)、start(int group)、end(int group)不是太理解。在閱讀了關於正則表示式問題:有誰用過Matcher類的group()方法沒有 之後徹底明白,並寫了一個小程式測試。
程式如下
Java程式碼
- package cn.mingyuan.regexp.singlecharacter;
- import java.util.regex.Matcher;
- import java.util.regex.Pattern;
- public class GroupIndexAndStartEndIndexTest {
- /**
- * @param args
- */
- public static void main(String[] args) {
- // TODO Auto-generated method stub
- String str = "Hello,World! in Java.";
- Pattern pattern = Pattern.compile("W(or)(ld!)");
- Matcher matcher = pattern.matcher(str);
- while(matcher.find()){
- System.out.println("Group 0:"+matcher.group(0));//得到第0組——整個匹配
- System.out.println("Group 1:"+matcher.group(1));//得到第一組匹配——與(or)匹配的
- System.out.println("Group 2:"+matcher.group(2));//得到第二組匹配——與(ld!)匹配的,組也就是子表示式
- System.out.println("Start 0:"+matcher.start(0)+" End 0:"+matcher.end(0));//總匹配的索引
- System.out.println("Start 1:"+matcher.start(1)+" End 1:"+matcher.end(1));//第一組匹配的索引
- System.out.println("Start 2:"+matcher.start(2)+" End 2:"+matcher.end(2));//第二組匹配的索引
- System.out.println(str.substring(matcher.start(0),matcher.end(1)));//從總匹配開始索引到第1組匹配的結束索引之間子串——Wor
- }
- }
- }
程式的執行結果為:
Java程式碼
- Group 0:World!
- Group 1:or
- Group 2:ld!
- Start 0:6 End 0:12
- Start 1:7 End 1:9
- Start 2:9 End 2:12
- Wor
總結:其實group(),start(),end()所帶的引數i就是正則表示式中的子表示式索引(第幾個子表示式),由於剛開始對Java正則表示式中的組的概念不清晰,導致理解困難。當將“組”的概念與“子表示式”對應起來之後,理解matcher的group,start,end就完全沒有障礙了。