1. 程式人生 > >[轉] 正則表示式貪婪與非貪婪模式

[轉] 正則表示式貪婪與非貪婪模式

今天使用Notepad++時發現搜尋時需要正則匹配,到網上搜了下Notepad++中正則的用法,發現有個加+號是非貪婪匹配的東西,不太記得了,故到網上搜索,發現有用部落格一份:

之前做程式的時候看到過正則表示式的貪婪與非貪婪模式,今天用的時候就想不起來了,現在這裡總結一下,以備自己以後用到注意。

1.什麼是正則表示式的貪婪與非貪婪匹配

如:String str="abcaxc";

    Patter p="ab*c";

  貪婪匹配:正則表示式一般趨向於最大長度匹配,也就是所謂的貪婪匹配。如上面使用模式p匹配字串str,結果就是匹配到:abcaxc(ab*c)。

  非貪婪匹配:就是匹配到結果就好,就少的匹配字元。如上面使用模式p匹配字串str,結果就是匹配到:abc

(ab*c)。

2.程式設計中如何區分兩種模式

  預設是貪婪模式;在量詞後面直接加上一個問號?就是非貪婪模式。

  量詞:{m,n}:m到n個

     *:任意多個

     +:一個到多個

     ?:0或一個

3.程式例項

使用Snort的規則一條規則的一部分作為匹配文字,匹配出其中的content部分。

複製程式碼
 1 import java.util.regex.Matcher;
 2 import java.util.regex.Pattern;
 3 
 4 public class RegularTest {
 5     
 6     public static void main(String[] arg){
7 String text="(content:\"rcpt to root\";pcre:\"word\";)"; 8 String rule1="content:\".+\""; //貪婪模式 9 String rule2="content:\".+?\""; //非貪婪模式 10 11 System.out.println("文字:"+text); 12 System.out.println("貪婪模式:"+rule1); 13 Pattern p1 =Pattern.compile(rule1);
14 Matcher m1 = p1.matcher(text); 15 while(m1.find()){ 16 System.out.println("匹配結果:"+m1.group(0)); 17 } 18 19 System.out.println("非貪婪模式:"+rule2); 20 Pattern p2 =Pattern.compile(rule2); 21 Matcher m2 = p2.matcher(text); 22 while(m2.find()){ 23 System.out.println("匹配結果:"+m2.group(0)); 24 } 25 } 26 }
複製程式碼

執行結果:

 4.注意

  在linux C 下面沒有編譯成功使用?號的非貪婪模式。

   網上的一句話:the ? only works for Perl-based regexp, not for POSIX...