python正則表示式貪婪與非貪婪模式
阿新 • • 發佈:2019-01-06
之前做程式的時候看到過正則表示式的貪婪與非貪婪模式,今天用的時候就想不起來了,現在這裡總結一下,以備自己以後用到注意。
1.什麼是正則表示式的貪婪與非貪婪匹配
如:String str="abcaxc";
Patter p="ab.*c";
貪婪匹配:正則表示式一般趨向於最大長度匹配,也就是所謂的貪婪匹配。如上面使用模式p匹配字串str,結果就是匹配到:abcaxc(ab.*c)。
非貪婪匹配:就是匹配到結果就好,最少的匹配字元。如上面使用模式p匹配字串str,結果就是匹配到:abc(ab.*?c)。
2、程式設計中如何區分兩種模式
預設是貪婪模式;在量詞後面直接加上一個問號?就是非貪婪模式。
下面的都是量詞:
{m,n}:m到n個
*:任意多個
+:一個到多個
?:0或一個
貪婪匹配:在滿足匹配時,匹配儘可能長的字串,預設情況下,採用貪婪匹配
string pattern1 = @"a.*c"; // greedy match Regex regex = new Regex(pattern1); regex.Match("abcabc"); // return "abcabc"
非貪婪匹配:在滿足匹配時,匹配儘可能短的字串,使用?來表示非貪婪匹配
string pattern1 = @"a.*?c"; // non-greedy match Regex regex = new Regex(pattern1); regex.Match("abcabc"); // return "abc"
幾個常用的非貪婪匹配Pattern
*? 重複任意次,但儘可能少重複+? 重複1次或更多次,但儘可能少重複 ?? 重複0次或1次,但儘可能少重複 {n,m}? 重複n到m次,但儘可能少重複 {n,}? 重複n次以上,但儘可能少重複
正則表示式規則檢視如下教程:
http://www.runoob.com/regexp/regexp-syntax.html