正則表達選擇分組向後引用及捕獲和非捕獲分組（五）（1000則）

阿新 • • 發佈：2020-04-23

前言

直接用例子作為演示。

四沒有，因為我看了一下，第四節當時理解錯了，還在改。

正文

選擇操作

部分割槽分大小寫

我們在做匹配的時候希望,不區分大小寫。

當然我們在python使用庫中,可以選擇顯示不區分大小寫。

但是python庫在我們寫入中，有個有一個需求一部分是不區分大小寫的。

比如說我們希望the 中，t區分大小寫，而he不區分大小寫，怎麼寫呢?

我們用(?i)表示不區分大小寫，那麼我們可以這樣寫:t(?i)he,這樣就可以了。

其他選擇操作

在此說明一下，其實每一種語言的正則都有一定的區別。

我這裡介紹幾種通用的選擇操作:

(?m) 表示多行匹配，如果不清楚請看我的第三章。

(?s) 單行匹配

(?x) 忽略註釋

還有很多，在此提一下，然後呢，每一種語言都存在差異，最好是使用同類型的庫。

子模式

什麼是子模式?

指的是分組中的一個或多個分組，子模式就是模式中的模式。

可能這樣理解有點難理解，舉個栗子:

THE RIME OF THE ANCYENT MARINERE

我要匹配這樣一段話，怎麼匹配呢?
正則我這樣寫肯定可以匹配的。

THE RIME OF THE ANCYENT MARINERE

那麼我現在這樣寫:

(THE) (RIME) (OF) (THE) (ANCYENT) (MARINERE)

它不僅把我們要匹配的匹配出來了，而且每個括號中的進行了分組，這就是子模式。

捕獲和向後引用

it is a dog

正則

（it is） (a dog)

這個時候就將他們分組了。
$2 $1 的結果是 a dog it is.

除了這個我們還可以這樣 \U$1 $2 得到的結果是 A DOG it is

\U 是將匹配項轉換為大寫。

那麼還有其他的:\u 是首字母大寫，\l 首字母小寫 \L 全部小寫

這些java或其他高階語言本身不支援，你需要使用一些庫，但這些屬於正則規範。

命名分組

得到的結果是:

也就是說我們可以進行命名分組，如何引用分組:

$+{one}

通過$+{xx}的方式。

每一種命名分組在不同語言中是不同的，python中是(?p...),具體檢視語言。

非捕獲分組

非捕獲分組是相對捕獲分組而言的。

因為捕獲分組會將分組資訊儲存在記憶體中而非捕獲不會，所以效能高。

我再網上找了一個例子:

var str = "a1***ab1cd2***c2";
var reg1 = /((ab)+\d+)((cd)+\d+)/i;
var reg2 = /((?:ab)+\d+)((?:cd)+\d+)/i;
alert(str.match(reg1));//ab1cd2,ab1,ab,cd2,cd
alert(str.match(reg2));//ab1cd2,ab1,cd2

(?:xx) 使用?:就是非捕獲分組。

也就是說(?:xx) 是為了方便我們寫正則更加清晰，有括號輔助。

c#例子來一個:

using System;
using System.Text.RegularExpressions;

public class Example
{
   public static void Main()
   {
      string pattern = @"(?:\b(?:\w+)\W*)+\.";
      string input = "This is a short sentence.";
      Match match = Regex.Match(input, pattern);
      Console.WriteLine("Match: {0}", match.Value);
      for (int ctr = 1; ctr < match.Groups.Count; ctr++)
         Console.WriteLine("   Group {0}: {1}", ctr, match.Groups[ctr].Value);
   }
}
// The example displays the following output:
//       Match: This is a short sentence.

原子分組

原子分組應該是關閉回溯。

很多人不理解回溯哈，在此特意解釋一下:

通常，如果正則表示式包含一個可選或可替代匹配模式並且備選不成功的話，正則表示式引擎可以在多個方向上分支以將輸入的字串與某種模式進行匹配。
如果未找到使用第一個分支的匹配項，則正則表示式引擎可以備份或回溯到使用第一個匹配項的點並嘗試使用第二個分支的匹配項。
此過程可繼續進行，直到嘗試所有分支。

我找到了一個例子:

using System;
using System.Text.RegularExpressions;

public class Example
{
   public static void Main()
   {
      string[] inputs = { "cccd.", "aaad", "aaaa" };
      string back = @"(\w)\1+.\b";
      string noback = @"(?>(\w)\1+).\b";
      foreach (string input in inputs)
      {
         Match match1 = Regex.Match(input, back);
         Match match2 = Regex.Match(input, noback);
         Console.WriteLine("{0}: ", input);

         Console.Write("   Backtracking : ");
         if (match1.Success)
            Console.WriteLine(match1.Value);
         else
            Console.WriteLine("No match");

         Console.Write("   Nonbacktracking: ");
         if (match2.Success)
            Console.WriteLine(match2.Value);
         else
            Console.WriteLine("No match");
      }
   }
}
// The example displays the following output:
//    cccd.:
//       Backtracking : cccd
//       Nonbacktracking: cccd
//    aaad:
//       Backtracking : aaad
//       Nonbacktracking: aaad
//    aaaa:
//       Backtracking : aaaa
//       Nonbacktracking: No match

為什麼最後一個aaaa，不會被匹配呢?

分析一下:

@"(?>(\w)\1+).\b"

(\w) 捕獲分組，也就是說被捉住的是a。
那麼\1+ 就是是說匹配0或者多個a，然後呢由於原子性，那麼是貪婪的，他就會匹配aaaa,也就是匹配完了，那麼你剩下一個.(任意字元),就不能匹配了。

總結

以上僅僅是個人理解，如有不對，望請指出

正則表達選擇分組向後引用及捕獲和非捕獲分組（五）（1000則）

前言直接用例子作為演示。四沒有，因為我看了一下，第四節當時理解錯了，還在改。正文選擇操作部分割槽分大小寫我們在做匹配的時候希望,不區分大小寫。當然我們在python使用庫中,可以選擇顯示不區分大小寫。但是python庫在我們寫入中，有個有一個需求一部分是不區分大小寫的。比如說我們希望the

Python開發基礎-Day15正則表達式爬蟲應用，configparser模塊和subprocess模塊

表達 port 進行 false popen ext signal -- 默認正則表達式爬蟲應用（校花網） 1 import requests 2 import re 3 import json 4 #定義函數返回網頁的字符串信息 5 def getPage_

Python基礎----正則表達式爬蟲應用，configparser模塊和subprocess模塊

stdin alt 輸入 -h 但是狀態 swd 有效 tle 正則表達式爬蟲應用（校花網） 1 import requests 2 import re 3 import json 4 #定義函數返回網頁的字符串信息 5 def getPage_str(u

python 正則表達式中反斜杠()的麻煩和陷阱（轉）

[] 內部 ica con re模塊 .com 斜杠字符 pat 這裏是一點小心得：由於下面兩個原因，在正則表達式中使用反斜杠就會產生了一個雙重轉換的問題。(1)、python自身處理字符串時，反斜杠是用於轉義字符 (2)、正則表達式也使用反斜杠來轉義字符

【正則表達式】linux中符號及正則表達式

lin int echo 字符 linux中 pri style pre 匹配【符號】 # 換行 \n echo -e "yy\nwy" yy wy 【正則表達式】 cat test.txt yy1%yy2,yy3,yy4%yy5 # [,%

Python中正則匹配使用findall,捕獲分組(xxx)和非捕獲分組(?:xxx)的差異

bbb tps img 是把區別內容是我解答什麽是轉自：https://blog.csdn.net/qq_42739440/article/details/81117919 下面是我在用findall匹配字符串時遇到的一個坑，分享出來供大家跳坑。例題：如圖

JS正則表達式驗證輸入框只能輸入漢字和半角逗號

逗號 div 示例商品 itl style nbsp urn span JS正則表達式驗證輸入框只能輸入漢字和半角逗號 1.正則表達式 [\u4E00-\u9FA5,]+$ 2.代碼示例　　　　　　　var colo

關於正則表示式——捕獲型括號和非捕獲型括號

對於括號中的子表示式，正則表示式會將匹配的子表示式進行儲存。 <pre class="javascript" name="code">var regular = /^Subject:(\d)/ var str = "Subject:1 as something"

前向後項差分和顯式隱式尤拉法

摘要：本文主要介紹前向後向差分，顯式隱式尤拉法及其穩定性分析。前向差分對應顯式方法，後向差分對應隱式方法。顯式尤拉法是比較流行的顯式方法，隱式尤拉法是比較流行的隱式方法。顯式尤拉法條件穩定，對積分步長有要求，隱式尤拉法無條件穩定，對

split與re.split/捕獲分組和非捕獲分組/startswith和endswith和fnmatch/finditer 筆記

split()對字串進行劃分： >>> a = 'a b c d' >>> a.split(' ') ['a', 'b', 'c', 'd'] 複雜一些可以使用re.split() >>> import re >

C++函式引用形參和非引用形參

C++函式引用形參和非引用形參 C++中函式的形參主要有兩種型別：非引用形參和引用形參，對應兩種不同的引數傳遞方式。 void f(int t); void f(int &t); 非引用行參是實參的一個副本，故對非引用形參的修改不會影響實參；引用形參是實參的別名，

python裏使用正則表達式的後向搜索肯定模式

includes 表達一個 cli 出現 handle ack detail pop 在前面學習了比較多模式，有前向搜索的，也有後向搜索的，有肯定模式的，也有否定模式的。這次再來學習一個，就是後向搜索肯定模式，意思就是說已經掃描過了的字符串，還想後悔去看一下，是否可以匹配

如何解決python的re模塊group、groups與findall遇見正則表達式中分組"()"後產生的”眩暈反應“

pat 完整 bject str 例子就會如何解決不能 bsp 轉載請註明出處：https://www.cnblogs.com/oceanicstar/p/9244783.html 直接先上例子 >>> re.search(‘(book+)

[正則表達式]PCRE反向分組引用(語法)

一個正則 () 規則引用 aaa 沒有 ron 運用正則表達式中，凡出現圓括號()，括號中的匹配內容就會被認為是一個分組；根據括號從左邊出現的順序命名分組代號，分組代號由1到n(代號0通常被一些語言用來引用整個表達式匹配的結果，即使這個表達式沒有分組括號，但是表達

正則表達式之分組

表達式字符串假設有如下幾行文本："xxx" : {"name" : "123"} "yyy" : {"name" : "456"} "zzz" : {"name" : "789"} 如果匹配出第1條和第3條，那麽可以使用以下的正則表達式："((xxx)|(zzz))".* 其中，最外層的括

用正則表達式解決查找指定字符串前一位不能出現xxx,後一位不能出現xxx

用法深入學習變量名我們包括包含針對匹配查找之前項目要求做一個按指定字符串查找的工具，把所有該字段對應的數據信息都取出來。由於數據量大所以查詢結果要求精確匹配（說到這裏沒有什麽難度）。但是還有一種符合條件的結果是該字段處於一條sql語句中，簡單的說，就是一

JavaScript正則表達式模式匹配(2)——分組模式匹配

pattern blog java clas pat span 交換模式位置 1 var pattern=/google{4,8}$/; // {4,8}$表示匹配結尾4-8次 2 var str=‘googleeeeeeeee‘; // 表示e的

jquery,$,選擇器,正則表達式

led 英文 exp 標準 cape 獲取 edi value argument 1、空白 // Whitespace characters http://www.w3.org/TR/css3-selectors/#whitespace white

Perl正則表達式引用

perl正則 lag 轉換成 mit word 不同版本 passenger 賦值擴展正則表達式兩篇：基礎正則 Perl正則本文是對Perl正則的一點擴展，主要內容是使用qr//創建正則對象，以及一些其它的技巧。 qr//創建正則對象因為可以在正則模式中使用

小數點後保留2位小數的正則表達式

如果知識兩位小數位數 3.1 斜杠字符串第一步 {} 一、前提　　整數和小數，保留兩位小數的正則表達式：　　具體什麽意思呢　 ^(([1-9]{1}\\d*)|([0]{1}))(\\.(\\d){0,2})?$ 二、知識點　　1、首先從寫法上可以看出

正則表達選擇分組向後引用及捕獲和非捕獲分組（五）（1000則）

前言

正文

選擇操作

部分割槽分大小寫

其他選擇操作

子模式

捕獲和向後引用

命名分組

非捕獲分組

原子分組

總結

相關推薦