C# 正則表示式

阿新 • • 發佈：2020-08-17

C#正則表示式

正則表示式是一種匹配輸入文字的模式。.Net 框架提供了允許這種匹配的正則表示式引擎。模式由一個或多個字元、運算子和結構組成。

定義正則表示式

下面列出了用於定義正則表示式的各種類別的字元、運算子和結構。

字元轉義
字元類
定位點
分組構造
限定符
反向引用構造
備用構造
替換
雜項構造

字元轉義

正則表示式中的反斜槓字元（\）指示其後跟的字元是特殊字元，或應按原義解釋該字元。

下表列出了轉義字元：

轉義字元	描述	模式	匹配
\a	與報警 (bell) 符 \u0007 匹配。	\a	"Warning!" + '\u0007' 中的 "\u0007"
\b	在字元類中，與退格鍵 \u0008 匹配。	[\b]{3,}	"\b\b\b\b" 中的 "\b\b\b\b"
\t	與製表符 \u0009 匹配。	(\w+)\t	"Name\tAddr\t" 中的 "Name\t" 和 "Addr\t"
\r	與回車符 \u000D 匹配。（\r 與換行符 \n 不是等效的。）	\r\n(\w+)	"\r\nHello\nWorld." 中的 "\r\nHello"
\v	與垂直製表符 \u000B 匹配。	[\v]{2,}	"\v\v\v" 中的 "\v\v\v"
\f	與換頁符 \u000C 匹配。	[\f]{2,}	"\f\f\f" 中的 "\f\f\f"
\n	與換行符 \u000A 匹配。	\r\n(\w+)	"\r\nHello\nWorld." 中的 "\r\nHello"
\e	與轉義符 \u001B 匹配。	\e	"\x001B" 中的 "\x001B"
\ nnn	使用八進位制表示形式指定一個字元（nnn 由二到三位數字組成）。	\w\040\w	"a bc d" 中的 "a b" 和 "c d"
\x nn	使用十六進位制表示形式指定字元（nn 恰好由兩位數字組成）。	\w\x20\w	"a bc d" 中的 "a b" 和 "c d"
\c X \c x	匹配 X 或 x 指定的 ASCII 控制元件字元，其中 X 或 x 是控制元件字元的字母。	\cC	"\x0003" 中的 "\x0003" (Ctrl-C)
\u nnnn	使用十六進位制表示形式匹配一個 Unicode 字元（由 nnnn 表示的四位數）。	\w\u0020\w	"a bc d" 中的 "a b" 和 "c d"
\	在後面帶有不識別的轉義字元時，與該字元匹配。	\d+[\+-x\]\d+\d+[\+-x\\d+	"(2+2) * 39" 中的 "2+2" 和 "39"

字元類

字元類與一組字元中的任何一個字元匹配。

下表列出了字元類：

字元類	描述	模式	匹配
[character_group]	匹配 character_group 中的任何單個字元。預設情況下，匹配區分大小寫。	[mn]	"mat" 中的 "m"，"moon" 中的 "m" 和 "n"
[^character_group]	非：與不在 character_group 中的任何單個字元匹配。預設情況下，character_group 中的字元區分大小寫。	[^aei]	"avail" 中的 "v" 和 "l"
[ first - last ]	字元範圍：與從 first 到 last 的範圍中的任何單個字元匹配。	[b-d]	[b-d]irds 可以匹配 Birds、 Cirds、 Dirds
.	萬用字元：與除 \n 之外的任何單個字元匹配。若要匹配原意句點字元（. 或 \u002E），您必須在該字元前面加上轉義符 (\.)。	a.e	"have" 中的 "ave"， "mate" 中的 "ate"
\p{ name }	與name指定的 Unicode 通用類別或命名塊中的任何單個字元匹配。	\p{Lu}	"City Lights" 中的 "C" 和 "L"
\P{ name }	與不在name指定的 Unicode 通用類別或命名塊中的任何單個字元匹配。	\P{Lu}	"City" 中的 "i"、 "t" 和 "y"
\w	與任何單詞字元匹配。	\w	"Room#1" 中的 "R"、 "o"、 "m" 和 "1"
\W	與任何非單詞字元匹配。	\W	"Room#1" 中的 "#"
\s	與任何空白字元匹配。	\w\s	"ID A1.3" 中的 "D "
\S	與任何非空白字元匹配。	\s\S	"int __ctr" 中的 " _"
\d	與任何十進位制數字匹配。	\d	"4 = IV" 中的 "4"
\D	匹配不是十進位制數的任意字元。	\D	"4 = IV" 中的 " "、 "="、 " "、 "I" 和 "V"

定位點

定位點或原子零寬度斷言會使匹配成功或失敗，具體取決於字串中的當前位置，但它們不會使引擎在字串中前進或使用字元。

下表列出了定位點：

斷言	描述	模式	匹配
^	匹配必須從字串或一行的開頭開始。	^\d{3}	"567-777-" 中的 "567"
$	匹配必須出現在字串的末尾或出現在行或字串末尾的\n之前。	-\d{4}$	"8-12-2012" 中的 "-2012"
\A	匹配必須出現在字串的開頭。	\A\w{4}	"Code-007-" 中的 "Code"
\Z	匹配必須出現在字串的末尾或出現在字串末尾的\n之前。	-\d{3}\Z	"Bond-901-007" 中的 "-007"
\z	匹配必須出現在字串的末尾。	-\d{3}\z	"-901-333" 中的 "-333"
\G	匹配必須出現在上一個匹配結束的地方。	\G$\d$	"(1)(3)(5)[7](9)" 中的 "(1)"、 "(3)" 和 "(5)"
\b	匹配一個單詞邊界，也就是指單詞和空格間的位置。	er\b	匹配"never"中的"er"，但不能匹配"verb"中的"er"。
\B	匹配非單詞邊界。	er\B	匹配"verb"中的"er"，但不能匹配"never"中的"er"。

分組構造

分組構造描述了正則表示式的子表示式，通常用於捕獲輸入字串的子字串。

下表列出了分組構造：

分組構造	描述	模式	匹配
( subexpression )	捕獲匹配的子表示式並將其分配到一個從零開始的序號中。	(\w)\1	"deep" 中的 "ee"
(?< name >subexpression)	將匹配的子表示式捕獲到一個命名組中。	(?< double>\w)\k< double>	"deep" 中的 "ee"
(?< name1 -name2 >subexpression)	定義平衡組定義。	(((?'Open'$)[^\($])+((?'Close-Open'\))[^])+)*(?(Open)(?!))$	"3+2^((1-3)(3-1))" 中的 "((1-3)(3-1))"
(?: subexpression)	定義非捕獲組。	Write(?:Line)?	"Console.WriteLine()" 中的 "WriteLine"
(?imnsx-imnsx:subexpression)	應用或禁用subexpression中指定的選項。	A\d{2}(?i:\w+)\b	"A12xl A12XL a12xl" 中的 "A12xl" 和 "A12XL"
(?= subexpression)	零寬度正預測先行斷言。	\w+(?=\.)	"He is. The dog ran. The sun is out." 中的 "is"、 "ran" 和 "out"
(?! subexpression)	零寬度負預測先行斷言。	\b(?!un)\w+\b	"unsure sure unity used" 中的 "sure" 和 "used"
(?<=subexpression)	零寬度正回顧後發斷言。	(?<=19)\d{2}\b	"1851 1999 1950 1905 2003" 中的 "99"、"50"和 "05"
(?<! subexpression)	零寬度負回顧後發斷言。	(?<!wo)man\b	"Hi woman Hi man" 中的 "man"
(?> subexpression)	非回溯（也稱為"貪婪"）子表示式。	[13579](?>A+B+)	"1ABB 3ABBC 5AB 5AC" 中的 "1ABB"、 "3ABB" 和 "5AB"

例項

using System;
using System.Text.RegularExpressions;

public class Example
{
   public static void Main()
   {
      string input = "1851 1999 1950 1905 2003";
      string pattern = @"(?<=19)\d{2}\b";

      foreach (Match match in Regex.Matches(input, pattern))
         Console.WriteLine(match.Value);
   }
}

限定符

限定符指定在輸入字串中必須存在上一個元素（可以是字元、組或字元類）的多少個例項才能出現匹配項。限定符包括下表中列出的語言元素。

下表列出了限定符：

限定符	描述	模式	匹配
*	匹配上一個元素零次或多次。	\d*\.\d	".0"、 "19.9"、 "219.9"
+	匹配上一個元素一次或多次。	"be+"	"been" 中的 "bee"， "bent" 中的 "be"
?	匹配上一個元素零次或一次。	"rai?n"	"ran"、 "rain"
{ n }	匹配上一個元素恰好 n 次。	",\d{3}"	"1,043.6" 中的 ",043"， "9,876,543,210" 中的 ",876"、 ",543" 和 ",210"
{ n ,}	匹配上一個元素至少 n 次。	"\d{2,}"	"166"、 "29"、 "1930"
{ n , m }	匹配上一個元素至少 n 次，但不多於 m 次。	"\d{3,5}"	"166"， "17668"， "193024" 中的 "19302"
*?	匹配上一個元素零次或多次，但次數儘可能少。	\d*?\.\d	".0"、 "19.9"、 "219.9"
+?	匹配上一個元素一次或多次，但次數儘可能少。	"be+?"	"been" 中的 "be"， "bent" 中的 "be"
??	匹配上一個元素零次或一次，但次數儘可能少。	"rai??n"	"ran"、 "rain"
{ n }?	匹配前導元素恰好 n 次。	",\d{3}?"	"1,043.6" 中的 ",043"， "9,876,543,210" 中的 ",876"、 ",543" 和 ",210"
{ n ,}?	匹配上一個元素至少 n 次，但次數儘可能少。	"\d{2,}?"	"166"、 "29" 和 "1930"
{ n , m }?	匹配上一個元素的次數介於 n 和 m 之間，但次數儘可能少。	"\d{3,5}?"	"166"， "17668"， "193024" 中的 "193" 和 "024"

反向引用構造

反向引用允許在同一正則表示式中隨後標識以前匹配的子表示式。

下表列出了反向引用構造：

反向引用構造	描述	模式	匹配
\ number	反向引用。匹配編號子表示式的值。	(\w)\1	"seek" 中的 "ee"
\k< name >	命名反向引用。匹配命名錶達式的值。	(?< char>\w)\k< char>	"seek" 中的 "ee"

備用構造

備用構造用於修改正則表示式以啟用 either/or 匹配。

下表列出了備用構造：

備用構造	描述	模式	匹配
\|	匹配以豎線 (\|) 字元分隔的任何一個元素。	th(e\|is\|at)	"this is the day. " 中的 "the" 和 "this"
(?( expression )yes \| no )	如果正則表示式模式由 expression 匹配指定，則匹配yes；否則匹配可選的no部分。 expression 被解釋為零寬度斷言。	(?(A)A\d{2}\b\|\b\d{3}\b)	"A10 C103 910" 中的 "A10" 和 "910"
(?( name )yes \| no )	如果 name 或已命名或已編號的捕獲組具有匹配，則匹配yes；否則匹配可選的no。	(?< quoted>")?(?(quoted).+?"\|\S+\s)	"Dogs.jpg "Yiska playing.jpg"" 中的 Dogs.jpg 和 "Yiska playing.jpg"

替換

替換是替換模式中使用的正則表示式。

下表列出了用於替換的字元：

字元	描述	模式	替換模式	輸入字串	結果字串
$number	替換按組number匹配的子字串。	\b(\w+)(\s)(\w+)\b	$3$2$1	"one two"	"two one"
${name}	替換按命名組name匹配的子字串。	\b(?< word1>\w+)(\s)(?< word2>\w+)\b	${word2} ${word1}	"one two"	"two one"
$$	替換字元"$"。	\b(\d+)\s?USD	$$$1	"103 USD"	"$103"
$&	替換整個匹配項的一個副本。	(\$(\d(\.+\d+)?){1})	**$&	"$1.30"	"$1.30"
$`	替換匹配前的輸入字串的所有文字。	B+	$`	"AABBCC"	"AAAACC"
$'	替換匹配後的輸入字串的所有文字。	B+	$'	"AABBCC"	"AACCCC"
$+	替換最後捕獲的組。	B+(C+)	$+	"AABBCCDD"	AACCDD
$_	替換整個輸入字串。	B+	$_	"AABBCC"	"AAAABBCCCC"

雜項構造

下表列出了各種雜項構造：

構造	描述	例項
(?imnsx-imnsx)	在模式中間對諸如不區分大小寫這樣的選項進行設定或禁用。	\bA(?i)b\w+\b 匹配 "ABA Able Act" 中的 "ABA" 和 "Able"
(?#註釋)	內聯註釋。該註釋在第一個右括號處終止。	\bA(?#匹配以A開頭的單詞)\w+\b
#[行尾]	該註釋以非轉義的 # 開頭，並繼續到行的結尾。	(?x)\bA\w+\b#匹配以 A 開頭的單詞

Regex 類

Regex 類用於表示一個正則表示式。

下表列出了 Regex 類中一些常用的方法：

序號	方法 & 描述
1	public bool IsMatch( string input ) 指示 Regex 建構函式中指定的正則表示式是否在指定的輸入字串中找到匹配項。
2	public bool IsMatch( string input, int startat ) 指示 Regex 建構函式中指定的正則表示式是否在指定的輸入字串中找到匹配項，從字串中指定的開始位置開始。
3	public static bool IsMatch( string input, string pattern ) 指示指定的正則表示式是否在指定的輸入字串中找到匹配項。
4	public MatchCollection Matches( string input ) 在指定的輸入字串中搜索正則表示式的所有匹配項。
5	public string Replace( string input, string replacement ) 在指定的輸入字串中，把所有匹配正則表示式模式的所有匹配的字串替換為指定的替換字串。
6	public string[] Split( string input ) 把輸入字串分割為子字串陣列，根據在 Regex 建構函式中指定的正則表示式模式定義的位置進行分割。

如需瞭解 Regex 類的完整的屬性列表，請參閱微軟的 C# 文件。

例項 1

下面的例項匹配了以 'S' 開頭的單詞：

例項

using System;
using System.Text.RegularExpressions;

namespace RegExApplication
{
   class Program
   {
      private static void showMatch(string text, string expr)
      {
         Console.WriteLine("The Expression: " + expr);
         MatchCollection mc = Regex.Matches(text, expr);
         foreach (Match m in mc)
         {
            Console.WriteLine(m);
         }
      }
      static void Main(string[] args)
      {
         string str = "A Thousand Splendid Suns";

         Console.WriteLine("Matching words that start with 'S': ");
         showMatch(str, @"\bS\S*");
         Console.ReadKey();
      }
   }
}

當上面的程式碼被編譯和執行時，它會產生下列結果：

Matching words that start with 'S':
The Expression: \bS\S*
Splendid
Suns

例項 2

下面的例項匹配了以 'm' 開頭以 'e' 結尾的單詞：

例項

using System;
using System.Text.RegularExpressions;

namespace RegExApplication
{
   class Program
   {
      private static void showMatch(string text, string expr)
      {
         Console.WriteLine("The Expression: " + expr);
         MatchCollection mc = Regex.Matches(text, expr);
         foreach (Match m in mc)
         {
            Console.WriteLine(m);
         }
      }
      static void Main(string[] args)
      {
         string str = "make maze and manage to measure it";

         Console.WriteLine("Matching words start with 'm' and ends with 'e':");
         showMatch(str, @"\bm\S*e\b");
         Console.ReadKey();
      }
   }
}

當上面的程式碼被編譯和執行時，它會產生下列結果：

Matching words start with 'm' and ends with 'e':
The Expression: \bm\S*e\b
make
maze
manage
measure

例項 3

下面的例項替換掉多餘的空格：

例項

using System;
using System.Text.RegularExpressions;

namespace RegExApplication
{
   class Program
   {
      static void Main(string[] args)
      {
         string input = "Hello   World   ";
         string pattern = "\\s+";
         string replacement = " ";
         Regex rgx = new Regex(pattern);
         string result = rgx.Replace(input, replacement);

         Console.WriteLine("Original String: {0}", input);
         Console.WriteLine("Replacement String: {0}", result);    
         Console.ReadKey();
      }
   }
}

當上面的程式碼被編譯和執行時，它會產生下列結果：

Original String: Hello   World   
Replacement String: Hello World

C# 正則表示式進階

.NET 中的正則表示式是基於 Perl 5 的正則表示式。超時從 .NET Framework 4.5 開始，正則表示式支援在匹配操作中指定超時時間。如果匹配超時，就會丟擲 RegexMatchTimeoutException。

C# 正則表示式

目錄介紹例項刷題介紹例項 ^\\s*匹配開頭所有的空白字元 \\s*$匹配結尾所有空白字元

C++ 正則表示式<regex>

　　轉自WestwindrestC++正則表示式 <regex> 一簡介　　概括而言，使用正則表示式處理字串的流程包括：

C# 正則表示式大全

文章導讀正則表示式的本質是使用一系列特殊字元模式，來表示某一類字串。正則表示式無疑是處理文字最有力的工具，而.NET提供的Regex類實現了驗證正則表示式的方法。Regex 類表示不可變（只讀）的正則表示式。它還包

C# 正則表示式

C#正則表示式正則表示式是一種匹配輸入文字的模式。.Net 框架提供了允許這種匹配的正則表示式引擎。模式由一個或多個字元、運算子和結構組成。

C#正則表示式

usingSystem; usingSystem.Collections.Generic; usingSystem.Linq; usingSystem.Text; usingSystem.Threading.Tasks;

C#正則表示式如何取反結果，想要結果的反集

技術標籤：C# 如題，正則表示式如何取反結果，想要結果的反集。有人說用C#程式碼將結果取出來後，寫段程式碼迴圈排除一下，就是反集。嗯，是一個方法，就是不太靈光了些。

C# 正則表示式 —— 中文/英文空格（全形/半形空格）處理

1. 匹配中文（全形）空格 Regex.IsMatch(\"　\", \"\\u3000\"); \\u3000是全形空格的16進位制Unicode編碼。

C#正則表示式獲取table標籤內容

var rowHtml = \"<div class=\\\"container\\\"><div class=\\\"title dottedline\\\">查詢結果</div></div><div class=\\\"container\\\"><table class=\\\"gridtable\\\">&

c++正則表示式簡單總結

本文學習自C++與正則表示式入門 - RioTian (cnblogs.com) 1.regex_match 2.regex_search 3.regex_replace

C#正則表示式筆記

《C#字串和正則表示式參考手冊》正則表示式筆記：（1）“@”符號“@”雖然並非C#正則表示式的“成員”，但是它經常與C#正則表示式出雙入對。“@”表示，跟在它後面的字串是個“逐字字串”，不是很好理解，舉個例子，

C#正則表示式提取數字或大小寫字母【轉】

using System; using System.Text.RegularExpressions; namespace RegExApplication { class Program { static void Main(string[] args)

C# 正則表示式判斷電話號格式與字元替換

static void Main(string[] args) { string _reguler = @\"^(0755|0755-)\\d{7,8}$\";//正則表示式判斷電話格式輸入是否確

c++11中regex正則表示式示例簡述

regex庫中涉及到的主要型別有：以std::string為代表的處理字串的型別（我們知道還有儲存wchar_t的wstring類、原生c式字串const char*等等，為了簡化處理僅介紹std::string型別相關的操作，當你把握住了regex的主脈

C#中簡單的正則表示式

學習C#中簡單的正則表示式感謝千峰教育的學習視訊正則表示式：用來判斷某個字串是否匹配一定的格式

C# 利用正則表示式獲取富文字框中所有圖片路勁

直接上程式碼 1 public static string[] GetHtmlImageUrlList(string htmlText) 2{ 3Regex regImg = new Regex(@\"<img\\b[^<>]*?\\bsrc[\\s\\t\\r\\n]*=[\\s\\t\\r\\n]*[\"\"‘]?[\\s\\t\\r\\n]*(?<

C#（99）：正則表示式符號解釋

在 Visual Studio 中使用正則表示式 https://docs.microsoft.com/zh-cn/visualstudio/ide/using-regular-expressions-in-visual-studio?view=vs-2019

C++實現簡單的日期正則表示式

簡單的日期正則表示式一個簡單的日期解析程式，從yyyy-mm-dd格式的日期字串中，分別獲取年月日。

C++與正則表示式入門

什麼是正則表示式? 正則表示式是一組由字母和符號組成的特殊文字, 當你想要判斷許多字串是否符合某個特定格式；當你想在一大段文字中查找出所有的日期和時間；當你想要修改大量日誌中所有的時間格式，在這些情況下，

C#中常用的正則表示式

需要引用using System.Text.RegularExpressions; Regex r = new Regex(\"^\\\\s*([A-Za-z0-9_-]+(\\\\.\\\\w+)*@(\\\\w+\\\\.)+\\\\w{2,5})\\\\s*$\");

C# 正則表示式

C#正則表示式

定義正則表示式

字元轉義

字元類

定位點

分組構造

例項

限定符

反向引用構造

備用構造

替換

雜項構造

Regex 類

例項 1

例項

例項 2

例項

例項 3

例項

相關推薦