Python正則表達式很難？一篇文章搞定他，不是我吹！

阿新 • • 發佈：2019-03-24

編譯返回特殊字符但是參數查找字符串 cas 行處理產生

1. 正則表達式語法

1.1 字符與字符類

1 特殊字符：.^$?+*{}|

以上特殊字符要想使用字面值，必須使用進行轉義

2 字符類

1. 包含在[]中的一個或者多個字符被稱為字符類，字符類在匹配時如果沒有指定量詞則只會匹配其中的一個。

2. 字符類內可以指定範圍，比如[a-zA-Z0-9]表示a到z，A到Z，0到9之間的任何一個字符

3. 左方括號後跟隨一個，表示否定一個字符類，比如[0-9]表示可以匹配一個任意非數字的字符。

4. 字符類內部，除了之外，其他特殊字符不再具備特殊意義，都表示字面值。放在第一個位置表示否定，放在其他位置表示本身，-放在中間表示範圍，放在字符類中的第一個字符，則表示-本身。

5. 字符類內部可以使用速記法，比如d s w

3 速記法

.可以匹配除換行符之外的任何字符，如果有re.DOTALL標誌，則匹配任意字符包括換行

d匹配一個Unicode數字，如果帶re.ASCII，則匹配0-9

D 匹配Unicode非數字

s匹配Unicode空白，如果帶有re.ASCII，則匹配中的一個

S 匹配Unicode非空白

w匹配Unicode單詞字符，如果帶有re.ascii,則匹配[a-zA-Z0-9_]中的一個

W 匹配Unicode非單子字符

1.2 量詞

1. ?匹配前面的字符0次或1次

2. *匹配前面的字符0次或多次

3. +匹配前面的字符1次或者多次

4. {m}匹配前面表達式m次

5. {m,}匹配前面表達式至少m次

6. {,n}匹配前面的正則表達式最多n次

7. {m,n}匹配前面的正則表達式至少m次，最多n次

註意點：

以上量詞都是貪婪模式，會盡可能多的匹配，如果要改為非貪婪模式，通過在量詞後面跟隨一個?來實現

1.3 組與捕獲

1 ()的作用：

1. 捕獲()中正則表達式的內容以備進一步利用處理，可以通過在左括號後面跟隨?:來關閉這個括號的捕獲功能

2. 將正則表達式的一部分內容進行組合，以便使用量詞或者|

2 反響引用前面()內捕獲的內容：

1. 通過組號反向引用

每一個沒有使用?:的小括號都會分配一個組好，從1開始，從左到右遞增，可以通過i引用前面()內表達式捕獲的內容

2. 通過組名反向引用前面小括號內捕獲的內容

可以通過在左括號後面跟隨?P<name>,尖括號中放入組名來為一個組起一個別名，後面通過(?P=name)來引用前面捕獲的內容。如(? P<word>w+)s+(?P=word)來匹配重復的單詞。

3 註意點：

反向引用不能放在字符類[]中使用。

1.4 斷言與標記

斷言不會匹配任何文本，只是對斷言所在的文本施加某些約束

1 常用斷言：

1. 匹配單詞的邊界，放在字符類[]中則表示backspace

2. B 匹配非單詞邊界，受ASCII標記影響

3. A 在起始處匹配

4. ^在起始處匹配，如果有MULTILINE標誌，則在每個換行符後匹配

5. Z 在結尾處匹配

6. $在結尾處匹配，如果有MULTILINE標誌，則在每個換行符前匹配

7. (?=e)正前瞻

8. (?!e)負前瞻

9. (?<=e)正回顧

10.(?<!e)負回顧

2 前瞻回顧的解釋

前瞻： exp1(?=exp2) exp1後面的內容要匹配exp2

負前瞻: exp1(?!exp2) exp1後面的內容不能匹配exp2

後顧: (?<=exp2)exp1 exp1前面的內容要匹配exp2

負後顧: (?<!exp2)exp1 exp1前面的內容不能匹配exp2

例如：我們要查找hello，但是hello後面必須是world，正則表達式可以這樣寫："(hello)s+(?=world)",用來匹配"hello wangxing"和"hello world"只能匹配到後者的hello

1.5 條件匹配

(?(id)yes_exp|no_exp):對應id的子表達式如果匹配到內容，則這裏匹配yes_exp，否則匹配no_exp

1.6 正則表達式的標誌

1. 正則表達式的標誌有兩種使用方法

1. 通過給compile方法傳入標誌參數，多個標誌使用|分割的方法,如re.compile(r"#[da-f]{6}", re.IGNORECASE|re.MULTILINE)

2. 通過在正則表達式前面添加(?標誌)的方法給正則表達式添加標誌，如(?ms)#[da-z]{6}

2. 常用的標誌

re.A或者re.ASCII，使 B s S w W d D都假定字符串為假定字符串為ASCII

re.I或者re.IGNORECASE使正則表達式忽略大小寫

re.M或者re.MULTILINE 多行匹配，使每個^在每個回車後，每個$在每個回車前匹配

re.S或者re.DOTALL 使.能匹配任意字符，包括回車

re.X或者re.VERBOSE 這樣可以在正則表達式跨越多行，也可以添加註釋，但是空白需要使用s或者[ ]來表示，因為默認的空白不再解釋。如：

2. Python正則表達式模塊

2.1 正則表達式處理字符串主要有四大功能

1. 匹配查看一個字符串是否符合正則表達式的語法，一般返回true或者false

2. 獲取正則表達式來提取字符串中符合要求的文本

3. 替換查找字符串中符合正則表達式的文本，並用相應的字符串替換

4. 分割使用正則表達式對字符串進行分割。

2.2 Python中re模塊使用正則表達式的兩種方法

1. 使用re.compile(r, f)方法生成正則表達式對象，然後調用正則表達式對象的相應方法。這種做法的好處是生成正則對象之後可以多次使用。

2. re模塊中對正則表達式對象的每個對象方法都有一個對應的模塊方法，唯一不同的是傳入的第一個參數是正則表達式字符串。此種方法適合於只使用一次的正則表達式。

2.3 正則表達式對象的常用方法

1. rx.findall(s,start, end):

返回一個列表，如果正則表達式中沒有分組，則列表中包含的是所有匹配的內容，

如果正則表達式中有分組，則列表中的每個元素是一個元組，元組中包含子分組中匹配到的內容，但是沒有返回整個正則表達式匹配的內容

2. rx.finditer(s, start, end):

返回一個可叠代對象

對可叠代對象進行叠代，每一次返回一個匹配對象，可以調用匹配對象的group()方法查看指定組匹配到的內容，0表示整個正則表達式匹配到的內容

3. rx.search(s, start, end):

返回一個匹配對象,倘若沒匹配到，就返回None

search方法只匹配一次就停止，不會繼續往後匹配

4. rx.match(s, start, end):

如果正則表達式在字符串的起始處匹配，就返回一個匹配對象，否則返回None

5. rx.sub(x, s, m):

返回一個字符串。每一個匹配的地方用x進行替換，返回替換後的字符串，如果指定m，則最多替換m次。對於x可以使用/i或者/g<id>id可以是組名或者編號來引用捕獲到的內容。

模塊方法re.sub(r, x, s, m)中的x可以使用一個函數。此時我們就可以對捕獲到的內容推過這個函數進行處理後再替換匹配到的文本。

6. rx.subn(x, s, m):

與re.sub()方法相同，區別在於返回的是二元組，其中一項是結果字符串，一項是做替換的個數。

7. rx.split(s, m):分割字符串

返回一個列表

用正則表達式匹配到的內容對字符串進行分割

如果正則表達式中存在分組，則把分組匹配到的內容放在列表中每兩個分割的中間作為列表的一部分，如：

8. rx.flags():正則表達式編譯時設置的標誌

9. rx.pattern():正則表達式編譯時使用的字符串

2.4 匹配對象的屬性與方法

01. m.group(g, ...)

返回編號或者組名匹配到的內容，默認或者0表示整個表達式匹配到的內容，如果指定多個，就返回一個元組

02. m.groupdict(default)

返回一個字典。字典的鍵是所有命名的組的組名，值為命名組捕獲到的內容

如果有default參數，則將其作為那些沒有參與匹配的組的默認值。

03. m.groups(default)

返回一個元組。包含所有捕獲到內容的子分組，從1開始，如果指定了default值，則這個值作為那些沒有捕獲到內容的組的值

04. m.lastgroup()

匹配到內容的編號最高的捕獲組的名稱，如果沒有或者沒有使用名稱則返回None(不常用)

05. m.lastindex()

匹配到內容的編號最高的捕獲組的編號，如果沒有就返回None。

06. m.start(g):

當前匹配對象的子分組是從字符串的那個位置開始匹配的,如果當前組沒有參與匹配就返回-1

07. m.end(g)

當前匹配對象的子分組是從字符串的那個位置匹配結束的，如果當前組沒有參與匹配就返回-1

08. m.span()

返回一個二元組，內容分別是m.start(g)和m.end(g)的返回值

09. m.re()

產生這一匹配對象的正則表達式

10. m.string()

傳遞給match或者search用於匹配的字符串

11. m.pos()

搜索的起始位置。即字符串的開頭，或者start指定的位置(不常用)

12. m.endpos()

搜索的結束位置。即字符串的末尾位置，或者end指定的位置(不常用)

2.5 總結

1. 對於正則表達式的匹配功能，Python沒有返回true和false的方法，但可以通過對match或者search方法的返回值是否是None來判斷

2. 對於正則表達式的搜索功能，如果只搜索一次可以使用search或者match方法返回的匹配對象得到，對於搜索多次可以使用finditer方法返回的可叠代對象來叠代訪問

3. 對於正則表達式的替換功能，可以使用正則表達式對象的sub或者subn方法來實現，也可以通過re模塊方法sub或者subn來實現，區別在於模塊的sub方法的替換文本可以使用一個函數來生成

4. 對於正則表達式的分割功能，可以使用正則表達式對象的split方法，需要註意如果正則表達式對象有分組的話，分組捕獲的內容也會放到返回的列表中

Python正則表達式很難？一篇文章搞定他，不是我吹！

編譯返回特殊字符但是參數查找字符串 cas 行處理產生 1. 正則表達式語法 1.1 字符與字符類 1 特殊字符：.^$?+*{}| 以上特殊字符要想使用字面值，必須使用進行轉義 2 字符類 1. 包含在[]中的一個或者多個字符被稱為字符類，字符類在匹

Python 正則表達式入門（初級篇）

-name regex sna per 級別腦洞現在裏的改變 Python 正則表達式入門（初級篇） Python 正則表達式入門（初級篇）本文主要為沒有使用正則表達式經驗的新手入門所寫。轉載請寫明出處引子首先

Python正則表達式（一）

成功 fin 全部 dal 出現元組叠代器所有函數 match(pattern,string,flag=0) 匹配成功就返回匹配對象，匹配失敗就返回None。 search(pattern,string,flag=0) 在字符串中搜索第一次出現的正則表達式

python-正則表達式練習題一

標識 sin woe mat python2 完整地址開頭自己 1、匹配一行文字中的所有開頭的字母內容 #coding=utf-8 import re s="i love you not because of who you are, but because

超詳細Python正則表達式操作指南(re使用)，一

恢復類別這也 inline cti 防止 lib 解釋事物 Python 自1.5版本起增加了re 模塊，它提供 Perl 風格的正則表達式模式。Python 1.5之前版本則是通過 regex 模塊提供 Emecs 風格的模式。Emacs 風格模式可讀性稍差些，而且

Python正則表達式之findall疑點

div 表達 clas 例子表達式如何實現如何正則表達式正則表達在findall中使用()進行分組時，得出的結果會優先提取分組的，比如下面這個例子 1 In [46]: re.findall(r"www.(baidu|163).com", "www.baidu

Python-正則表達式1

findall 模型一個 re模塊相關結束 eight 第一個 () Python中的re模塊提供了正則表達式相關操作。字符：　　. 匹配除換行符以外的任意字符　　\w 匹配字母或數字或下劃線或漢字　　\s 匹配任意的空白符　　\d 匹配數字　　\b 匹配單詞

python-正則表達式

模式不改變字符串 ont aid 返回集合匹配字符串內容使用正則表達式時，需要導入包，import re ,簡單使用如下：匹配字符串的幾個方法 match :從第一個單詞開始匹配，若匹配成功，則返回一個對象；若沒有匹配數據，則返回None import re

python正則表達式

表達式 {} spa 執行 color dal 表達 pri 則表達式元字符 . ^ $ * + ? {} [] | () \ . 匹配除換號符以為的任意一個符號 ret=re.findall(‘李.‘,‘李傑，李剛，王超，占山，李蓮英‘) print(ret) 執行結

Day 26 python 正則表達式

int print highlight -a 斜杠數量反斜杠 find 空格 re模塊\正則表達式一、元字符 1、. ^ $ * + ? { } [ ] | ( ) \ "."　　代表（任意一個字符） "*"　　代表（任意數量任意字符，0-無窮） "+"

Python正則表達式小結(1)

img src ack ont vba 第一個 xxxxx rgb family 學習一段python正則表達式了，對match、search、findall、finditer等函數作一小結以下以一段網頁為例，用python正則表達式作一個範例：

Python正則表達式（二）

發生 sub pre 則表達式正則表達式 str1 blog 回發 clas sub()和subn() sub(pattern,repl,string,count=0) 用於實現搜索和替換功能，使用repl替換所有正則表達式的模式在字符串中出現的位置，除非定義co

[ Python ] 正則表達式（1）

solid lnp 額外 spl 字符正則 -s bject 正則表達 [ Python ] 正則表達式（1）概念區分：搜索 ( Search ) 和匹配 ( Match ) from re import search, match search("nana"

Python正則表達式------進階

指定表達得到表示關閉標點符號 one 下劃線小寫 Python正則表達式正則表達式是一個特殊的字符序列，它能幫助你方便的檢查一個字符串是否與某種模式匹配。 Python 自1.5版本起增加了re 模塊，它提供 Perl 風格的正則表達式

Python正則表達式模塊re

身份證號碼 cas 返回 eight pri 經典增加為什麽有用介紹正則表達式是用來簡介表達一組字符串的表達式，是一種通用的字符串表達框架。正則表達式是一種正對字符串表達“簡潔”和“特征”思想的工具，正則表達式

jmeter 正則表達式學習（一）

特定 post 隨機 align pro pos 英文第一個 cnblogs jmeter自帶後置處理器：正則表達式提取器，可以用來提取接口響應裏的信息，給予後續接口傳參用。例如要提取響應結果裏的token字段及sex字段（響應內容為： "token":"83EE

Python -- 正則表達式

可選 print 完整一次分享則表達式參數 col 掃描 Python -- 正則表達式正則表達式是一個特殊的字符序列，它能幫助你方便的檢查一個字符串是否與某種模式匹配。 Python 自1.5版本起增加了re 模塊，它提供 Perl 風格的正則表達式模式。

python正則表達式匹配十六進制數據

fin phy decimal 進制 ref check 十六 http ffi 1. Find any hexadecimal number in a larger body of text \b[0-9a-fA-F]+\b 2. Check whether a

【轉】【Python】Python正則表達式使用指導

poi 相關信息 repl 模塊 compile 直接 live 單詞 d+ 1. 正則表達式基礎 1.1. 簡單介紹正則表達式並不是Python的一部分。正則表達式是用於處理字符串的強大工具，擁有自己獨特的語法以及一個獨立的處理引擎，效率上可能不如str自帶的方法，但功

Python 正則表達式

返回 art -i study 單個配對 kkk sub() ear 1.正則表達式基本概念背景我們要匹配以xxx開頭的字符串、xxx結尾的字符串等時，每一次匹配都要單獨寫一個函數或語句來完成，正則表達式就是將匹配的方法抽象成一個規則，然後使用這個規則來進行文本或數據

Python正則表達式很難？一篇文章搞定他，不是我吹！

1. 正則表達式語法

2. Python正則表達式模塊

相關推薦