No.12 Python 中的正則表示式使用

阿新 • • 發佈：2018-12-26

1. Python中如何使用正則表示式

Python中使用正則表示式的步驟如下：

使用import re匯入正則表示式模組
使用re.compile()建立一個物件
使用Regex物件的search()方法，傳入一個字串，然後返回一個Match物件
呼叫Match物件的group()方法，返回文字中匹配該正則表示式的字串

示例如下,查詢學生姓名中姓Zhang的同學姓名

import re

namelist = "Li Ming;Zhang San;Fu yu;Guo Ji;Ren Jie;Zhang Lin;"
nameRegex = re.compile(r"Zhang\s\w+")
match = 
 nameRegex.search(namelist)
print(match.group())

結果如下：

Zhang San

上面的程式碼中，有幾個地方需要解釋一下：

re.compile(r"Zhang San\s\w+")在正則表示式的前面加了一個r，標識該字元為原始字串。因為，在Python中，轉義字元前面需要加\來標記，如果你需要在字串中打出\，那麼你需要使用\\，或者在字串的前面加入一個r來標記

r"Zhang San\s\w+" 和"Zhang San\\s\\w+"是等價的
search()函式匹配文字中第一個符合該字串的結果並返回一個Match物件，Match

物件的group()函式將返回被查詢到的實際文字。所以在上述結果中,我們僅得到Zhang San這個結果。如果你的正則表示式中含有分組(後續會講到)，你可以使用group(1), group(2)來查詢正則表示式中第一個，第二個分組的匹配結果。

2. 正則表示式的更多模式

1. 使用括號分組

假設，某地區的電話號碼的表示形式為123-456-7890的形式，且前三位為區號，後七位標識電話號，要求將從文字中同時獲取區號，電話號和整體的電話號碼。

程式碼和結果如下：

text = "My phone number is 455-789-1234"
pnRegex = re.compile(r"(\d\d\d)-(\d\d\d-\d\d\d\d)" 
)
match = pnRegex.search(text)
print(match.group())
print(match.group(1))
print(match.group(2))
print(match.groups())

結果如下：

455-789-1234
455
789-1234
(‘455’, ‘789-1234’)

group()預設傳入引數為0，即返回整個匹配的文字。如果想獲取全體分組的結果，使用groups()函式，該函式返回一個包含所有分組匹配結果的元組。

2. 使用管道匹配多個分組

字元|是正則表示式中的管道，用來匹配許多表達式中的一個。如果想匹配姓名列表中，姓Zhang的和姓Li的同學的姓名，可以使用管道|來連線多個正則表示式。

 namelist1 = "Li Ming;Zhang San;Fu yu;Guo Ji;Ren Jie;Zhang Lin;"
 namelist2 = "Zhang San;Fu yu;Guo Ji;Ren Jie;Zhang Lin;Li Ming;"
 nameRegex = re.compile(r"Zhang\s\w+|Li\s\w+")
 match1 = nameRegex.search(namelist1)
 print(match1.group())
 match2 = nameRegex.search(namelist2)
 print(match2.group())

結果如下：

Li Ming
Zhang San

3. 使用問號實現可選匹配

例如在之前的電話匹配中，我們希望即便有人省略區號，依然可以檢測出電話號碼。使用?來實現部分匹配的模式是可選的

text1 = "My phone number is 455-789-1234"
text2 = "My phone number is 789-1234"
pnRegex = re.compile(r"(\d\d\d-)?(\d\d\d-\d\d\d\d)")
match1 = pnRegex.search(text1)
print(match1.group())
match2 = pnRegex.search(text2)
print(match2.group())

結果如下：

455-789-1234
789-1234

4. 使用花括號匹配特定次數

假設現在我們有一串字串：

* *** ********** ** *** ****** ** ***** * ******* ***** **** ***** * *** * **

如果我們想匹配一下幾種情況：

恰好三個* 連在一起的，如***
少於等於三個* 連在一起的，如**,*
連在一起的*個數大於等於四，但是小於等於五
大於等於六個*連在一起的，如******

程式碼如下：

text = "* *** ********** ** **** ****** ** ***** * ******* ***** **** ***** * *** * **"
sRegex1 = re.compile(r"(\*){3}")
sRegex2 = re.compile(r"(\*){,3}")
sRegex3 = re.compile(r"(\*){4,5}")
sRegex4 = re.compile(r"(\*){6,}")
match1 = sRegex1.search(text)
match2 = sRegex2.search(text)
match3 = sRegex3.search(text)
match4 = sRegex4.search(text)
print(match1.group())
print(match2.group())
print(match3.group())
print(match4.group())

結果如下所示：

***
*
*****
**********

r"(\*){3}"中，(\*)表示匹配*型字元的分組。因為 *在正則表示式中表示匹配一個或多個，所以需要使用\進行轉義，表示字元 *

花括號{n,m}，表示前面的分組重複次數大於等於n次並且小於等於m次。m和n也可省略其中一個，表示大於等於n或者小於等於m。{n}表示分組恰好重複n次。

另外，可以看到，在被匹配的文字中，長度為4的字串****排在長度為5的字串***** 前面，但是程式碼查詢到的結果是*****，這是因為預設情況下正則表示式是貪婪地，花括號的貪婪版本會盡可能的匹配更長的字串。使用字元?可以宣告正則表示式為非貪心形式

text = "* *** ********** ** *** ****** **** ***** * ******* ***** **** ***** * *** * **"
sRegex1 = re.compile(r"(\*){4,5}")
match1 = sRegex1.search(text)
sRegex2 = re.compile(r"(\*){4,5}?")
match2 = sRegex2.search(text)
print(match1.group())
print(match2.group())

結果如下：

*****
****

5. findall()方法

re模組的findall()方法返回被匹配文字中的所有匹配到的結果。

之前提到的search() 僅返回文字中第一個匹配到的結果，方法返回一個Match物件，並呼叫Match物件的group()函式獲取匹配結果

findall()匹配文字中所有匹配的結果，並且返回一個所有結果的列表。如果正則表示式中有分組，那麼findall()將返回分組的列表

比如之前的電話號的正則表示式：

text = "My phone number is 455-789-1234,Lily's phone number is 110-101-1230 and Lucy's phone number is 789-456-1245"
pnRegex = re.compile(r"(\d\d\d)-(\d\d\d-\d\d\d\d)")
reslist = pnRegex.findall(text)
print(reslist)

結果如下：

[(‘455’, ‘789-1234’), (‘110’, ‘101-1230’), (‘789’, ‘456-1245’)]

6. sub()函式和compile()函式

前面我們使用了re.compile() 來構造特定正則表示式的Regex物件，compile()函式具體的簽名如下：

def compile(pattern, flags=0)

所以我們可以在compile()追加第二個引數，實現特定功能。

例如：檢索文字中所有的Alice詞語，不區分大小寫，程式碼如下

text = "Alice is aLice,aliCe,and ALIcE.But it's not Bob."
regex = re.compile("Alice", re.IGNORECASE)
res = regex.findall(text)
print(res)

結果如下所示：

[‘Alice’, ‘aLice’, ‘aliCe’, ‘ALIcE’]

flags`的其他引數如下：

引數	縮寫	用途
re.IGNORECASE	re.I	Perform case-insensitive matching.
re.LOCALE	re.L	Make \w, \W, \b, \B, dependent on the current locale.
re.MULTILINE	re.M	“^” matches the beginning of lines (after a newline) as well as the string. “$” matches the end of lines (before a newline) as well as the end of the string.
re.DOTALL	re.D	“.” matches any character at all, including the newline.
re.VERBOSE	re.X	Ignore whitespace and comments for nicer looking RE’s.
re.UNICODE	re.U	For compatibility only. Ignored for string patterns (it is the default), and forbidden for bytes patterns.

sub()函式可以用於替換正則表示式查詢到的字串。例如，我們將之前字串中所有的Alice的姓名隱藏：

text = "Alice is aLice,aliCe,ALIcE.But it's not Bob."
regex = re.compile(r"(A)(\w+)", re.IGNORECASE)
print(regex.sub(r'\1****',text))

結果如下所示：

A**** is a****,a****,A****.But it’s not Bob.

sub（）函式第一個引數是要替換為的字串，第二個引數是匹配的正則表示式。另外在sub()函式的第一個引數中，可以使用\1,\2 …來表示替換分組1,2…中的文字

正則表示式中的常用字元表，網上資源很多，這裡不再放出來。

P.S. 文章不足之處還望指正
參考書籍：《Python程式設計快速上手—讓繁瑣工作自動化》

Python中正則表示式re.match的用法

re.match(pattern, string, flags) 第一個引數是正則表示式,如果匹配成功，則返回一個Match，否則返回一個None；第二個引數表示要匹配的字串；第三個引數是標緻位，用於控制正則表示式的匹配方式，如：是否區分大小寫，多行匹配等等。需要特別注意的是，這個方法並不是完

Python中正則表示式常用函式sub,search,findall,split等使用

1.原生字串r python中字串前面加上 r 表示原生字串,不會轉義。與大多數程式語言相同，正則表示式裡使用"\"作為轉義字元，這就可能造成反斜槓困擾。假如你需要匹配文字中的字元"\"，那麼使用程式語言表示的正則表示式裡將需要4個反斜槓"\\"：前兩個和後兩個分別用於在程式語言裡轉義成反斜

Python中正則表示式對單個字元，多個字元，匹配邊界等使用

Regular Expression，正則表示式，又稱正規表示式、正規表示法、正則表示式、規則表示式、常規表示法（英語：Regular Expression，在程式碼中常簡寫為regex、regexp或RE），是電腦科學的一個概

python中正則表示式1

1.模式語言 1）任何字元只與其本身匹配 2）"."匹配任意字元 3）"*" 表示其前面那個字元可匹配0個或任意多個相同字元 4）"^"只匹配目標串的開頭 5）"$"只匹配目標串的結尾 2.原始字串定義:在常規字串前加上r或者R字首. r'd:\test\1.t

python中正則表示式的使用

正則表示式 python中需要使用正則表示式對字串進行匹配的時候，需要匯入re模組 #coding=utf-8 # 匯入re模組 import re # 使用match方法進行匹配操作 result = re.match(正

Python中正則表示式介紹

正則正則表通常是用來檢索、替換那些符合某個模式(規則)的文字。也就是說使用正則表示式可以在字串中匹配出你需要的字元或者字串，甚至可以替換你不需要的字元或者字串。正則（不是python特有的）匹配字串,其他語言也有正則表示式例項：需求：輸入字元，判斷字

python 中正則表示式用法 re.findall()

參考部落格原址：https://blog.csdn.net/YZXnuaa/article/details/79346963 <link rel="stylesheet" href="https://csdnimg.cn/relea

python中正則表示式庫re的使用（regex）

一、正則表示式庫的引用在python中，你要使用正則表示式，需要引用程式庫re。 import re 二、正則表示式函式說明： match =》嘗試在字串的開頭運用模式，返回一個match物件

Python中-正則表示式-說明

正則表示式: (regular expression) —>>>正則表示式是用來簡潔表達一組字串的表示式是一個描述字串模式的物件正則表示式主要用來驗證使用者的資料, 以及對文字內容的資訊過濾,獲取滿足條件的內容這樣做的好處是提高匹配效率,

No.12 Python 中的正則表示式使用

1. Python中如何使用正則表示式 Python中使用正則表示式的步驟如下：使用import re匯入正則表示式模組使用re.compile()建立一個物件使用Regex物件的search()方法，傳入一個字串，然後返回一個Match物件呼叫Mat

Python 用正則表示式一次替換文章中所有特殊符號，如“-,$()#+&*”之類

一個簡單的正則表示式，可能會起大作用。比如說字符集就是這樣。一篇文章如果有各種亂碼，就可以用這種方法去除。如去除“-,$()#+&*”之類符號是很方便的。按照查詢、分割、替換的套路再做一做這樣的練習。今天晚了，後續還要操作檔案來完善這一點。 import re

Python中正則表達式（re模塊）的使用

python中正則表達式Python中正則表達式（re模塊）的使用1、正則表達式的概述（1）概述：正則表達式是一些由字符和特殊符號組成的字符串，他們描述了模式的重復或者表示多個字符，正則表達式能按照某種模式匹配一系列有相似特征的字符串。正則表達式是一種小型的、高度的專業化的編程語言，（2）Python語言中的

python學習-正則表示式及re模塊

我只 com 返回現在輸出 -1 完全匹配 group clu python中的所有正則表達式函數都在re模塊中。import re導入該模塊。 1，創建正則表達式對象想re.compile()傳入一個字符串值，表示正則表達式，它將返回一個Regex模式對象。創建一

python中正則匹配字符配置單詞邊界不生效的解決辦法

re python duoceshi #-*-coding:utf-8-*-import rename="duoceshi"p= re.compile(‘\bduoceshi\b‘)f = p.search(name)if f: print f.group()################

python 中正則表達式的使用

定義重復 png expr color 事先正則表達式的使用轉義字符數字正則表達式的定義正則表達式（re）（Regular Expression）。正則表達式是對字符串操作的一種邏輯公式，就是用事先定義好的一些特定字符、及這些特定字符的組合，組成一個“規則字符串

python中正則表達式的一些問題

多次 eva family image 位數開心的人 rda span 今天聽到一句話，覺得很在理——"當你遇到一個問題，想到用正則表達式解決時，就變成了兩個問題" 這也從側面說明了正則表達式比較難理解。下面我將用通俗易懂的方式總結一下，最近遇到的一些正則表達式的問題

Python中正則匹配使用findall,捕獲分組(xxx)和非捕獲分組(?:xxx)的差異

bbb tps img 是把區別內容是我解答什麽是轉自：https://blog.csdn.net/qq_42739440/article/details/81117919 下面是我在用findall匹配字符串時遇到的一個坑，分享出來供大家跳坑。例題：如圖

php 中正則表示式詳解

概述正則表示式是一種描述字串結果的語法規則，是一個特定的格式化模式，可以匹配、替換、擷取匹配的字串。常用的語言基本上都有正則表示式，如JavaScript、java等。其實，只有瞭解一種語言的正則使用，其他語言的正則使用起來，就相對簡單些。文字主要圍繞解決下面問題展開。有哪些常用的

WPF中正則表示式的部分應用

無論在哪一種語言中，正則表示式在一定程度上都可以簡化程式碼程式設計。以下為在WPF中的部分應用。如var sql = new System.Text.RegularExpressions.Regex("[\\r\\n]").Replace(str, " "); 表示對str字串中匹配換行符

【轉】Python之正則表示式（re模組）

【轉】Python之正則表示式（re模組）本節內容 re模組介紹使用re模組的步驟 re模組簡單應用示例關於匹配物件的說明說說正則表示式字串前的r字首 re模組綜合應用例項參考文件提示：由於該站對MARKDOWN的表格支援的不是很好，所以本文中的表

No.12 Python 中的正則表示式使用

1. Python中如何使用正則表示式

2. 正則表示式的更多模式

1. 使用括號分組

2. 使用管道匹配多個分組

3. 使用問號實現可選匹配

4. 使用花括號匹配特定次數

5. findall()方法

6. sub()函式和compile()函式

相關推薦