python正則表示式最詳解

阿新 • • 發佈：2021-11-05

一、正則表示式–元字元

re 模組使語言擁有全部的正則表示式功能

在這裡插入圖片描述

1. 數量詞

# 提取大小寫字母混合的單詞
import re
a = 'Excel 12345Word23456PPT12Lr'
r = re.findall('[a-zA-Z]{3,5}',a)
# 提取字母的數量3個到5個
print(r)
# ['Excel','Word','PPT']
# 貪婪 與 非貪婪  【Python預設使用貪婪模式】
# 貪婪：'[a-zA-Z]{3,5}'
# 非貪婪：'[a-zA-Z]{3,5}?' 或 '[a-zA-Z]{3}'
# 建議使用後者，不要使用?號，否則你會與下面的?號混淆
# 匹配0次或無限多次 *號，*號前面的字元出現0次或無限次
import re
a = 'exce0excell3excel3'
r = re.findall('excel*',a)
r = re.findall('excel.*',a) # ['excell3excel3']
# excel 沒有l 有很多l都可以匹配出來
print(r)
# ['exce', 
'excell','excel']
# 匹配1次或者無限多次 +號，+號前面的字元至少出現1次
import re
a = 'exce0excell3excel3'
r = re.findall('excel+',a)
print(r)
# ['excell','excel']
# 匹配0次或1次  ?號，?號經常用來去重複
import re
a = 'exce0excell3excel3'
r = re.findall('excel?',a)
print(r)
# ['exce','excel','excel']

2. 字元匹配

在這裡插入圖片描述

line = 'xyz,xcz.xfc.xdz,xaz,xez,xec'
r = re.findall('x[de]z',line)
# pattern 是x開始，z結束，含d或e
print(r)
# ['xdz','xez']
r = re.findall('x[^de]z',line)
# pattern 是x開始，z結束，不是含d或e
print(r)
# ['xyz','xcz','xaz']

# \w 可以提取中文，英文，數字和下劃線，不能提取特殊字元
import re
a = 'Excel 12345Word\n23456_PPT12lr'
r = re.findall('\w',a)
print(r)
# ['E','x','c','e','l','1','2','3','4','5','W','o','r','d','6','_','P','T','r']
# \W 提取特殊字元，空格 \n \t
import re
a = 'Excel 12345Word\n23456_PPT12lr'
r = re.findall('\W',a)
print(r)
# [' ','\n']

3. 邊界匹配

在這裡插入圖片描述

# 限制電話號碼的位置必需是8-11位才能提取
import re
tel = '13811115888'
r = re.findall('^\d{8,11}$',tel)
print(r)
# ['13811115888']

4. 組

# 將abc打成一個組，{2}指的是重複幾次，匹配abcabc
import re
a = 'abcabcabcxyzabcabcxyzabc'
r = re.findall('(abc){2}',a)  # 與
# ['abc','abc']
print(r)
r = re.findall('(abc){3}',a)
# ['abc']

5. 匹配模式引數

在這裡插入圖片描述

# findall第三引數 re.I忽略大小寫
import re
a = 'abcFBIabcCIAabc'
r = re.findall('fbi',a,re.I)
print(r)
# ['FBI']
# 多個模式之間用 | 連線在一起
import re
a = 'abcFBI\nabcCIAabc'
r = re.findall('fbi.{1}',re.I | re.S)
# 匹配fbi然後匹配任意一個字元包括\n
print(r)
# ['FBI\n']

二、方法

re.findall

匹配出字串中所有與制定值相關的值
以列表的形式返回
未匹配則返回空列表

import re
re.findall(pattern,string,flags=0)
pattern.findall(string[,pos[,endpos]])

import re
line = "111aaabbb222小呼嚕奧利奧"
r = re.findall('[0-9]',line)
print(r)
# ['1','1客棧','2']

re.match

re.match 嘗試從字串的起始位置匹配一個模式
如果不是起始位置匹配成功的話，match()就返回none。

re.match(pattern,flags=0)
# (標準，要匹配的，標誌位)

print(re.match('www','www.xxxx.com'))
print(re.match('www','www.xxxx.com').span())
print(re.match('com','www.xxxx.com'))

<re.Match object; span=(0,3),match='www'>
(0,3)
None

group匹配物件

import re
a = 'life is short,i use python,i love python'
r = re.search('life(.*)python(.*)python',a)
print(r.group(0))       # 完整正則匹配 ，life is short,i love python
print(r.group(1))       # 第1個分組之間的取值 is short,i use 
print(r.group(2))       # 第2個分組之間的取值,i love 
print(r.group(0,1,2)) # 以元組形式返回3個結果取值 ('life is short,i love python',' is short,i use ',',i love ')
print(r.groups())       # 返回就是group(1)和group(2) (' is short,i love ')

import re
# .*        表示任意匹配除換行符（\n、\r）之外的任何單個或多個字元
# (.*?)     表示"非貪婪"模式，只儲存第一個匹配到的子串
# re.M      多行匹配，影響 ^ 和 $
# re.I      使匹配對大小寫不敏感
line = "Cats are smarter than dogs"
matchObj1 = re.match(r'(.*) are (.*?) .*',line,re.M|re.I)
matchObj2 = re.match(r'(.*) smarter (.*?) .*',re.M|re.I)
matchObj3 = re.match(r'(.*) than (.*)',re.M|re.I)
print(matchObj1)
print(matchObj2)
print(matchObj3)
# <re.Match object; span=(0,26),match='Cats are smarter than dogs'>
# <re.Match object; span=(0,match='Cats are smarter than dogs'>
# None
if matchObj1:
   print ("matchObj1.group() : ",matchObj1.group())
   print ("matchObj1.group(1) : ",matchObj1.group(1))
   print ("matchObj1.group(2) : ",matchObj1.group(2))
else:
   print ("No match!!")
if matchObj2:
   print ("matchObj2.group() : ",matchObj2.group())
   print ("matchObj2.group(1) : ",matchObj2.group(1))
   print ("matchObj2.group(2) : ",matchObj2.group(2))
else:
   print ("No match!!")
if matchObj3:
   print ("matchObj3.group() : ",matchObj3.group())
   print ("matchObj3.group(1) : ",matchObj3.group(1))
   print ("matchObj3.group(2) : ",matchObj3.group(2))
else:
   print ("No match!!")
# matchObj1.group() :  Cats are smarter than dogs
# matchObj1.group(1) :  Cats
# matchObj1.group(2) :  smarter
# matchObj2.group() :  Cats are smarter than dogs
# matchObj2.group(1) :  Cats are
# matchObj2.group(2) :  than
# matchObj3.group() :  Cats are smarter than dogs
# matchObj3.group(1) :  Cats are smarter
# matchObj3.group(2) :  dogs

import re
# 點 是匹配單個字元
# 星是前面的東西出現0次或無數次
# 點星就是任意字元出現0次或無數次
str = "a b a b"
matchObj1 = re.match(r'a(.*)b',str,re.M|re.I)
matchObj2 = re.match(r'a(.*?)b',re.M|re.I)
print("matchObj1.group() : ",matchObj1.group())
print("matchObj2.group() : ",matchObj2.group())
# matchObj1.group() :  a b a b
# matchObj2.group() :  a b

re.search

掃描整個字串並返回第一個成功的匹配。

re.search(pattern,flags=0)

import  re
line = "cats are smarter than dogs"
matchObj = re.match(r'dogs',re.M|re.I)
matchObj1= re.search(r'dogs',re.M|re.I)
matchObj2= re.match(r'(.*) dogs',re.M|re.I)
if matchObj:
   print ("match --> matchObj.group() : ",matchObj.group())
else:
   print ("No match!!")
if matchObj1:
   print ("match --> matchttp://www.cppcns.comhObj1.group() : ",matchObj1.group())
else:
   print ("No match!!")
if matchObj2:
   print ("match --> matchO程式設計客棧bj2.group() : ",matchObj2.group())
else:
   print ("No match!!")
# No match!!
# match --> matchObj1.group() :  dogs
# match --> matchObj2.group() :  cats are smarter than dogs

re.compile

re.compile是將正則表示式轉換為模式物件
這樣可以更有效率匹配。使用compile轉換一次之後，以後每次使用模式時就不用進行轉換

三、檢索和替換

re.sub 替換字串

re.sub('被替換的','替換成的',a)

# 把FBI替換成BBQ
import re
a = 'abcFBIabcCIAabc'
r = re.sub('FBI','BBQ',a)
print(r)
# 把FBI替換成BBQ，第4引數寫1，證明只替換第一次，預設是0（無限替換）
import re
a = 'abcFBIabcFBIaFBICIAabc'
r = re.sub('FBI',1)
print(r)
# abcBBQabcCIAabc
# abcBBQabcFBIaFBICIAabc

# 把函式當引數傳到sub的列表裡，實現把業務交給函式去處理，例如將FBI替換成$FBI$
import re
a = 'abcFBIabcFBIaFBICIAabc'
def 函式名(形參):
    分段獲取 = 形參.group()           # group（）在正則表示式中用於獲取分段截獲的字串，獲取到FBI
    return '$' + 分段獲取 + '$'
r = re.sub('FBI',函式名,a)
print(r)

總結

本篇文章就到這裡了，希望能夠給你帶來幫助，也希望您能夠多多關注我們的更多內容！

python正則表示式最詳解

目錄一、正則表示式–元字元1. 數量詞2. 字元匹配3. 邊界匹配4. 組5. 匹配模式引數二、方法re.findallre.matchgroup匹配物件re.searchre.compile三、檢索和替換re.sub 替換字串總結一、正則表示式–元字元

javascript中正則表示式語法詳解

　　好久都沒有寫部落格了，主要是太懶了，尤其是在陽春三月，風和日麗的日子，太陽暖暖的照在身上，真想美美的睡上一覺。就導致了這篇部落格拖到現在才開始動筆，javascript的正則這一塊也不是什麼新的東西，主要是

Shell指令碼之——正則表示式的詳解

一、正則表示式 1.1 什麼是正則表示式正則表示式(regular expression)描述了一種字串匹配的模式（pattern），可以用來檢查一個串是否含有某種子串、將匹配的子串替換或者從某個串中取出符合某個條件的子串等。在Li

正則表示式用法詳解

正則表示式之基本概念在我們寫頁面時，往往需要對錶單的資料比如賬號、身份證號等進行驗證，而最有效的、用的最多的便是使用正則表示式來驗證。那什麼是正則表示式呢？

python 正則表示式引數替換例項詳解

正則表示式是一個特殊的字元序列，它能幫助你方便的檢查一個字串是否與某種模式匹配。

python 正則表示式詳解

　正則表示式是一個很強大的字串處理工具，幾乎任何關於字串的操作都可以使用正則表示式來完成，作為一個爬蟲工作者，每天和字串打交道，正則表示式更是不可或缺的技能，正則表示式的在不同的語言中使用方式可能不一

Python正則表示式的應用詳解

目錄正則表示式的定義對正則表示式的支援示例例1：驗證輸入的使用者名稱是否有效，使用者名稱由長度為6到20的字母、數字、下劃線組成例2：從字串中找到與正則表示式匹配的部分例3：從上獲取新聞的標題和連結例4：不良

python正則表示式查詢和替換內容的例項詳解

1、編寫正則表示式字串s。 2、使用re.compile將正則表達www.cppcns.com式編譯成正則物件Patternp。

Python正則表示式：最短匹配

目錄[-] 最短匹配應用於：假如有一段文字，你只想匹配最短的可能，而不是最長。

Python正則表示式匹配字串中的數字

1.使用“\\d+”匹配全數字程式碼： import re zen = \"Arizona 479,501,870. Carlifornia 209,213,650.\"

python 正則表示式語法學習筆記

正則表示式(regular expression)描述了一種字串匹配的模式（pattern），可以用來檢查一個串是否含有某種子串、將匹配的子串替換或者從某個串中取出符合某個條件的子串等。

Python正則表示式學習小例子

正則表示式是處理字串的強大工具。作為一個概念而言，正則表示式對於Python來說並不是獨有的。但是，Python中的正則表示式在實際使用過程中還是有一些細小的差別。

python正則表示式例項程式碼

re 模組使 Python 語言擁有全部的正則表示式功能。會用到的語法正則字元釋義

學會Python正則表示式，就看這20個例子(指令碼之家修正版)

一文秒懂python正則表示式常用函式

導讀：正則表示式是處理字串型別的\"核武器\"，不僅速度快，而且功能強大。本文不過多展開正則表示式相關語法，僅簡要介紹 python中正則表示式常用函式及其使用方法，以作快速查詢瀏覽。

Python正則表示式如何匹配中文

用 \'[\\u4e00-\\u9fa5]‘ 匹配中文在字串中匹配中文示例：匹配字串中的第一個中文字元

Python正則表示式高階使用方法彙總

正則表示式是一個以簡單直觀的方式匹配指定文字資訊從而達到查詢、替換等操作的目的。正則表示式以其簡單而高效的特點使得其在資料分析和資料驗證方面應用廣泛。

python正則表示式的懶惰匹配和貪婪匹配說明

第一次碰到這個問題的時候，確實不知道該怎麼辦，後來請教了一個大神，加上自己的理解，才瞭解是什麼意思，這個東西寫python的會經常用到，而且會特別頻繁，在此寫一篇部落格，希望可以幫到一些朋友。

一文搞定Python正則表示式

本文對正則表示式和Python中的re模組進行詳細講解很多人學習python，不知道從何學起。很多人學習python，掌握了基本語法過後，不知道在哪裡尋找案例上手。很多已經做案例的人，卻不知道如何去學習更加高深的知識。那

python正則表示式

python正則表示式 1. 正則表示式基礎 1.1. 簡單介紹正則表示式並不是Python的一部分。正則表示式是用於處理字串的強大工具，擁有自己獨特的語法以及一個獨立的處理引擎，效率上可能不如str自帶的方法，但功能十分

python正則表示式最詳解

目錄

一、正則表示式–元字元

1. 數量詞

2. 字元匹配

3. 邊界匹配

4. 組

5. 匹配模式引數

二、方法

re.findall

re.match

group匹配物件

re.search

re.compile

三、檢索和替換

re.sub 替換字串

總結

相關推薦