正則表示式(python3-re模組示例）

阿新 • • 發佈：2018-11-16

1.常用的正則表示式

'.'     預設匹配除\n之外的任意一個字元，若指定flag DOTALL,則匹配任意字元，包括換行
'^'     匹配字元開頭，若指定flags MULTILINE,這種也可以匹配上(r"^a","\nabc\neee",flags=re.MULTILINE)
'$'     匹配字元結尾， 若指定flags MULTILINE ,re.search('foo.$','foo1\nfoo2\n',re.MULTILINE).group() 會匹配到foo1
'*'     匹配*號前的字元0次或多次， re.search('a*','aaaabac')  結果' 
aaaa'
'+'     匹配前一個字元1次或多次，re.findall("ab+","ab+cd+abb+bba") 結果['ab', 'abb']
'?'     匹配前一個字元1次或0次 ,re.search('b?','alex').group() 匹配b 0次
'{m}'   匹配前一個字元m次 ,re.search('b{3}','alexbbbs').group()  匹配到'bbb'
'{n,m}' 匹配前一個字元n到m次，re.findall("ab{1,3}","abb abc abbcbbb") 結果'abb', 'ab', 'abb']
'|'     匹配|左或|右的字元，re.search(" 
abc|ABC","ABCBabcCD").group() 結果'ABC'
'(...)' 分組匹配， re.search("(abc){2}a(123|45)", "abcabca456c").group() 結果為'abcabca45' 

'\A'    只從字元開頭匹配，re.search("\Aabc","alexabc") 是匹配不到的，相當於re.match('abc',"alexabc") 或^
'\Z'    匹配字元結尾，同$ 
'\d'    匹配數字0-9
'\D'    匹配非數字
'\w'    匹配[A-Za-z0-9]
'\W'    匹配非[A-Za-z0-9]
' 
s'     匹配空白字元、\t、\n、\r , re.search("\s+","ab\tc1\n3").group() 結果 '\t'
'(?P<name>...)' 分組匹配

2.re模組

re.match(pattern, string[, flags]) 從頭開始匹配
re.search(pattern, string[, flags]) 匹配包含
re.findall(pattern, string) 把所有匹配到的字元放到以列表中的元素返回
re.split(pattern, string[, maxsplit=0) 以匹配到的字元當做列表分隔符
re.sub(pattern, replace, string[, count=0] 匹配字元並替換
re.fullmatch 全部匹配

2.1 簡單例子

>>> import re
>>> s = 'abc1d3e'

re.match

>>> print(re.match('[0-9]', s))
None
>>> re.match('[0-9]', '1bdfd')
<_sre.SRE_Match object; span=(0, 1), match='1'>

re.search

>>> re.search('[0-9]', s)
<_sre.SRE_Match object; span=(3, 4), match='1'>

>>> re.search('[0-9]', s).group()
'1'

# span是類似於切片的索引

re.findall

>>> re.findall('[0-9]', s)
['1', '3']

re.split

>>> re.split('d', s)
['abc1', '3e']>>> s2 = 'alex99jack88rain77jinxin50'
>>> re.split('\d+', s2)
['alex', 'jack', 'rain', 'jinxin', '']

re.findall

>>> s1 = 'aabbaa123'
>>> re.findall('a', s1)
['a', 'a', 'a', 'a']

>>> re.findall('\d+', s2)
['99', '88', '77', '50']

re.sub

>>> re.sub('a', 'c', s1)
'ccbbcc123'

3.其他正則表示式

分組匹配

>>> import re
>>> s='alex123'
>>> re.search('([a-z]+)([0-9]+)', s).group()
('alex123')
>>> re.search('([a-z]+)([0-9]+)', s).groups()
('alex', '123')

>>> re.search('\d', s)
<_sre.SRE_Match object; span=(4, 5), match='1'>
>>> re.search('\d+', s)
<_sre.SRE_Match object; span=(4, 7), match='123'>

>>> re.search('\D+', s)
<_sre.SRE_Match object; span=(0, 4), match='alex'>

另外一種分組匹配

>>> s1 = '130704200005250613'
>>> re.search('(?P<province>\d{3})(?P<city>\d{3})(?P<born_year>\d{4})', s1).groupdict()
{'province': '130', 'city': '704', 'born_year': '2000'}

複雜一點的re.sub

>>> re.sub('\d+','_', s3)
'alex_jack_rain_\\jinxin_|mac-oldboy'
>>> re.sub('\d+','_', s3, count=2)
'alex_jack_rain77\\jinxin50|mac-oldboy'

re.split

>>> s2 = 'alex99jack88rain77jinxin50#mac-oldboy'
>>> re.split('\d+|#|-', s2)
['alex', 'jack', 'rain', 'jinxin', '', 'mac', 'oldboy']
>>> s4 = '9-2*5/3+7\3*99/4*2998+10*568/14'
>>> re.split('[-\*/+]', s4)
['9', '2', '5', '3', '7\x03', '99', '4', '2998', '10', '568', '14']
>>> re.split('[-\*/+]', s4, maxsplit=2)
['9', '2', '5/3+7\x03*99/4*2998+10*568/14']

re.fullmatch

>>> re.fullmatch('alex123', 'alex123')
<_sre.SRE_Match object; span=(0, 7), match='alex123'>
>>> re.fullmatch('\[email protected]\w+\.(com|cn|edu)', '[email protected]')
<_sre.SRE_Match object; span=(0, 18), match='[email protected]'>

re.compile(pattern[,flags])根據包含正則表示式的字串建立模式物件

>>> pattern = re.compile('\[email protected]\w+\.(com|cn|edu)')
# 如果需要多次的匹配，建議首先把pattern用compile方法轉化，這樣直譯器就不需要每次都轉化了。
>>> pattern.fullmatch('[email protected]')
<_sre.SRE_Match object; span=(0, 17), match='[email protected]'>

4.Flags標誌符

re.I(re.IGNORECASE): 忽略大小寫（括號內是完整寫法，下同）
M(MULTILINE): 多行模式，改變'^'和'$'的行為
S(DOTALL): 改變'.'的行為,make the '.' special character match any character at all, including a newline; without this flag, '.' will match anything except a newline.
X(re.VERBOSE) 可以給你的表示式寫註釋，使其更可讀，下面這2個意思一樣

a = re.compile(r"""\d + # the integral part
                \. # the decimal point
                \d * # some fractional digits""", 
                re.X)

b = re.compile(r"\d+\.\d*")

其他的例子

>>> re.search('a', "Alex", re.I)
<_sre.SRE_Match object; span=(0, 1), match='A'>

>>> re.search('foo.$', 'foo1\nfoo2\n')
<_sre.SRE_Match object; span=(5, 9), match='foo2'>
>>> re.search('foo.$', 'foo1\nfoo2\n', re.M)
<_sre.SRE_Match object; span=(0, 4), match='foo1'>

>>> print(re.search('.', '\n'))
None
>>> re.search('.', '\n', re.S)
<_sre.SRE_Match object; span=(0, 1), match='\n'>

>>> print(re.search('.  #test', 'alex'))
None
>>> re.search('.   #test', 'alex', re.X)
<_sre.SRE_Match object; span=(0, 1), match='a'>

正則表示式(python3-re模組示例）

1.常用的正則表示式 '.' 預設匹配除\n之外的任意一個字元，若指定flag DOTALL,則匹配任意字元，包括換行 '^' 匹配字元開頭，若指定flags MULTILINE,這種也可以匹配上(r"^a","\nabc\neee",flags=re.MULTILINE) '$'

python3進階之正則表示式之re模組之分組（group）、貪心匹配、編譯

　　除了簡單地判斷是否匹配之外，正則表示式還有提取子串的強大功能。用()表示的就是要提取的分組（Group）。比如：^(\d{3})-(\d{3,8})$分別定義了兩個組，可以直接從匹配的字串中提取出區號和本地號碼m = re.match(r'^(\d{3})-(\d{3,8})$', '010-12345'

python3 學習5 正則表示式，re模組學習

正則表示式：正則表示式有特殊的語法，有些符號需要轉義，所以一般來說使用原始字串模式，也就是r''。轉自：https://blog.csdn.net/qq_33720683/article/details/81023115 模式描述

【轉】Python之正則表示式（re模組）

【轉】Python之正則表示式（re模組）本節內容 re模組介紹使用re模組的步驟 re模組簡單應用示例關於匹配物件的說明說說正則表示式字串前的r字首 re模組綜合應用例項參考文件提示：由於該站對MARKDOWN的表格支援的不是很好，所以本文中的表

day023正則表示式，re模組，簡單爬蟲和多頁面爬蟲（幹掉數字簽名證書驗證）

本節內容： 1、正則表示式 2、re模組的運用 3、簡單的爬蟲練習一、正則表示式(Regular Expression) 正則表示式是對字串操作的⼀種邏輯公式. 我們⼀般使⽤正則表示式對字串進⾏匹配和過濾. 使⽤正則的優缺點: 優點: 靈活, 功能性強, 邏輯性強. 缺點: 上⼿難. ⼀旦上⼿, 會愛

正則表示式（re模組）

正則表示式，用來處理什麼的呢？它有什麼作用？正則表示式是用來處理字串匹配的！講正題之前我們先來看一個例子：：https://reg.jd.com/reg/person?ReturnUrl=https%3A//www.jd.com/ 這是京東的註冊頁面，開啟頁面我們就看到這些要求輸入個

python中的正則表示式（re模組）

一、簡介正則表示式本身是一種小型的、高度專業化的程式語言，而在python中，通過內嵌整合re模組，程式媛們可以直接呼叫來實現正則匹配。正則表示式模式被編譯成一系列的位元組碼，然後由用C編寫的匹配引擎執行。二、正則表示式中常用的字元含義 1、普通字元和11個元字

[轉]python中的正則表示式（re模組）

轉自:https://www.cnblogs.com/tina-python/p/5508402.html 一、簡介正則表示式本身是一種小型的、高度專業化的程式語言，而在python中，通過內嵌整合re模組，程式媛們可以直接呼叫來實現正則匹配。正則表示式模式被編譯成一系列的位元組碼

正則表示式（re模組，匹配單個字元，匹配多個字元，匹配分組，python貪婪和非貪婪，r的作用）

re.match() 能夠匹配出以xxx開頭的字串匹配單個字元示例1： . #coding=utf-8 import re ret = re.match(".","M") print(ret.group()) ret = re.match("t.o","too") print

Python3正則表示式(二)re模組

在Python3正則表示式(一)基本語法規則已經記錄了正則表示式的基本規則，接下來將寫一下在python當中如何利用正則表示式去匹配字串，即re模組中功能函式的使用。使用時要先進行匯入re模組：import re 一、re模組中常用的函式 1.c

python3 正則表示式，re模組學習

正則表示式：正則表示式有特殊的語法，有些符號需要轉義，所以一般來說使用原始字串模式，也就是r''。模式描述^匹配字串的開頭$匹配字串的末尾。.匹配任意字元，除了換行符，當re.DOTALL標記被指定時，則可以匹配包括換行符的任意字元。[...]用來表示一組字元,單獨列出：[a

正則表示式和re模組知識點彙總

"\^"：匹配字元的開始"\$"：匹配字元的結尾"[]"：字元組"[^a]"：如果在字元組中以^開頭，就是除了a不匹配，其他的都匹配"a|b"：匹配字元a或b 注意：使用或關係的時候，要把長規則放在短規則的前面"()"分組，需要對一個整體匹配規則量詞約束的，就對整體匹配規則加一個括號字串最前面加上r 就是不

資料提取——正則表示式的 re 模組

什麼是正則表示式正則表示式，又稱規則表示式，通常被用來檢索、替換那些符合某個模式(規則)的文字。正則表示式是對字串操作的一種邏輯公式，就是用事先定義好的一些特定字元、及這些特定字元的組合，組成一個“規則字串”，這個“規則字串”用來表達對字串的一種過濾邏輯。給定一個正則表示式

day023 正則表示式和re模組

一.正則1.字元組 [a-zA-Z0-9]字元組中的　 [^a] 除了字元組的2.　 3. 4. 二.re模組 re.S 設定 .的換行 obj=re 1.ret=re.search(正則，content) 找到一個結果就返回　　拿

python之正則表示式：re模組

一.正則表示式中常用的字元含義 1、普通字元和11個元字元：常用字元劃分匹配範圍示例資料匹配的正則表示式目標匹配的字串普通字元匹配自身 abc

Python 正則表示式，re模組，match匹配(預設從開頭匹配)，分組

單個字元：數量詞：匹配開頭、結尾：匹配分組： demo.py（正則表示式，match從開頭匹配，分組，分組別名）： # coding=utf-8 import re # 小括號()表示分組 \1表示取出第

024-2018-1010 正則表示式和re模組

1.今日內容大綱一. 昨日內容回顧序列化: pickle: 把物件序列化成bytes dumps() 序列化 loads() 反序列化

正則表示式和re模組

1. 正則表示式匹配字串　　元字元　　　　. 除了換行　　　　\w 數字, 字母, 下劃線　　　　\d 數字　　　　[] 字元組　　　　^ 字串的開始　　　　$ 字串的結束　　　　| 或者　　　　[^xxx] 非xxxx 　　　　\s 空白符　　　　\n 換行　　　　\t

python正則表示式與re模組

python中的re模組常用函式/方法 0.正則表示式物件　　（re.compile(pattern, flags=0)）將正則表示式編譯成正則表示式物件，該物件可呼叫正則表示式物件方法如:re.match(),re.search(),re.findall等。 prog = re.c

正則表示式之re模組compile()

定義： compile(pattern[,flags] ) 根據包含正則表示式的字串建立模式物件。compile(pattern, flags=0) 通過help可以看到compile方法的介紹，返回一個pattern物件，但是卻沒有對第二個引數flags進行介紹。第二個引數

正則表示式(python3-re模組示例）

1.常用的正則表示式

2.re模組

2.1 簡單例子

re.match

re.search

re.findall

re.split

re.findall

re.sub

3.其他正則表示式

分組匹配

另外一種分組匹配

複雜一點的re.sub

re.split

re.fullmatch

re.compile(pattern[,flags])根據包含正則表示式的字串建立模式物件

4.Flags標誌符

相關推薦