關於正則表達式的完整型整理(python)
上傳圖片,以示清白。
正則(Regular Expression)
在python的運用當中,正則表達式可是非常重要的,無論是進行爬蟲,或者是進行某些判定,都必不可少,接下來,我們談談正則表達式。望各位兄多多執教。
1 import re 2 result=re.match("abc",‘abc.cm‘) 3 print(result.group())
就是這樣,re 導入,來波分割線,開始進入正題。
====================================================================
首先是正則表達式的單字符匹配(字符)
====================================================================
原始字符串,即r
在python的正則表達式中,‘\’是轉義字符(字母數字前加入‘\’後具有特殊意義?如‘\n’換行),所以就有一個問題,如何匹配‘\‘,如果正常使用語言來表達的話,那麽就需要使用到4個反斜杠。前兩個和後兩個分別轉義成反斜杠,然後合並兩個反斜杠成為一個反斜杠。(好像挺有意思的,但是很麻煩),所以就衍生出了原生字符串,解決了這個問題。
1 >>> import re 2 >>> a=‘c:\\a\\b\\c‘ 3 >>> b=re.match(r‘c:\\a‘,a).group() 4 >>> print(b) 5 c:\a
====================================================================
匹配多個字符(數量)
====================================================================
匹配字符的邊界問題(邊界)
====================================================================
正則表達式的分組
====================================================================
re的高級用法
search
findall
sub
split
====================================================================
python的貪婪和非貪婪
python裏的數量詞默認是貪婪的,就是說會嘗試的盡可能多的匹配字符。
在".","*","+",{m}後面加上?,可以使貪婪變成非貪婪
例如(.*?)
關於正則表達式的完整型整理(python)