Python:筆記(6)——正則表達式
阿新 • • 發佈:2019-03-24
利用 表示 dal 步驟 可選參數 基於 imp 根據 一個
Python:筆記(6)——正則表達式
re模塊
re模塊用於在字符串中執行基於正則表達式模式的匹配和替換。
使用原始字符串
正則表達式使用 \
對特殊字符進行轉義,比如,為了匹配字符串 ‘python.org’,我們需要使用正則表達式 ‘python\.org‘。
但是Python 的字符串本身也用 \
轉義,所以上面的正則表達式在 Python 中應該寫成 ‘python\\.org‘
,這會很容易陷入 \
的困擾中,因此,我們建議使用 Python 的原始字符串,只需加一個 r 前綴,上面的正則表達式可以寫成:
r‘python\.org‘
re模塊的使用步驟
- 使用 compile 函數將正則表達式的字符串形式編譯為一個 Pattern 對象
- 通過 Pattern 對象提供的一系列方法對文本進行匹配查找,獲得匹配結果(一個 Match 對象)
- 最後使用 Match 對象提供的屬性和方法獲得信息,根據需要進行其他的操作
編譯Pattern對象
compile 函數用於編譯正則表達式,生成一個 Pattern 對象,它的一般使用形式如下:
re.compile(pattern[, flag])
其中,pattern 是一個字符串形式的正則表達式,flag 是一個可選參數,表示匹配模式,比如忽略大小寫,多行模式等。
import re # 將正則表達式編譯成 Pattern 對象 pattern = re.compile(r‘\d+‘)
在上面,我們已將一個正則表達式編譯成 Pattern 對象,接下來,我們就可以利用 pattern 的一系列方法對文本進行匹配查找了。Pattern 對象的一些常用方法主要有:
- match 方法
- search 方法
- findall 方法
- finditer 方法
- split 方法
- sub 方法
- subn 方法
Python:筆記(6)——正則表達式