1. 程式人生 > >Python:筆記(6)——正則表達式

Python:筆記(6)——正則表達式

利用 表示 dal 步驟 可選參數 基於 imp 根據 一個

Python:筆記(6)——正則表達式

re模塊

  re模塊用於在字符串中執行基於正則表達式模式的匹配和替換

使用原始字符串

  正則表達式使用 \ 對特殊字符進行轉義,比如,為了匹配字符串 ‘python.org’,我們需要使用正則表達式 ‘python\.org‘。

  但是Python 的字符串本身也用 \ 轉義,所以上面的正則表達式在 Python 中應該寫成 ‘python\\.org‘,這會很容易陷入 \ 的困擾中,因此,我們建議使用 Python 的原始字符串,只需加一個 r 前綴,上面的正則表達式可以寫成:

r‘python\.org‘

re模塊的使用步驟

  • 使用 compile 函數將正則表達式的字符串形式編譯為一個 Pattern 對象
  • 通過 Pattern 對象提供的一系列方法對文本進行匹配查找,獲得匹配結果(一個 Match 對象)
  • 最後使用 Match 對象提供的屬性和方法獲得信息,根據需要進行其他的操作

編譯Pattern對象

  compile 函數用於編譯正則表達式,生成一個 Pattern 對象,它的一般使用形式如下:

re.compile(pattern[, flag])

  其中,pattern 是一個字符串形式的正則表達式,flag 是一個可選參數,表示匹配模式,比如忽略大小寫,多行模式等。

import re
# 將正則表達式編譯成 Pattern 對象 
pattern = re.compile(r‘\d+‘)

  在上面,我們已將一個正則表達式編譯成 Pattern 對象,接下來,我們就可以利用 pattern 的一系列方法對文本進行匹配查找了。Pattern 對象的一些常用方法主要有:

  • match 方法
  • search 方法
  • findall 方法
  • finditer 方法
  • split 方法
  • sub 方法
  • subn 方法

Python:筆記(6)——正則表達式