1. 程式人生 > >python-re模組常用的函式及方法

python-re模組常用的函式及方法

常見的正則表示式屬性

  • 僅僅是re模組函式
    compile(patternflags= 0) 使用任何可選的標記來編譯正則表示式的模式,然後返回一個正則表示式物件


  • re 模組函式和正則表示式物件的方法 
    match(patternstringflags=0) 嘗試使用帶有可選的標記的正則表示式的模式來匹配字串。如果匹配成功,就返回
    匹配物件; 如果失敗,就返回
    None
    search(patternstringflags=0) 使用可選標記搜尋字串中第一次出現的正則表示式模式。 如果匹配成功,則返回匹
    配物件; 如果失敗,則返回
    None
    findall(patternstring[, flags
    ] )
    查詢字串中所有(非重複)出現的正則表示式模式,並返回一個匹配列表
    finditer(patternstring[, flags] ) findall()函式相同,但返回的不是一個列表,而是一個迭代器。 對於每一次匹配,迭
    代器都返回一個匹配物件
    split(patternstringmax=0) 根據正則表示式的模式分隔符, split函式將字串分割為列表,然後返回成功匹配的
    列表,分隔最多操作
    max 次(預設分割所有匹配成功的位置)
    sub(patternreplstringcount=0) 使用 repl 替換所有正則表示式的模式在字串中出現的位置,除非定義
    count, 否則就
    將替換所有出現的位置( 另見
    subn()函式,該函式返回替換操作的數目)
    purge() 清除隱式編譯的正則表示式模式


  • 常用的匹配物件方法(檢視文件以獲取更多資訊)
    group(num=0) 返回整個匹配物件,或者編號為 num的特定子組
    groups(default=None) 返回一個包含所有匹配子組的元組(如果沒有成功匹配,則返回一個空元組)
    groupdict(default=None) 返回一個包含所有匹配的命名子組的字典,所有的子組名稱作為字典的鍵(如果沒有
    成功匹配,則返回一個空字典)

  • 常用的模組屬性(用於大多數正則表示式函式的標記)
    re.I re.IGNORECASE
    不區分大小寫的匹配
    re.L re.LOCALE 根據所使用的本地語言環境通過\w\W\b\B\s\S實現匹配
    re.M re.MULTILINE ^$分別匹配目標字串中行的起始和結尾,而不是嚴格匹配整個字串本身的起始
    和結尾
    re.S rer.DOTALL .” (點號)通常匹配除了\n(換行符)之外的所有單個字元;該標記表示“.” (點號)
    能夠匹配全部字元
    re.X re.VERBOSE 通過反斜線轉義, 否則所有空格加上#(以及在該行中所有後續文字)都被忽略,除非
    在一個字元類中或者允許註釋並且提高可讀性