python-re模組常用的函式及方法
阿新 • • 發佈:2019-02-07
常見的正則表示式屬性
- 僅僅是re模組函式
compile(pattern,flags= 0) 使用任何可選的標記來編譯正則表示式的模式,然後返回一個正則表示式物件 - re 模組函式和正則表示式物件的方法
match(pattern,string,flags=0) 嘗試使用帶有可選的標記的正則表示式的模式來匹配字串。如果匹配成功,就返回
匹配物件; 如果失敗,就返回 Nonesearch(pattern,string,flags=0) 使用可選標記搜尋字串中第一次出現的正則表示式模式。 如果匹配成功,則返回匹
配物件; 如果失敗,則返回 Nonefindall(pattern,string[, flags 查詢字串中所有(非重複)出現的正則表示式模式,並返回一個匹配列表 finditer(pattern,string[, flags] )② 與 findall()函式相同,但返回的不是一個列表,而是一個迭代器。 對於每一次匹配,迭
代器都返回一個匹配物件split(pattern,string,max=0)③ 根據正則表示式的模式分隔符, split函式將字串分割為列表,然後返回成功匹配的
列表,分隔最多操作 max 次(預設分割所有匹配成功的位置)sub(pattern,repl,string,count=0)③ 使用 repl 替換所有正則表示式的模式在字串中出現的位置,除非定義
將替換所有出現的位置( 另見 subn()函式,該函式返回替換操作的數目)purge() 清除隱式編譯的正則表示式模式 - 常用的匹配物件方法(檢視文件以獲取更多資訊)
group(num=0) 返回整個匹配物件,或者編號為 num的特定子組 groups(default=None) 返回一個包含所有匹配子組的元組(如果沒有成功匹配,則返回一個空元組) groupdict(default=None) 返回一個包含所有匹配的命名子組的字典,所有的子組名稱作為字典的鍵(如果沒有
成功匹配,則返回一個空字典) - 常用的模組屬性(用於大多數正則表示式函式的標記)
re.I、 re.IGNORECASE 不區分大小寫的匹配 re.L、 re.LOCALE 根據所使用的本地語言環境通過\w、\W、\b、\B、\s、\S實現匹配 re.M、 re.MULTILINE ^和$分別匹配目標字串中行的起始和結尾,而不是嚴格匹配整個字串本身的起始
和結尾re.S、 rer.DOTALL “.” (點號)通常匹配除了\n(換行符)之外的所有單個字元;該標記表示“.” (點號)
能夠匹配全部字元re.X、 re.VERBOSE 通過反斜線轉義, 否則所有空格加上#(以及在該行中所有後續文字)都被忽略,除非
在一個字元類中或者允許註釋並且提高可讀性