1. 程式人生 > 程式設計 >Python 正則表示式大全(推薦)

Python 正則表示式大全(推薦)

目錄
  • 1 前言
  • 2 基本語法
    • 2.1 match函式
    • 2.2 search 函式
    • 2.3 sub 函式
  • 3 特殊類語法
    • 3.1 字元類
    • 3.2 特殊字元類
    • 3.3 重複匹配
    • 3.4 非貪婪重複
    • 3.5 圓括號分組
    • 3.6 反向引用
    • 3.7 錨點
    • 3.8 帶括號的特殊語法

1 前言

正則表示式是對字串(包括普通字元(例如,a 到 z 之間的字母)和特殊字元(稱為“元字元”))操作的一種邏輯公式,就是用事先定義好的一些特定字元、及這些特定字元的組合,組成一個“規則字串”,這個“規則字串”用來表達對字串的一種過濾邏輯。正則表示式是一種文字模式,該模式描述在搜尋文字時要匹配的一個或多個字串。

上面都是官方的說明,博主自己的理解是(僅供參考):通過事先規定好一些特殊字元的匹配規則,然後利用這些字元進行組合來匹配各種複雜的字串場景。比如現在的爬蟲和資料分析,字串校驗等等都需要用到正則表示式來處理資料。

的正則表示式則是re模組了:

  • re 模組使 Python 語言擁有全部的正則表示式功能。
  • re 模組也提供了與這些方法功能完全一致的函式,這些函式使用一個模式字串做為它們的第一個引數。

2 基本語法

image

2.1 match函式

只從字串的最開始與pattern進行匹配,下面是函式的語法 :

re.match(pattern,string,flags = 0)

這裡是引數的描述 :

  • p attern - 這是要匹配的正則表示式。
  • string - 這是字串,它將被搜尋用於匹配字串開頭的模式。
  • flags - 可以使用按位OR(|)指定不同的標誌。這些是修飾符,如下表所列。
  • re.mathttp://www.cppcns.comch 函式在成功時返回匹配物件,失敗時返回None。使用match(num)或groups函式匹配物件來獲取匹配的表示式。

image

示例

#未從初始位置匹配,會返回None import re line = ‘i can speak good english'matchObj = re.match(r's(w*)s(w*).*',line)if matchObj:print(‘matchObj.group :',matchObj.group)print(‘matchObj.group :',matchObj.group(1))print(‘matchObj.group :',matchObj.group(2))print(‘matchObj.group :',matchObj.group(3))else:print(‘no match!')

image

#從初始位置開始匹配import re line = ‘i can speak good english'matchObj = re.match(r'(i)s(w*)s(w*).*',matchObj.group(2))print(‘matchObj.group :',matchObj.group(3))else:print(‘no match!')

image

2.2 search 函式

與match工作的方式一樣,但是search不是從最開始匹配的,而是從任意位置查詢第一次匹配的內容。下面是這個函式的語法 :

re.match(pattern,flags = 0)

這裡是引數的描述 :

  • pattern - 這是要匹配的正則表示式客棧
  • string - 這是字串,它將被搜尋用於匹配字串開頭的模式。
  • flags - 可以使用按位OR(|)指定不同的標誌。這些是修飾符,如下表所列。
  • re.search函式在成功時返回匹配物件,否則返回None。使用match物件的group(num)或groups函式來獲取匹配的表示式。最後,如果你的時間不是很緊張,並且又想快速的python提高,最重要的是不怕吃苦,建議你可以架微♥信:762459510 ,那個真的很不錯,很多人進步都很快,需要你不怕吃苦哦!大家可以去新增上看一下~

image

示例

import re line = ‘i can speak good english'matchObj = re.search('(.) (.?) (.*)',matchObj.group(3))else:print(‘no match!')

2.3 sub 函式

使用正則表示式re模組中的最重要的之一是sub。

re.sub(pattern,repl,max=0)

此方法使用repl替換所有出現在RE模式的字串,替換所有出現,除非提供max。此方法返回修改的字串。

示例

import re line = ‘i can speak good english'speak = re.sub(r'can',‘not',line)print(speak)speak1 = re.sub(r's','',line) #替換所有空格print(speak1)

3 特殊類語法

3.1 字元類

image

3.2 特殊字元類

image

3.3 重複匹配

image

3.4 非貪婪重複

這匹配最小的重複次數:

image

3.5 圓括號分組

image

3.6 反向引用

與以前匹配的組再次匹配

image

3.7 錨點

需要指定匹配位置。

image

3.8 帶括號的特殊語法

image

到此這篇關於Python 正則表示式大全的文章就介紹到這了,更多相關Python 正則表示式大全內容請搜尋我們以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援我們!