Python常用模組——re模組

阿新 • • 發佈：2018-11-05

　　有些人在面臨問題的時候會想：“我知道，我將使用正則表示式來解決這個問題。”這讓他們面臨的問題變成了兩個。

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　—— Jamie Zawinski

首先我們對比一下兩段程式碼處理使用者輸入手機號的不同

1 phone_num = input('請輸入手機號：')
2 if len(phone_num) == 11 \
3         and phone_num.isdigit()\
4         and phone_num[:3] in ['130','131','132']:
5     print 
('hello')
6 else:print('非聯通號！')

程式碼1

1 import re
2 phone_num = input('請輸入手機號：')
3 if re.findall('^(130|131|132)[0-9]{8}$',phone_num):
4     print('hello')
5 else:print('非聯通號！')

程式碼2

對比來看程式碼1比較通俗易懂，程式碼2看起來有些不太容易理解但是可以使得程式碼更加的簡潔

1.正則表示式

re模組提供了對正則表示式的支援，學習re模組之前要了解正則表示式：

正則表示式其實是匹配文字片段的模式，最簡單的正則表示式是普通的字串，與自己匹配，可以使用這種匹配行為來完成一下工作：在文字中查詢模式，將特定的模式替換為計算得到的值，以及將文字分割為片段。

正則表示式線上測試工具 http://tool.chinaz.com/regex/

1.1萬用字元

.	匹配除換行符以外的任意字元
\w	匹配字母或數字或下劃線
\s	匹配任意的空白符
\d	匹配數字
\n	匹配一個換行符
\t	匹配一個製表符
\b	匹配一個單詞的結尾
^	匹配字串的開始
$	匹配字串的結束
\W	匹配非字母或數字或下劃線
\D	匹配非數字
\S	匹配非空白符
a\|b	匹配字元a或字元b
()	匹配括號內的表示式，也表示一個組
[...]	匹配字符集中的字元
[^...]	匹配除了字符集中的字元

1.2字符集

用方括號將一個子串括起來，建立一個所謂的字符集

例如"[a-zA-Z0-9]"與大小寫字母以及數字都匹配，但需要注意的是字符集只能匹配一個字元

要排除字元就可以在開頭加上^字元，例如"[^abc]"與除a、b和c外的其他任何字元都匹配

字符集	匹配字元	結果	說明
[0123456789]	1	True	在一個字元組裡列舉合法的所有字元，字元組裡的任意一個字元和"待匹配字元"相同都視為可以匹配
[0-9]	1	True	也可以用-表示範圍,[0-9]就和[0123456789]是一個意思
[a-z]	a	True	同樣的如果要匹配所有的小寫字母，直接用[a-z]就可以表示
[A-Z]	A	True	[A-Z]就表示所有的大寫字母

1.3量詞

*	重複零次或更多次
+	重複一次或更多次
?	重複零次或一次
{n}	重複n次
{n,}	重複n次或更多次
{n,m}	重複n到m次

1.4分組 ()與或｜［^］

匹配身份證號為15或18位字串組成，15位為純數字，首位不能為零。

正則	待匹配字元	匹配結果	說明
^[1-9]\d{13,16}[0-9x]$	53010219200508011x	53010219200508011x	雖可匹配但存在問題
^[1-9]\d{14}(\d{2}[0-9x]$)?	53010219200508011x	53010219200508011x	括號內為子模式，子模式後加量詞
([1-9]\d{16}[0-9x]\|[1-9]\d{14})	53010219200508011x	53010219200508011x	括號內加"\|",變為二選一模式，先匹配前面後匹配後面

1.5 特殊字元進行轉義

普通字元與自己匹配，但特殊字元情況不同，要讓特殊字元與普通字元一樣就要對其進行轉義:在正則前加"\"

請注意，為表示模式re要求的單個反斜槓，需要在字串中寫兩個反斜槓，讓直譯器對其轉義，包含兩層含義，直譯器執行的轉義和模組re進行的轉義

當然可以使用原始字串，如r'\d'

>>> import re

>>> print(re.findall('\\\\d', '\\d')) # 匹配字元"\d"時，正則表達為"\\d"，然後Python還要對其中兩個斜槓在進行轉義，最終規則表示式為"\\\\d"
['\\d']

>>> print(re.findall(r'\\d',r'\d')) # 使用原始字串省去不必要的麻煩
['\\d']

1.6 貪婪和非貪婪匹配

貪婪匹配：在滿足匹配時，匹配儘可能長的字串，預設情況下，採用貪婪匹配

加上"?"變為非貪婪匹配

*? 重複任意次，但儘可能少重複
+? 重複1次或更多次，但儘可能少重複
?? 重複0次或1次，但儘可能少重複
{n,m}? 重複n到m次，但儘可能少重複
{n,}? 重複n次以上，但儘可能少重複

一般這樣使用時要加上結尾條件，否則只會匹配量詞的最少重複次數

你.*?	你好嗎	你
你.*?嗎	你好嗎你真的好嗎	你好嗎你真的好嗎

2.模組re的常用函式

函式	描述
compile(pattern, flags=0)	根據包含正則表示式的字串建立模式物件
escape(string)	對字串中的所有正則表示式的特殊字元進行轉義
findall(pattern, string, flags=0)	返回一個列表，其中包含字串中的所有與正則模式匹配的子串
search(pattern, string, flags=0)	在字串中查詢模式
split(pattern, string, maxsplit=0, flags=0)	根據模式來分割字串
sub(pattern, repl, string, count=0, flags=0)	將字串中與模式匹配的子串替換為 repl
match(pattern, string, flags=0)	在字串開頭查詢模式
subn(pattern, repl, string, count=0, flags=0)	將字串中與模式匹配的子串替換為 repl，返回元組，元組包含替換後結果和替換次數
finditer(pattern, string, flags=0)	返回一個包含結果的迭代器

print(re.findall('你','你好你是')) # ['你', '你']

ret = re.search('你','好是') # 找到後需要呼叫group()方法，找不到返回None,None不能呼叫group()方法
if ret:
    print(ret.group())

ret = re.match('你','ni好你是') # 和search用法類似
if ret:
    print(ret.group())

ret = re.split('b','abc') # 按“b”分割字串
print(ret) # ['a', 'c']

ret = re.split('[ad]','adbcde') # 先按“a”分割，再按“b”分割
print(ret) 

print(re.sub('\d','$','zhao123'))
print(re.subn('\d','$','zhao123'))

obj = re.compile('你好')
ret = obj.findall('你好嗎')
print(ret)

ret = re.finditer('你好','你好嗎你好')
print(ret.__next__().group())

Python常用模組——re模組

　　有些人在面臨問題的時候會想：“我知道，我將使用正則表示式來解決這個問題。”這讓他們面臨的問題變成了兩個。　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　—— Jamie Zawinski 首先我們對比一下兩段程式碼處理使用者輸入手機號的不同 1 pho

Python進階——re模組

1.首先匯入re模組 import re (1) re.match()函式對字串的從字串的開頭進行匹配用法： re.match(pattern,string) import re pat="\d+" s="abc123abc123456" print(re.matc

Python基礎16模組-re模組

1.正則表示式 #^表示在字串開頭匹配，$表示在字串結尾匹配 #*匹配0到無窮多個 #+匹配1到無窮多個 #？匹配0或者1個 #{}定義匹配個數{0，}==*，{1，}==+，{0,1}==？，{6}=={1,6} #上面的元字元一般都是貪婪匹配，在後面加上？變成惰性匹配 #[]匹配括號裡的字元，只匹

python學習之-re模組（正則表示式模組）

什麼是正則表示式正則就是用一些具有特殊含義的符號組合到一起（稱為正則表示式）來描述字元或者字串的方法。或者說：正則就是用來描述一類事物的規則。（在Python中）它內嵌在Python中，並通過 re 模組實現。正則表示式模式被編譯成一系列的位元組碼，然後由用 C 編寫的匹配引擎執行。生活中處處都是正則

Python基礎之re模組

什麼是模組？　　為了編寫可維護的程式碼，我們把很多的函式分組，分別放到不同的檔案裡，這樣，每個檔案包含的程式碼就相對較少，很多程式語言都採用這種組織程式碼的方式，在Python中，一個.py檔案就稱為一個模組模組的作用？　　使用模組的好處大大提高了程式碼的可維護性其次編寫程式碼不必從零開始

Python常用內建模組——學習筆記

1、datetime：Python處理日期和時間的標準庫引入方法： from datetime import datetime。第一個datetime是模組，第二個datetime是類。如果

Python 3.6 re模組基本函式介紹

python裡提供了兩種對正則表示式的操作：match和serch 1.match 函式原型：re.match(pattern, string, flags） pattern為正則表示式，string為被匹配的文字，flags是匹配規則，如是否區別大小寫等，若匹配到返回ma

python 常用的OS模組、shutil庫(用於檔案操作)

說明： shutil庫為python內建庫，是一個對檔案及資料夾高階操作的庫，可以與os庫互補完成一些操作，如資料夾的整體複製，移動資料夾，對檔案重新命名等。 1、建立 os.mkdir(path+dir_name) 建立目錄（建立一級目

python常用50個模組

Python具有強大的擴充套件能力，我列出了50個很棒的Python模組，包含幾乎所有的需要：比如Databases，GUIs，Images, Sound, OS interaction, Web,以及其他。推薦收藏。 Graphical interface wxPyt

python常用內建模組：datetime

使用匯入datetime模組下的datetime類，如果只是import datetime 那麼呼叫要通過datetime.datetime 舉例：返回當前日期和時間: >>> from datetime import datetime

Python 正則re模組之compile()和findall()詳解

首先我們看下官方文件裡關於的compile的說明： re.compile(pattern, flags=0) Compile a regular expression pattern into a regular expression object, which can

正則表示式 re模組 re模組實用方法

一. 正則表示式　　首先, 我們在網⻚上進行註冊或者登陸的時候經常能看到一些格式上的錯誤提示. 比如:你在註冊百度賬號的時候輸入使用者名稱隨意的輸入系統會提示你. 你的賬號過長或者不允許使用中文等等操作. 那這種操作如果使用我們現有的知識點是可以完成的. 但是完成的效果並不好. 寫起來也

Learning-Python【21】：Python常用模組（4）—— re、logging、hashlib、subprocess

re 模組：與正則相關的模組在使用 re 模組之前，需要先了解正則表示式（regular expression），描述了一種字串匹配的模式（pattern），可以用來檢查一個字串是否含有某個子字串、將匹配的子字串替換或者從某個字串中取出符合某個條件的子字串等。 import

爬蟲--Python常用模組之requests,urllib和re

一、爬蟲的步驟　　1.發起請求，模擬瀏覽器傳送一個http請求　　2.獲取響應的內容　　3.解析內容（解析出對自己有用的部分）　　　　a.正則表示式　　　　b.BeautifulSoup模組　　　　c.pyquery模組　　　　d.selenium模組　　4.儲存資料　　　

Python 常用模組之re 正則表示式的使用

re模組用來使用正則表示式。正則表示式用來對字串進行搜尋的工作。我們最應該掌握正則表示式的查詢，更改，刪除的功能。特別是做爬蟲的時候，re模組就顯得格外重要。 1.查詢 1 import re 2 a = re.match("abc","aabccc") 3 b = re.search("abc",

python之re模組（正則表示式）常用函式

1、compile() 編譯正則表示式模式，返回一個物件的模式。（可以把那些常用的正則表示式編譯成正則表示式物件，這樣可以提高一點效率。）格式： re.compile(pattern,flags=0) pattern: 編譯時用的表示式字串。 flags 編譯標誌位，用於修改正

python re模組常用方法總結

res = re.match(pattern, string, flags=0) #字串的開頭是否能匹配正則表示式。返回_sre.SRE_Match物件，如果 #不能匹配返回None。 # 如果匹配的話

Python中常用模組re，matplotlib,pandas，sys，mysql

模組是一個包含所有你定義的函式和變數的檔案，其後綴名是.py windows python -m pip install -U pip setuptools python -m pip install matplotlib python -m pip i

python-re模組常用的函式及方法

常見的正則表示式屬性僅僅是re模組函式 compile(pattern，flags= 0) 使用任何可選的標記來編譯正則表示式的模式，然後返回一個正則表示式物件 re 模組函式和正則表示式物件的方

Python中re模組常用函式

正則表示式(可以稱為REs，regex，regex pattens)是一個小巧的，高度專業化的程式語言，它內嵌於python開發語言中，可通過re模組使用。正則表示式的pattern可以被編譯成一系列的位元組碼，然後用C編寫的引擎執行。下面簡單介紹下正則表示式的語法。正則

Python常用模組——re模組

1.正則表示式

1.1萬用字元

1.3量詞

1.4分組 ()與 或 ｜［^］

1.5 特殊字元進行轉義

1.6 貪婪和非貪婪匹配

2.模組re的常用函式

相關推薦

1.4分組 ()與或｜［^］