Python中正則表示式介紹

阿新 • • 發佈：2018-12-19

正則

正則表通常是用來檢索、替換那些符合某個模式(規則)的文字。也就是說使用正則表示式可以在字串中匹配出你需要的字元或者字串，甚至可以替換你不需要的字元或者字串。

正則（不是python特有的）匹配字串,其他語言也有正則表示式

例項：

需求：輸入字元，判斷字串有無python

import re

a=input("輸入：")

b=re.search("python",a)#搜尋匹配，匹配是第一個

if bool(b) ==True:

print("ok")

else:

print("no")

需求：輸入字元，判斷字串是否是5-11位數字

qq=input("輸入：")

b=re.search("[0-9]{5,11}",qq) #（規則，物件）

if b:

print("ok")

else:

print("no")

'''

元字元

常用特殊字元：

. ^ $ * + ? {} [] \ | ()

大多數字母和字元會匹配它們自身，有少數特殊字元我們稱為元字元，它們不能匹配自身

子組匹配和模式重複次數等

. 匹配除換行符之外的所有的字元

>>> re.search(".","\nasfsdfdsaf") #去掉了\n

<_sre.SRE_Match object; span=(1, 2), match='a'>

\d 匹配0~9的數字

>>> re.search("\d","asf2sdfdsaf") #查詢第一個數字

<_sre.SRE_Match object; span=(3, 4), match='2'>

>>> re.findall("\d","asf2sdf4dsa3f") #查詢所有的

['2', '4', '3']

\s # 匹配任意的空白符，包括空格，製表符(Tab)，換行符等

>>> re.findall("\s","\n \t asss")

['\n', ' ', ' ', '\t', ' ', ' ']

\w 匹配字母或數字或下劃線或漢字等

>>> re.findall("\w","adwo__55+%?")

['a', 'd', 'w', 'o', '_', '_', '5', '5']

\b 表示單詞的邊界 #除了字母下劃線和數字外，其他都算邊界

>>> re.findall(r"\bapple\b","apple apple") # r轉義

['apple', 'apple']

\. 表示匹配點號本身

>>> re.findall(r"\.",".apple. apple")

['.', '.']

python正則表示式關鍵字字元轉義

re.findall(r"\\b",r"55apple\b") #正則表達轉義，需要加上r 和\

\D、\S、\W、\B 是與小寫的相反的作用

>>> re.findall(r"\D","123ASDF")

['A', 'S', 'D', 'F']

>>> re.findall(r"\S","\t \n aaa")

['a', 'a', 'a']

>>> re.findall(r"\W","\t \n aaa")

['\t', ' ', '\n', ' ']

^ 脫字元，匹配輸入字串的開始的位置

>>> re.findall(r"^adc","adcefg") #adc開頭的

['adc']

$ 匹配輸入字串的結束位置，解除元字元的特殊功能例

>>> re.findall(r"efg$","adcefg") #efg結尾的

['efg']

匹配次數

{M,N} M和N 為非負整數，其中M<=N 表示前面的匹配M~N次

>>> re.findall(r"\d{1,3}","22db44ef555g1666")

['22', '44', '555', '166', '6']

{M，} 表示需要匹配M次以上

>>> re.findall(r"\d{2,}","22db44ef555g1666")

['22', '44', '555', '1666']

{，N} 等價於{0~N}

>>> re.findall(r"\d{,2}","22db44ef555g1666") #注意這裡最後會加上一個空格

['22', '', '', '44', '', '', '55', '5', '', '16', '66', '']

{N} 表示需要匹配N次

>>> re.findall(r"\d{2}","22db44ef555g1666")

['22', '44', '55', '16', '66']

* 匹配前面的子表示式零次或多次，等價於{0，}

>>> re.findall(r"\d*","22db44ef555g1666")

['22', '', '', '44', '', '', '555', '', '1666', '']

+ 匹配前面的子表示式一次或多次，等價於{1，}

>>> re.findall(r"\d+","22db44ef555g1666")

['22', '44', '555', '1666']

? 匹配前面的子表示式零次或一次，等價於{0,1}

注：*？、+？、{n,m}?貪婪與懶惰

>>> re.findall(r"\d?","22db44ef555g1666")

['2', '2', '', '', '4', '4', '', '', '5', '5', '5', '', '1', '6', '6', '6', '']

>>> re.findall(r"\d*?","22db44ef555g1666") # *是 0到多次？號是0到1次結果就是匹配0次求交集

['', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '']

>>> re.findall(r"\d+?","22db44ef555g1666") #+號是1到多次？號是0到1次結果就是1次求交集

['2', '2', '4', '4', '5', '5', '5', '1', '6', '6', '6']

>>> re.findall(r"\d{2,5}?","22db44ef555g1666") #{2,5}是2到5次？號是0到1次最小取值是2次

['22', '44', '55', '16', '66']

子組匹配

[ ] 字元類，將要匹配的一類字符集放在[]裡面

[ . ? * ( ) {} ] 匹配裡面的這些符號

[0-9] 匹配0到9的數字相當於\d

需求：所有數字

>>> re.findall(r"[0-9]","22db44ef5") #所有數字

['2', '2', '4', '4', '5']

[^\d] 匹配除數字以外的字元，相當於\D

>>> re.findall(r"[^\d]","22db44ef5AB")

['d', 'b', 'e', 'f', 'A', 'B']

>>> re.findall(r"[^\d]{2}","22db44ef5AB") #非數字次數為2的

['db', 'ef', 'AB']

[a-z] 匹配所有的小寫字母

>>> re.findall(r"[a-zA-Z]","22db44ef5AB") #所有字母

['d', 'b', 'e', 'f', 'A', 'B']

[^a-z] # 匹配非小寫字母

>>> re.findall(r"[^a-z]{2}","22db44ef5AB")

['22', '44', '5A']

| 相當於或（or）分支條件

A | B 匹配字母A或者B 與[AB]是一樣的

第一種方式：

>>> re.findall(r"b|a","22db44ef5ABa")

['b', 'a']

第二種方式：

>>> re.findall(r"[ba]","22db44ef5ABa")

['b', 'a']

() 分組，將要匹配的一類字符集放在()組成一個小組

>>> re.findall(r"(db)","22db44ef5ABa")

['db']

>>> re.findall(r"(db)*","22db44ef5ABadb")

['', '', 'db', '', '', '', '', '', '', '', '', 'db', '']

re模組

re模組的常用方法

re.compile() 編譯正則表示式為模式物件

>>> re.compile(r"\d")

re.compile('\\d')

match() 判斷一個正則表示式是否從開始處匹配字串

>>> print(re.match(r"\d","b123a")) #匹配開頭，相當於脫字元

None

search() 遍歷字串，找到正則表示式匹配的第一個位置

findall() 遍歷字串，找到正則表示式匹配的所有位置並以列表的形式返回

sub() 替換類似於字串中 replace() 方法

>>> re.sub("i","o","pythin") #預設替換所有

'python'

>>> re.sub("i","o","pythin pythin pythin pythin",3) #指定次數

'python python python pythin'

檢視匹配物件中的資訊

group() 返回匹配到的字串

star() 返回匹配的開始位置

end() 返回匹配的結束位置

span() 返回一個元組表示匹配位置（開始，結束）

>>> c=re.search(r"\d","b35f3")

>>> c.group()

'3'

>>> c.start()

>>> c.end()

>>> c.span()

(1, 2)

Python中正則表示式介紹

正則正則表通常是用來檢索、替換那些符合某個模式(規則)的文字。也就是說使用正則表示式可以在字串中匹配出你需要的字元或者字串，甚至可以替換你不需要的字元或者字串。正則（不是python特有的）匹配字串,其他語言也有正則表示式例項：需求：輸入字元，判斷字

Python中正則表示式re.match的用法

re.match(pattern, string, flags) 第一個引數是正則表示式,如果匹配成功，則返回一個Match，否則返回一個None；第二個引數表示要匹配的字串；第三個引數是標緻位，用於控制正則表示式的匹配方式，如：是否區分大小寫，多行匹配等等。需要特別注意的是，這個方法並不是完

Python中正則表示式常用函式sub,search,findall,split等使用

1.原生字串r python中字串前面加上 r 表示原生字串,不會轉義。與大多數程式語言相同，正則表示式裡使用"\"作為轉義字元，這就可能造成反斜槓困擾。假如你需要匹配文字中的字元"\"，那麼使用程式語言表示的正則表示式裡將需要4個反斜槓"\\"：前兩個和後兩個分別用於在程式語言裡轉義成反斜

Python中正則表示式對單個字元，多個字元，匹配邊界等使用

Regular Expression，正則表示式，又稱正規表示式、正規表示法、正則表示式、規則表示式、常規表示法（英語：Regular Expression，在程式碼中常簡寫為regex、regexp或RE），是電腦科學的一個概

python中正則表示式1

1.模式語言 1）任何字元只與其本身匹配 2）"."匹配任意字元 3）"*" 表示其前面那個字元可匹配0個或任意多個相同字元 4）"^"只匹配目標串的開頭 5）"$"只匹配目標串的結尾 2.原始字串定義:在常規字串前加上r或者R字首. r'd:\test\1.t

python中正則表示式的使用

正則表示式 python中需要使用正則表示式對字串進行匹配的時候，需要匯入re模組 #coding=utf-8 # 匯入re模組 import re # 使用match方法進行匹配操作 result = re.match(正

python 中正則表示式用法 re.findall()

參考部落格原址：https://blog.csdn.net/YZXnuaa/article/details/79346963 <link rel="stylesheet" href="https://csdnimg.cn/relea

python中正則表示式庫re的使用（regex）

一、正則表示式庫的引用在python中，你要使用正則表示式，需要引用程式庫re。 import re 二、正則表示式函式說明： match =》嘗試在字串的開頭運用模式，返回一個match物件

Python中-正則表示式-說明

正則表示式: (regular expression) —>>>正則表示式是用來簡潔表達一組字串的表示式是一個描述字串模式的物件正則表示式主要用來驗證使用者的資料, 以及對文字內容的資訊過濾,獲取滿足條件的內容這樣做的好處是提高匹配效率,

Python 用正則表示式一次替換文章中所有特殊符號，如“-,$()#+&*”之類

一個簡單的正則表示式，可能會起大作用。比如說字符集就是這樣。一篇文章如果有各種亂碼，就可以用這種方法去除。如去除“-,$()#+&*”之類符號是很方便的。按照查詢、分割、替換的套路再做一做這樣的練習。今天晚了，後續還要操作檔案來完善這一點。 import re

C#中正則表示式使用介紹

　　4.4 匹配、組和捕獲　　一般表示式的一個很好的特性是可以把字元組合起來，方式與C#中的複合語句一樣。在C#中，可以通過把任意數量的語句放在花括號中的方式把它們組合在一起。其結果就像一個複合語句那樣。在一般表示式模式中，也可以把任何字元組合起來（包括元字元和轉義序列），像處理一個字元那樣處理它們。唯一

Python中正則表達式（re模塊）的使用

python中正則表達式Python中正則表達式（re模塊）的使用1、正則表達式的概述（1）概述：正則表達式是一些由字符和特殊符號組成的字符串，他們描述了模式的重復或者表示多個字符，正則表達式能按照某種模式匹配一系列有相似特征的字符串。正則表達式是一種小型的、高度的專業化的編程語言，（2）Python語言中的

python學習-正則表示式及re模塊

我只 com 返回現在輸出 -1 完全匹配 group clu python中的所有正則表達式函數都在re模塊中。import re導入該模塊。 1，創建正則表達式對象想re.compile()傳入一個字符串值，表示正則表達式，它將返回一個Regex模式對象。創建一

python中正則匹配字符配置單詞邊界不生效的解決辦法

re python duoceshi #-*-coding:utf-8-*-import rename="duoceshi"p= re.compile(‘\bduoceshi\b‘)f = p.search(name)if f: print f.group()################

python 中正則表達式的使用

定義重復 png expr color 事先正則表達式的使用轉義字符數字正則表達式的定義正則表達式（re）（Regular Expression）。正則表達式是對字符串操作的一種邏輯公式，就是用事先定義好的一些特定字符、及這些特定字符的組合，組成一個“規則字符串

python中正則表達式的一些問題

多次 eva family image 位數開心的人 rda span 今天聽到一句話，覺得很在理——"當你遇到一個問題，想到用正則表達式解決時，就變成了兩個問題" 這也從側面說明了正則表達式比較難理解。下面我將用通俗易懂的方式總結一下，最近遇到的一些正則表達式的問題

Python中正則匹配使用findall,捕獲分組(xxx)和非捕獲分組(?:xxx)的差異

bbb tps img 是把區別內容是我解答什麽是轉自：https://blog.csdn.net/qq_42739440/article/details/81117919 下面是我在用findall匹配字符串時遇到的一個坑，分享出來供大家跳坑。例題：如圖

php 中正則表示式詳解

概述正則表示式是一種描述字串結果的語法規則，是一個特定的格式化模式，可以匹配、替換、擷取匹配的字串。常用的語言基本上都有正則表示式，如JavaScript、java等。其實，只有瞭解一種語言的正則使用，其他語言的正則使用起來，就相對簡單些。文字主要圍繞解決下面問題展開。有哪些常用的

WPF中正則表示式的部分應用

無論在哪一種語言中，正則表示式在一定程度上都可以簡化程式碼程式設計。以下為在WPF中的部分應用。如var sql = new System.Text.RegularExpressions.Regex("[\\r\\n]").Replace(str, " "); 表示對str字串中匹配換行符

【轉】Python之正則表示式（re模組）

【轉】Python之正則表示式（re模組）本節內容 re模組介紹使用re模組的步驟 re模組簡單應用示例關於匹配物件的說明說說正則表示式字串前的r字首 re模組綜合應用例項參考文件提示：由於該站對MARKDOWN的表格支援的不是很好，所以本文中的表

Python中正則表示式介紹

相關推薦