re 模組常規方法使用

阿新 • • 發佈：2019-01-11

前情提要:

　　　　re模組主要用於正則,用的好了秒殺一切匹配的規則,這裡主要是介紹基本用法

　　　　　　一:元字元

　　　　　　　　1:\w 匹配字元,包含中文,數字或下劃線

l ='早乙女露依 123  是我的 321 心目中的 222 女神 666 女神 '


# print(re.findall('\w',l))    # ['早', '乙', '女', '露', '依', '是', '我', '的', '心', '目', '中', '的', '女', '神', '女', '神']

　　　　　　　　2:\W 匹配非字元,包含中文,數字或下劃線

l ='早乙女露依 123  是我的 321 心目中的 222 女神 666 女神 '


# print(re.findall('\W',l)) #[' ', ' ', ' ', ' ', ' ', ' ', ' ']

　　　　　　　　3:\s 匹配任意的空白符

#\s 匹配任意的空白符
# print(re.findall('\s',l))   #[' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ']

　　　　　　　　4:\S 匹配任意的空白符

#\S 匹配任意非空白符
# print(re.findall('\S',l))   #['早', '乙', '女', '露', '依', '1', '2', '3', '是', '我', '的', '3', '2', '1', '心', '目', '中', '的', '2', '2', '2', '女', '神', '6', '6', '6', '女', '神']

　　　　　　　　5:\d 匹配任意的數字

#\d 匹配數字
# print(re.findall('\d',l))  #['1', '2', '3', '3', '2', '1', '2', '2', '2', '6', '6', '6']

　　　　　　　　6:\D匹配任意的非數字

#\D 匹配非數字
# print(re.findall('\D',l))  #['早', '乙', '女', '露', '依', ' ', ' ', ' ', '是', '我', '的', ' ', ' ', '心', '目', '中', '的', ' ', ' ', '女', '神', ' ', ' ', '女', '神', ' ']

　　　　　　　　7:\A ^ 匹配任意字串的開始

# \A   ^ 匹配字串的開始
# print(re.findall('\A早',l)) #['早']

　　　　　　　　8:\Z $ 匹配任意字串的結尾

#\Z    $ 匹配字串的結尾
# print(re.findall('神 $',l))  #['神 ']

　　　　　　　　9: \t \ n 匹配任意空白符

#\n  \t  匹配空白符
# print(re.findall('\n',l))

　　　　　　二:重複匹配

　　　　　　　　1: . 匹配任意字元

#. 匹配任意字元
# print(re.findall('早.女',l)) # ['早乙女']

　　　　　　　　2: ? 匹配0個或者一個左面的定義規則內容

#? 匹配0個或者1一個由左面字元定義的片段
# l ='abbzab abb aab'
# print(re.findall('a?b',l))

　　　　　　　　3: * 匹配0 個或者多個左面的定義規則內容

#* 匹配0個或者多個左面字元表示式
# l ='b ab aaaaaab abbbabaabbabbba'
# print(re.findall('a*b',l))          #['b', 'ab', 'aaaaaab', 'ab', 'b', 'b', 'ab', 'aab', 'b', 'ab', 'b', 'b']

　　　　　　　　4: + 匹配1 個或者多個左面的定義規則內容

# +匹配1個或者多個左面字元表示式
# l ='b ab aaaaaab abbbabaabbabbba'
# print(re.findall('a+b',l))      #['ab', 'aaaaaab', 'ab', 'ab', 'aab', 'ab']

　　　　　　　　5: {n,m} 匹配n 至m 個左面的定義規則內容

#{n,m} 匹配n至m個左面字元的表示式
# l ='b ab aaaaaab abbbabaabbabbba'
# print(re.findall('a{4,5}b',l))          #['aaaaab']

　　　　　　　　6: .* 貪婪匹配從頭匹配到尾巴

# .* 貪婪匹配  從頭匹配到尾巴
# l ='b ab aaaaaab abbbabaabbabbba'
# print(re.findall('a.*b',l))      # ['ab aaaaaab abbbabaabbabbb']

　　　　　　　　7: .*? 非貪婪匹配從頭匹配到尾巴

#.*?非貪婪匹配 ，從頭匹配到尾巴
# l ='b ab aaaaaab abbbabaabbabbba'
# print(re.findall('a.*?b',l))      #['ab', 'aaaaaab', 'ab', 'ab', 'aab', 'ab']

　　　　　　　　8:[ ] 加入引數匹配

[]      加入引數
# print(re.findall('a[abc]b','aab abb acb aaacb'))   #['aab', 'abb', 'acb', 'acb']

　　　　　　　　9:[0-9] 加入數字匹配

#[0-9]
# print(re.findall('a[0-9]b','a2b a3b a0b aaf  aab'))   #['a2b', 'a3b', 'a0b']

　　　　　　　　10:[a-z] 加入小寫字母匹配

#[a-z]
# print(re.findall('a[a-z]b','abb bcb acb  afb asssddb')) #['abb', 'acb', 'afb']

　　　　　　　　11:[A-Z] 加入大寫字母匹配

#[A-Z]
# print(re.findall('a[A-Z]b','aAb aCb Abb ABB'))      #['aAb', 'aCb']

　　　　　　　　12:[a-zA-Z] 注意不能倒過來, 需要小的在前面

# print(re.findall('a[a-zA-Z]b','aAb aCb Abb ABB'))    #['aAb', 'aCb']

　　　　　　　　13: () 定製一個規則, 將滿足的規則匹配出來

# print(re.findall('(.*?)_b','wo_b chi_b hhe_b  fas adadas_bd')) #['wo', ' chi', ' hhe', '  fas adadas']

　　　　　　三: 常用方法總結

　　　　　　　　　　1:search 找到第一個規則,找不到則返回None

　　　　　　　　　　　　物件.group() 呼叫

# print(re.search('alex','re alex alex 太白').group())        #alex
# print(re.search('alex','re aaleex aaleex 太白'))     #None

　　　　　　　　　　2:match 匹配開頭文字,如果匹配不到就None

# print(re.match('alex','alex alex 太白').group())     #alex
# print(re.match('alex','re alex alex 太白')) #None

　　　　　　　　　　3:spilt 切割

# s1 = 'wusir;太白,alex|日天!小虎'
# print(re.split(';,|!',s1))    #['wusir;太白,alex|日天', '小虎']

　　　　　　　　　　4:compile() 制定一個規則

# re.I(re.IGNORECASE)
# 使匹配對大小寫不敏感
#
# re.L(re.LOCAL)
# 做本地化識別（locale-aware）匹配
#
# re.M(re.MULTILINE)
# 多行匹配，影響 ^ 和 $
#
# re.S(re.DOTALL)
# 使 . 匹配包括換行在內的所有字元
#
# re.U(re.UNICODE)
# 根據Unicode字符集解析字元。這個標誌影響 \w, \W, \b, \B.
#
# re.X(re.VERBOSE)
# 該標誌通過給予你更靈活的格式以便你將正則表示式寫得更易於理解。

re 模組常規方法使用

前情提要: 　　　　re模組主要用於正則,用的好了秒殺一切匹配的規則,這裡主要是介紹基本用法　　　　　　一:元字元　　　　　　　　1:\w 匹配字元,包含中文,數字或下劃線 l ='早乙女露依 123 是我的 321 心目中的 222 女神 666 女神 ' #

正則表示式 re模組 re模組實用方法

一. 正則表示式　　首先, 我們在網⻚上進行註冊或者登陸的時候經常能看到一些格式上的錯誤提示. 比如:你在註冊百度賬號的時候輸入使用者名稱隨意的輸入系統會提示你. 你的賬號過長或者不允許使用中文等等操作. 那這種操作如果使用我們現有的知識點是可以完成的. 但是完成的效果並不好. 寫起來也

python re模組常用方法總結

res = re.match(pattern, string, flags=0) #字串的開頭是否能匹配正則表示式。返回_sre.SRE_Match物件，如果 #不能匹配返回None。 # 如果匹配的話

Python re模組相關方法介紹

【程式碼示例】re模組方法使用。>>> import re>>> text="172.0.0.1">>> print(re.split("[\.]+",text))#按照模式進行字串分割，此處按照“.”進行分割['172'

Python的re模組常用方法

re模組下的常用方法： search 匹配就返回一個變數,通過group取匹配到的第一個值,不匹配就返回None,group會報錯match 相當於search的正則表示式中加了一個'^'spilt 返回列表,按照正則規則切割,預設匹配到的內容會被切掉sub/subn 替換,按照正則規則去尋找要被替

re模組：核心函式與方法

1.group和groups的區別： n.group（N）返回第N組括號匹配的字元 n.group()==n.group(0)==返回所有匹配的字元 n.groups() 返回所有括號匹配的字元，以元組格式，沒有子組的時候將返回空元組示例：具體可見：https:/

re模組方法

findall 查詢所有匹配項，返回的是一個列表 import re re.findall("\d+", "alex12lucy22") # ["12", "22"] search 只返回第一次匹配項，返回一個group物件 import re re.search("\

re模組中match物件的方法和屬性

屬性和方法說明 Pos 搜尋的開始位置 Endpos 搜尋的結束位置 String 搜尋的字串 Re 當前使用的正則表示式的物件 Lastindex 最後匹配的組索引 Lastgroup 最後匹配的組名 group(index=0)

re模組中match物件中的方法和屬性

match物件的方法和屬性屬性和方法描述 pos 搜尋的開始位置 endpos 搜尋的結束位置 string 搜尋

Python3，通過re模組中的sub()和findall()2個方法提升爬蟲提取資料的效率

直接上Demo：測試資料 - HTML： '''<div id=\"songs-list\">" "<h2 class=\"title\">各種汽車</h2>" "<p class=\"introduction\"&

Python安裝模組（numpy等）問題的兩種解決辦法——常規方法和Anaconda

一.常見模組安裝問題 Python是現在最頂尖的幾個研究方向（人工智慧、機器學習等）的主流程式語言，博主因為要參加競賽也需要學習Python（主要是科學計算方面），現階段會用到的模組有numpy、scipy、matplotlib及scikit-learn（在f

python-re模組常用的函式及方法

常見的正則表示式屬性僅僅是re模組函式 compile(pattern，flags= 0) 使用任何可選的標記來編譯正則表示式的模式，然後返回一個正則表示式物件 re 模組函式和正則表示式物件的方

python3 學習5 正則表示式，re模組學習

正則表示式：正則表示式有特殊的語法，有些符號需要轉義，所以一般來說使用原始字串模式，也就是r''。轉自：https://blog.csdn.net/qq_33720683/article/details/81023115 模式描述

Python numpy模組常用方法

Python numpy模組常用方法文章轉載自：https://www.zybuluo.com/Frankchen/note/338294 python 建立矩陣（採用ndarray物件）對於python中的numpy模組，一般用其提供的ndarray物件。建立一個n

Python面試題----Python 的re模組中match、search、findall、finditer的區別

請簡要說明Python 的re模組中match、search、findall、finditer的區別 re是Python中用於正則表示式相關處理的類，這四個方法都是用於匹配字串的，具體區別如下： match 匹配string 開頭，成功返回Match object

Python常用模組——re模組

　　有些人在面臨問題的時候會想：“我知道，我將使用正則表示式來解決這個問題。”這讓他們面臨的問題變成了兩個。　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　—— Jamie Zawinski 首先我們對比一下兩段程式碼處理使用者輸入手機號的不同 1 pho

Python進階——re模組

1.首先匯入re模組 import re (1) re.match()函式對字串的從字串的開頭進行匹配用法： re.match(pattern,string) import re pat="\d+" s="abc123abc123456" print(re.matc

ansible模組速記方法

在出去面試時，總會遇到面試官詢問ansible 模組你用過哪些，至於ansible的模組，說多不多，基礎模組常用的也就那麼幾個，那針對於相應模組我們怎麼達到速記的效果呢？這裡編寫了一個速記的方法，僅供參考！！ ansible常用模組記錄： 1、ping模組 2、raw模組 3、yum模組

【轉】Python之正則表示式（re模組）

【轉】Python之正則表示式（re模組）本節內容 re模組介紹使用re模組的步驟 re模組簡單應用示例關於匹配物件的說明說說正則表示式字串前的r字首 re模組綜合應用例項參考文件提示：由於該站對MARKDOWN的表格支援的不是很好，所以本文中的表

PYTHON03 - re模組網路程式設計和socket模組

一、re模組 1.1 正則表示式 1.1.1 正則表示式 1.匹配單個字元 2.匹配一組字元 3.其他元字元附： [ ^ ]:出現在中括號開頭表示的是取反 4.貪婪匹配 1. *、+和?都是貪婪匹配操作符,在其後加

re 模組 常規方法使用

相關推薦

re 模組常規方法使用