Python 學習（3）——re模組

阿新 • • 發佈：2019-01-29

最近也用到了重新模組，內嵌的重新模組提供了正則表示式相關的功能。傳說中，正則表示式模式被編譯成一系列的位元組碼，然後由用Ç編寫的匹配引擎執行。

常用的方法如下：

模式：匹配的正則表達是

串：要匹配的字串

國旗：標識位

1：re.match（pattern，string，flags = 0）

從字串的起始位置進行匹配，如果不是起始位置匹配成功的話，匹配（）就返回無。如果匹配成功，則返回的應該是MatchObject，MatchObject還有一系列方法，後面介紹

2：re.search（pattern，string，flags = 0）

掃描整個字串，並返回第一個成功的匹配，否則返回無。匹配成功，返回的是

MatchObject

3：re.sub（pattern，repl，string，count = 0，flags = 0）替換字串中的匹配項。

REPL：替換的字串，也可以為一個函式（可以為函式名稱，呼叫函式，對匹配的內容進行處理）,返回的是替換後的字元

count：模式匹配後替換的最大次數，預設0表示替換所有的匹配

4：re.compile（pattern [，flags]）// flags：可選

用於編譯正則表示式，生成一個正則表示式（Pattern）物件，供match（）和search（），findall這兩個函式使用。

例如：pattern = re.compile（r'\ d +'）

m = pattern.match（'one12twothree34four'）

5：re.findall（string [，pos [，endpos]]）

在字串中找到正則表示式所匹配的所有子串，並返回一個列表，如果沒有找到匹配的，則返回空列表。

也可以先進行編譯，然後pattern.findall（）方式呼叫

6：re.finditer（pattern，string，flags = 0）

和findall類似，在字串中找到正則表示式所匹配的所有子串，並把它們作為一個迭代器返回。

7：re.split（pattern，string [，maxsplit = 0，flags = 0]）// maxsplit分隔次數，maxsplit = 1分隔一次，預設為0，不限制次數

按照能夠匹配的子串將字串分割後返回列表

例如：

string_test =“123234567890”

pattern = '23'

match = re.split（pattern，string_test）

輸出的結果為['1'，'4567890']

8: MatchObject的屬性和方法

方法/屬性	作用
group()	返回被 RE 匹配的字串
start()	返回匹配開始的位置
end()	返回匹配結束的位置
span()	返回一個元組包含匹配 (開始,結束) 的位置

9: flags 可選標誌

修飾符	描述
re.I	使匹配對大小寫不敏感
re.L	做本地化識別（locale-aware）匹配
re.M	多行匹配，影響 ^ 和 $
re.S	使 . 匹配包括換行在內的所有字元
re.U	根據Unicode字符集解析字元。這個標誌影響 \w, \W, \b, \B.
re.X	該標誌通過給予你更靈活的格式以便你將正則表示式寫得更易於理解。

10: 正則表示式模式匹配規則

有很多匹配規則，下面列出常用的內容：

*：匹配0個或者多個

+：匹配1個或者多個

？：匹配0個或者1個

（）：括號內的表示式，表示一個組，匹配的時候，findall的時候，會返回（）中的內容

Python 學習（3）——re模組

最近也用到了重新模組，內嵌的重新模組提供了正則表示式相關的功能。傳說中，正則表示式模式被編譯成一系列的位元組碼，然後由用Ç編寫的匹配引擎執行。常用的方法如下：模式：匹配的正則表達是串：要匹配的字串國旗：標識位 1：re.match（pattern，strin

python學習（3）--讀取配置文件

封裝 pri 配置文件 ret charm 127.0.0.1 os.path 關於 database 一、關於配置文件 ini文件由三部分組成，分別為節、鍵、值。節　　[section] 參數（鍵=值）　　name=value 註解　　

Python學習（3）——高階特性

1、切片（1）後10個數：L[-10:] （2）前10個數，每兩個取一個：L[:10:2] （3）倒序：L[::-1] https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542

Python學習（3）—— 基本資料型別一：數字型別

基本資料型別一：數字型別 Python中最基本的資料型別之一就是int資料型別。數字型別中有int、long 、float、complex。 python3.x之後已經不區分int和long,統一用int；python2.x還是區分的。 floa

python學習（3）scrapy

Scrapy和MongoDB構建爬蟲系統一）元件 1、Scrapy Engine（Scrapy引擎） Scrapy引擎是用來控制整個系統的資料處理流程，並進行事務處理的觸發。更多的詳細內容可以看下面的資料處理流程。 2、Scheduler（排程）

python學習（3）- If, while, break, contiune

1. If 控制語句：注意If 和 elif ，else後面的冒號。 age = 3 if age >= 18: print('adult') elif age >= 6: print('teenager

python學習（3）Urllib庫的基本使用

Urllib是Python內建的HTTP請求庫 urllib.request 請求模組 urllib.error 異常處理模組 urllib.parse url解析模組 urllib.robotparser

python學習（十三）——模組time、random、os、sys、json、re

一、概念模組 1、三種類型：（1）python標準庫（2）第三方模組（3）自定義模組 2、匯入（1）import： 1）執行；2）呼叫（2）from __ import * (不推薦) （3）執行對應檔案

PYTHON設計模式學習（3）：Singleton pattern

blog ora 參考擁有沒有 _屬性 ces cti ttr 參考了其他的博客：http://ghostfromheaven.iteye.com/blog/1562618 #-*- encoding=utf-8 -*- print ‘--------------

Python爬蟲學習（3）

collect nbsp pri div time urlparse links ews 是否在慕課網學習並創建了一個簡單的爬蟲包，爬取百度百科相關詞條信息程序中會用到第三方解析包（BeautifulSoup4），Windows環境下安裝命令：pip install B

Python學習（二）-常見問題（3）IndentationError: unindent does not match any outer indentation level

Python學習（二）-常見問題（3）IndentationError: unindent does not match any outer indentation level 以下程式碼最後一行語句縮排數的空格數不一致，會導致執行錯誤： cat b.

python進階（2）——re模組：正則表示式1

實驗結果輸出文件，包括多項引數（大約幾百個），想把所有的loss value對應的值提取出來，畫出曲線圖，這就需要用到正則表示式，基於此，開始學習正則表示式。正則表示式：可匹配文字片段的模式萬用字元：句點.(.ython與jpython與python與 ython都匹配，但不與ython

python進階（2）——re模組：正則表示式2

re.split 根據模式來分割字串 import re text='a, b,,,,c d' print(re.split('[, ]+', text)) #re.split:以空格和字串分割字元 re.findall 返回列表，包含所有與給定模式匹配的子串 import re

神經網路學習（3）————BP神經網路以及python實現

一、BP神經網路結構模型 BP演算法的基本思想是，學習過程由訊號的正向傳播和誤差的反向傳播倆個過程組成，輸入從輸入層輸入，經隱層處理以後，傳向輸出層。如果輸出層的實際輸出和期望輸出不符合

Python學習（11）——常用的第三方模組

基本上，所有的第三方模組都會在PyPI - the Python Package Index上註冊，只要找到對應的模組名字，即可用pip安裝。此外，在安裝第三方模組一節中，我們強

Python學習（10）——常用的內建模組

跳過程序執行緒跳過正則 1、datetime：處理日期和時間的標準庫 https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/001431937554888869fb52

Python學習（5）——模組

1、模組說明（1）每一個包目錄下面都會有一個__init__.py的檔案，這個檔案是必須存在的，否則，Python就把這個目錄當成普通目錄，而不是一個包（2）模組名不要和系統模組名衝突，最好先檢視系統是否已存在該模組，檢查方法是在Python互動環境執行import abc，若成功則

python ：collections模組（3）Counter模組以及deque模組

#Counter模組統計型別類，定義跟蹤值出現的次數引數為必須為可迭代物件，如列表，字串，集合 #統計集合中元素出現的次數 from collections import Counter #統計類 users ={"body_1","body_3","bod

Python入門學習（3）

操作列表 1.使用for迴圈來列印魔術師列表中的所有名字： magicians = ['alice','david','carolina'] for magician in magicians: print(magician) 在for迴圈中，想包含多少

python 正則表示式（一） re模組match、search、findall、finditer 使用demo

''' 正則表示式的功能全部在re模組上實現 1)match函式：嘗試從字串的起始位置匹配一個模式，如果不是從起始位置匹配成功也返回None def match(pattern, string, flags=0): patter:匹配的正則表示式 string:要匹配的字串 flags:標誌位，用

Python 學習（3）——re模組

相關推薦