re.1-常用表示式規則

阿新 • • 發佈：2020-10-10

一、正則表示式的含義

定義：即文字的高階匹配模式,提供搜尋替換等功能.其本質是一系列由字元和特殊符號組成的字串,這個字串即正則表示式
匹配原理：由普通的字元和特殊符號構成,通過描述字元的重複,位置,種類等行為達到匹配某一類字串的目的
正則特點：方便處理文字，支援語言眾多，使用靈活多樣

二、正則語法

re.findall(pattern,string)

- 功能: 使用正則表示式匹配字串
- 引數
  - pattern 正則表示式
  - string 目標字串
- 返回值 : 返回匹配內容列表

三、正則表示式模式

1. 普通字元

元字元 : a B c
匹配規則: 每個字元匹配對應的自身字元

In [15]: re.findall(' 
ab','abcdaefabcdef')
Out[15]: ['ab', 'ab']

In [16]: re.findall('你好','你好,北京')
Out[16]: ['你好']

2. 或

元字元 : |
匹配規則: 匹配 | 兩邊任意一個正則表示式

In [24]: re.findall('ab|cd',"abcdef")
Out[24]: ['ab', 'cd']

3. 匹配單個字元

元字元 : .
匹配規則: 匹配除換行外任意一個字元

f.o --> foo fao

In [25]: re.findall('f.o',"foo fao")
Out[25]: ['foo 
', 'fao']

4. 匹配字串開始位置

元字元 : ^
匹配規則: 匹配目標字串的開始位置

In [29]: re.findall('^Jame',"Jame is a boy")
Out[29]: ['Jame']

5. 匹配字串結束位置

元字元 : $
匹配規則: 匹配目標字串的結束位置

In [32]: re.findall('Jame$',"Hi,Jame")
Out[32]: ['Jame']

6. 匹配重複

元字元 : *
匹配規則: 匹配前面的字元出現0次或多次

fo* --> fooooooooooo f

In [34]: re.findall('fo*'," 
fooooooabceffo")
Out[34]: ['foooooo', 'f', 'fo']

7. 匹配重複

元字元: +
匹配規則 : 匹配前面的字元出現1次或多次

fo+ --> fooooooooooo fo

In [37]: re.findall('fo+',"fooooooabceffo")
Out[37]: ['foooooo', 'fo']

8. 匹配重複

元字元 : ?
匹配規則 : 匹配前面的字元出現0次或1次

fo? --> f fo

In [43]: re.findall('fo?',"fooooooabceffo")
Out[43]: ['fo', 'f', 'fo']

9. 匹配重複

元字元 : {n}
匹配規則 : 匹配前面的字元重複指定的次數

fo{3} --> fooo

In [46]: re.findall('fo{3}',"fooooooabceffo")
Out[46]: ['fooo']

10. 匹配重複

元字元 : {m,n}
匹配規則 : 匹配前面的字元出現 m -- n次

fo{2,4} --> foo fooo foooo

In [49]: re.findall('fo{2,4}',"fooooooabceffoo")
Out[49]: ['foooo', 'foo']

11. 匹配字符集

元字元: [字符集]
匹配規則: 匹配字符集中任意一個字元

[abc123] --> a b c 1 2 3
[a-z] [A-Z] [0-9]
[$#_a-zA-Z]

In [50]: re.findall('[A-Z][a-z]*',"Hi,This is Lua")
Out[50]: ['Hi', 'This', 'Lua']

12. 匹配字符集

元字元 : [^...]
匹配規則 : 匹配除指定字元外的任意一個字元

[^abc] --> 除了a b c外任意一個字元
[^a-z]

In [61]: re.findall('[^ ]+',"This is a test")
Out[61]: ['This', 'is', 'a', 'test']

13. 匹配任意(非)數字字元

元字元 : \d \D
匹配規則:

\d 匹配任意一個數字字元 [0-9]
\D 匹配任意一個非數字字元 [^0-9]

In [63]: re.findall('\d+',"2018年就快過去,2019馬上到來")
Out[63]: ['2018', '2019']

14. 匹配任意(非)普通字元

元字元 : \w \W
匹配規則:

\w 匹配普通字元 (數字字母下劃線,utf8字元)
\W 匹配特殊字元

In [71]: re.findall('\w+',"PORT#1234,Error 44% 下降")
Out[71]: ['PORT', '1234', 'Error', '44', '下降']

15. 匹配任意(非)空字元

元字元 : \s \S
匹配規則:

\s 匹配任意空字元 [ \r\n\t\v\f]
\S 匹配任意非空字元

In [72]: re.findall('\w+\s+\w+',"hello world")
Out[72]: ['hello world']

In [74]: re.findall('^\S+',"Terna-123#H xxxxxxx")
Out[74]: ['Terna-123#H']

16. 匹配字串開頭結尾位置

元字元 : \A \Z
匹配規則:

\A 匹配字串開頭位置
\Z 匹配字串結尾位置

In [80]: re.findall('\A\d+-\d+\Z',"1000-15000")
Out[80]: ['1000-15000']

絕對匹配(完全匹配) : 保證正則表示式匹配目標字串的全部內容

17. 匹配(非)單詞邊界

元字元 : \b \B
匹配規則:

\b 匹配單詞邊界 (普通字元和其他字元的交接)
\B 匹配非單詞邊界

In [85]: re.findall(r'\bis\b',"This is a boy")
Out[85]: ['is']

In [86]: re.findall(r'\Bis',"This is a boy")
Out[86]: ['is']

18.元字元總結

匹配單個字元: . [...] [^...] \d \D \w \W \s \S

匹配重複: * + ? {n} {m,n}

匹配位置: ^ $ \A \Z \b \B

其他: | () \

19.正則表示式的轉義

正則特殊符號: . * + ? ^ $ () [] | \

正則表示式如果匹配特殊字本身符則需要加\
e.g. 匹配字元 . 用 \.

目標字串正則表示式字串
$10 \$\d+ "\\$\\d+"

raw字串: 對字串不進行轉義解析

r'\$\d+' ==> '\\$\\d+'

20.貪婪和非貪婪

貪婪模式: 正則表示式的重複匹配預設總是儘可能多的向後匹配內容

* + ? {m,n}

非貪婪(懶惰)模式 : 儘可能少的匹配內容

貪婪-->非貪婪 *? +? ?? {m,n}?

In [105]: re.findall(r'ab+?',"abbbbbbbbb")
Out[105]: ['ab']

........待補充

re.1-常用表示式規則

一、正則表示式的含義定義：即文字的高階匹配模式,提供搜尋替換等功能.其本質是一系列由字元和特殊符號組成的字串,這個字串即正則表示式

Python re正則表示式元字元分組()用法分享

分組小括號() 有直接分組和命名分組直接分組:()分組只顯示小括號括起來的內容

idea2020.1 常用設定圖文詳解

停用自動更新停用自動更新，因為我也不知道更新後能不能用。。。 ## 設定作者和程式碼相關資訊在右方寫這些東西，下面的description中有相關變數的描述，可以根據情況寫

IDEA2020.1常用配置說明

該配置基於IDEA2020.1版本,如後續有版本更新或者配置變更,再更新 idea64.exe.vmoptions配置

.Net Core3.1 常用的服務注入

用.CORE3.1構建了專案，在Startup.cs進行服務注入，這裡記錄下： 1、SuppressModelStateInvalidFilter

RE正則表示式-元字元

下表包含了元字元的完整列表以及它們在正則表示式上下文中的行為：字元描述

RE正則表示式-語法

正則表示式(regular expression)描述了一種字串匹配的模式（pattern），可以用來檢查一個串是否含有某種子串、將匹配的子串替換或者從某個串中取出符合某個條件的子串等。

element-時間選擇器--常用時間規則

1、結束時間大於開始時間 pickerOptions0: { disabledDate: time => { if (this.queryForm.operateEndTime !== null) {

九齒耙(Ninerake)資料採集大資料深度學習智慧分析Python爬蟲軟體的正則表示式規則簡介

正則表示式易於使用，功能強大，可用於複雜的搜尋和替換以及基於模板的文字檢查。這對於輸入形式的使用者輸入驗證特別有用-驗證電子郵件地址等。您還可以從網頁或文件中提取電話號碼，郵政編碼等，在日誌檔案中搜索複

pytest從入門到放棄1--pytest執行規則

1、pytest安裝：　pip install -U pytest -i https://pypi.tuna.tsinghua.edu.cn/simple 2、pytest執行方式：

java安全編碼指南之:表示式規則說明

簡介在java編寫過程中，我們會使用到各種各樣的表示式，在使用表示式的過程中，有哪些安全問題需要我們注意的呢？一起來看看吧。

SQL 遊標[1] - 常用引數及示例

SQL 遊標[1] - 常用引數及示例遊標，簡單說明：將整個結果集作為一個單元來有效地處理，每次處理一行或一部分行

哈工大資料結構作業1 算術表示式求值

哈工大資料結構作業1 需要程式碼的直接加QQ:1755786931 ，備註作業1程式碼即可。或者csdn直接私聊我(回覆很慢，不是很經常看csdn)

re正則表示式

引子請從以下檔案裡取出所有的手機號姓名地區身高體重電話況詠蜜北京1714813651054608

re正則表示式返回空值_Python 基礎（二十二）：正則表示式

技術標籤：re正則表示式返回空值 1. 簡介正則表示式是一個強大的字串處理工具，幾乎所有的字串操作都可以通過正則表示式來完成，其本質是一個特殊的字元序列，可以方便的檢查一個字串是否與我們定義的字元

Angular10教程--2.1 模版表示式與屬性繫結

技術標籤：angular教程angular 這一節，我們主要講angular的模版表示式，以及屬性、class、style、事件的繫結～原文閱讀

Python爬蟲教程： re正則表示式解析html頁面

技術標籤：python正則表示式正則表示式（Regular Expression）是一種文字模式，包括普通字元（例如，a 到 z 之間的字母）和特殊字元（稱為"元字元"）。正則表示式通常被用來匹配、檢索、替換和分割那

python通過re正則表示式切割中英文的操作

我就廢話不多說了，大家還是直接看程式碼吧~ import re s = \'alibaba阿里巴巴\' # 待分割字串

1. 常用的一些系統性能排查linux命令

當系統存在短板時，就會對效能造成較大的負面影響，比如當 CPU 的負載特別高時，任務就會排隊，不能及時執行。而其中，CPU、記憶體、I/O 這三個系統元件，又往往容易成為瓶頸，所以接下來我會對這三方面分別進行講

1 常用的Pandas函式

20個常用的函式方法 1.讀取資料 marketing = pd.read_csv(\"DirectMarketing.csv\") groceries = pd.read_csv(\"Groceries_dataset.csv\")

re.1-常用表示式規則

一、正則表示式的含義

二、正則語法

三、正則表示式模式

相關推薦