15-正則表示式

阿新 • • 發佈：2020-11-20

正則表示式三個方法

Regular Expression
- 匹配有規則的字串
import re
re.match()
- 匹配字串是否以指定正則表示式開頭
  - res = re.match('\d+', '123456') # object,返回物件或者None
re.search()
- 匹配字串是否包含表示式
  - res2 = re.search('oog', 'google') # object，返回物件或者None
    - ```
    # re.I忽略大小寫
    res2 = re.search('GOO', 'google', re.I)  # object
```
re.findall()
- 獲取所有匹配的子字串，返回的是列表
  - res3 = re.findall('goo', 'google google google') # ['goo', 'goo', 'goo']，如果匹配不到則返回空列表

匹配單個字元

.
- . 表示匹配任意單個字元，除了換行\n
- print(re.search('go.gle', 'go\ngle', re.S)) # 物件
  - re.S可以讓 . 匹配\n
[]
- 表示匹配單個字元的範圍
- [abc]:匹配a或b或c
- [a-zA-Z0-9_]:匹配數字字母下劃線
- print(re.search('go[a-zA-Z0-9_]gle', 'go_gle')) # 物件
\d
- 表示數字，等價於[0-9]
- \D :表示非數字，等價於[^0-9]
- print(re.search('go\dgle', 'go8gle')) # 物件
\w
- 表示數字字母下劃線，等價於[a-zA-Z0-9_]
- \W表示非數字字母下劃線，等價於[^a-zA-Z0-9_]
- print(re.search('go\wgle', 'go8gle')) # 物件
\s
- 表示空格或換行\n 或製表符\t 或換頁符\f 回車符\r
- \S表示非（空格或換行\n 或製表符\t 或換頁符\f 回車符\r）
- print(re.search('go\Sgle', 'go gle')) # None

表示數量的符號

?
- 表示前面的字元可以出現0次或1次
  - print(re.findall('go?gle', 'google')) # [] # 非貪婪(最多匹配一個)
- 表示前面的字元可以出現1次或多次
- print(re.findall('go+gle', 'gooogle')) # ['gooogle'] # 貪婪(儘量多個匹配)
- *表示前面的字元可以出現0次或多次
  - print(re.findall('g.*gle', 'g123abc,.;gle')) # ['g123abc,.;gle']
{}
- 表示前面字元出現的次數範圍
- {3} ：表示前面字元出現3次
- {2, 5} ：表示從2次~5次之間
- {2,}
- {,5}
  - print(re.findall('go{2,5}gle', 'gooogle')) # ['gooogle'],2和5之間不能加空格 # 貪婪

注意r''只能消除字串中的語義，不影響正則的語義，因此要匹配點(.)，需要在點前加\

邊界符號（錨字元）

^
- ^ ：開頭匹配
$
- $ :結尾匹配
^$
- ^$ ：完全匹配：除了正則中的字串以外，不可以有其他多餘的字元
其他邊界字串
- \A\Z
  - 與^$作用基本一致
  - 區別
    - print(re.findall('^#', '#google\n#baidu\n#360', re.M)) # ['#', '#', '#']
    - print(re.findall('\A#', '#google\n#baidu\n#360', re.M)) # ['#']
    - re.M
      - re.M: 換行模式
\b
- 以單詞結尾
- \B以非單詞結尾
chinesePattern = "[\u4e00-\u9fa5]+"

分組和捕獲

分組
- ()
  - () :表示整體，還可以表示分組
    - ```
    s = '0755-88888888'
    pattern = '(\d{4})-(\d{8})'
    # pattern = '\d{4}-\d{8}'
    res = re.search(pattern, s)
```
- print(res.group()) # '0755-88888888'
- print(res.group(0)) # '0755-88888888'
- print(res.group(1)) # '0755', 第一個分組（第一個括號的內容）
- print(res.group(2)) # '88888888', 第二個分組（第二個括號的內容）
- print(res.groups()) # ('0755', '88888888'),獲取所有分組

捕獲

用findall(),返回列表

pattern = r'(\d+)萬到(\d+)萬盧比'
res = re.findall(pattern, s)  # 捕獲()裡面的
print(res)  # [('15', '40')]

別名

?P<別名>

pattern = r'(?P<start>\d+)萬到(?P<end>\d+)萬盧比'
res = re.search(pattern, s)
print(res.group('end'))  # 40
print(res.group('start'))  # 15

編譯正則

編譯正則：建立一個正則表示式物件，效率更高

# re.compile()

pattern = re.compile(r'(\d+)萬到(\d+)萬盧比')
res = pattern.findall(s)
print(res)  # [('15', '40')]

非捕獲性分組

pattern = r'(\d+)萬到(?:\d+)萬盧比'
res = re.findall(pattern, s)
print(res)  # ['15']

其他正則函式

re.finditer

匹配後的結果=>迭代器

res = re.finditer(r'\d+', '123abc456def678')
print(res)  # 迭代器，<callable_iterator object at 0x0000026B6059F7C8>
for i in res:
    # print(i)
    print(i.group(), i.span())
'''
123 (0, 3)
456 (6, 9)
678 (12, 15)
'''

re.split

分割/拆分

s = 'hello world'
print(re.split(r'l|\s', s))  # ['he', '', 'o', 'wor', 'd']
print(re.split(r'l|o', s))  # ['he', '', '', ' w', 'r', 'd']

|表示或者

re.sub

替換

s = 'today is a good day today is a nice day'
print(re.sub(r'\s', '-', s))  # today-is-a-good-day-today-is-a-nice-day
print(re.subn(r'\s', '-', s))  # ('today-is-a-good-day-today-is-a-nice-day', 9)

補充

空白行
- \n\s*\r
前後空白字串
- ^\s*|\s*$
零寬斷言
- ?=exp
  - 斷言當前位置後面能匹配exp
- ?<=exp
  - 斷言當前位置前面能匹配exp
- ?!exp
  - 斷言當前位置後面不能匹配exp
- ?<!exp
  - 斷言當前位置前面不能匹配exp

15-正則表示式

正則表示式三個方法 Regular Expression 匹配有規則的字串 importre re.match() 匹配字串是否以指定正則表示式開頭

最常用的15個前端表單驗證JS正則表示式

在表單驗證中，使用正則表示式來驗證正確與否是一個很頻繁的操作，本文收集整理了15個常用的JavaScript正則表示式，非常不錯，具有參考借鑑價值，需要的朋友參考下

15個常見的正則表示式

15個常見的正則表示式正則表示式到底是個啥？在編寫處理字串的程式或網頁時，經常會有查詢符合某些複雜規則的字串的需要。正則表示式就是用於描述這些規則的工具。

正則表示式在iOS開發中的應用

在iOS開發過程中，正則的使用還是比較常見，用來判斷使用者名稱、手機號等的輸入。當碰到這種需求的時候，部分開發的第一印象可能是使用 NSPredicate 的 SELF MATCHES %@ 進行判斷，但遺憾的是此方法並非萬能，存在檢

iOS深思篇 | 正則表示式

一. 背景 1.1 簡介關於正則表示式，相信大家並不陌生，可能平時只是貼上下相關程式碼，並不瞭解裡面所寫匹配規則。這篇文章我們將介紹iOS相關正則表示式基本語法和一些例項，希望看完此文大家能有所收穫；

正則表示式之Matcher類中group方法

前言同事把一個excel表給我，裡面的資料大概有幾千的樣子吧。自己需要把裡面的資料一個一個拿出來做一個http請求，對得到的結果進行過濾，然後再寫到上面去。這是就涉及到用指令碼來進行操作了，於是自己搞了一個Ja

c++11中regex正則表示式示例簡述

regex庫中涉及到的主要型別有：以std::string為代表的處理字串的型別（我們知道還有儲存wchar_t的wstring類、原生c式字串const char*等等，為了簡化處理僅介紹std::string型別相關的操作，當你把握住了regex的主脈

使用pyqt5 tablewidget 單元格設定正則表示式

tablewidget pyqt5的tablewidget元件比較特殊，每個方格可以裝載其他元件來搭配實現不同的效果，所以在qtdesigner上找不到視覺化直接設定mask或者其他可以限制填入單元格的設定

python 利用正則表示式提取特殊資訊

1、刪除字串中的 Python註釋案例： import re time = \"2020-01-01 # 這是一個日期\" num = re.sub(r\'#.*$\',\"\",time)#以#為分隔，去掉後面的資訊

Eclipse使用正則表示式快速修改程式碼的方法

背景：因為pyhon2.7將停止維護，公司pyhon專案需要將python版本從2.7升級到3.8。所以在python中例如data.has_key(\'json\')將不可使用了，那麼需要全部更換成\'json\' in data

JS正則表示式驗證埠範圍(0-65535)

javascript正則表示式驗證IP地址的埠合法性 if (!(/^[1-9]\\d*$/.test(port) && 1 <= 1 * port && 1 * port <= 65535)){

通過正則表示式驗證IP和埠格式的正確性

在網頁開發中可能會遇到需要對在頁面輸入的ip和埠進行正確性驗證，那麼正則表示式就是最有力的工具：

Python正則表示式匹配字串中的數字

1.使用“\\d+”匹配全數字程式碼： import re zen = \"Arizona 479,501,870. Carlifornia 209,213,650.\"

python 正則表示式引數替換例項詳解

正則表示式是一個特殊的字元序列，它能幫助你方便的檢查一個字串是否與某種模式匹配。

常用正則表示式大全(金錢,非負整數,正整數,郵箱,手機號碼)

什麼是正則表示式？正則表示式是由一個字元序列形成的搜尋模式。當你在文字中搜索資料時，你可以用搜索模式來描述你要查詢的內容。

php正則表示式使用方法整理集合

平時做網站經常要用正則表示式，下面是一些講解和例子，僅供大家參考和修改使用：

JS常用正則表示式超全集(密碼強度校驗,金額校驗,IE版本,IPv4,IPv6校驗)

有時候正則表示式可以大大提高我們的開發效率呢比如這段校驗基本日期格式的javascript程式碼：

使用正則表示式生成隨機資料的方法

從正則表示式生成隨機資料專案地址 https://github.com/GitHub-Laziji/reverse-regexp 安裝

Python re正則表示式元字元分組()用法分享

分組小括號() 有直接分組和命名分組直接分組:()分組只顯示小括號括起來的內容

python使用正則表示式去除中文文字多餘空格，保留英文之間空格方法詳解

在pdf轉為文字的時候，經常會多出空格，影響資料觀感，因此需要去掉文字中多餘的空格，而文字中的英文之間的正常空格需要保留，輸入輸出如下：

15-正則表示式

正則表示式三個方法

匹配單個字元

表示數量的符號

注意r''只能消除字串中的語義，不影響正則的語義，因此要匹配點(.)，需要在點前加\

邊界符號（錨字元）

分組和捕獲

其他正則函式

補充

相關推薦