正則表示式基礎.md

阿新 • • 發佈：2018-12-10

正則表示式基礎

模式	描述
\w	匹配字母數字及下劃線
\W	匹配非字母數字下劃線
\s	匹配任意空白字元，等價於 [\t\n\r\f].
\S	匹配任意非空字元
\d	匹配任意數字，等價於 [0-9]
\D	匹配任意非數字
\A	匹配字串開始
\Z	匹配字串結束，如果是存在換行，只匹配到換行前的結束字串
\z	匹配字串結束
\G	匹配最後匹配完成的位置
\n	匹配一個換行符
\t	匹配一個製表符
^	匹配字串的開頭
$	匹配字串的末尾。
.	匹配任意字元，除了換行符，當re.DOTALL標記被指定時，則可以匹配包括換行符的任意字元。
[…]	用來表示一組字元,單獨列出：[amk] 匹配 ‘a’，‘m’或’k’
[^…]	不在[]中的字元：[^abc] 匹配除了a,b,c之外的字元。
*	匹配0個或多個的表示式。
+	匹配1個或多個的表示式。
?	匹配0個或1個由前面的正則表示式定義的片段，非貪婪方式
{n}	精確匹配n個前面表示式。
{n, m}	匹配 n 到 m 次由前面的正則表示式定義的片段，貪婪方式
a\|b	匹配a或b
( )	匹配括號內的表示式，也表示一個組

1 re.match

1.1 常規匹配

嘗試從字串的起始位置匹配一個模式，如果不是起始位置匹配成功的話，match()就返回none。

import re

content = 'Hello 123 4567 World_This is a Regex Demo666666666'		#長度50
result = re.match('^Hello\s\d\d\d\s\d{4}\s\w{10}.*Demo', content)
s = re.match(r"abc(.*?)i", "abcdefghi").group(1)
print(result.group())
print(result.span())
print(s)

Hello 123 4567 World_This is a Regex Demo

(0, 41)

defgh

1.2 泛匹配

content = 'Hello 123 4567 World_This is a Regex Demo'
result = re.match('^Hello.*Demo$', content)

1.3匹配目標

import re

content = 'Hello 1234567 World_This is a Regex Demo'
result = re.match('^Hello\s(\d+)\sWo(\w)ld.*Demo$', content)
print(result.group())
print(result.group(0))
print(result.group(1))
print(result.group(2))
print(result.span())

輸出：
Hello 1234567 World_This is a Regex Demo
Hello 1234567 World_This is a Regex Demo
1234567
r
(0, 40)

1.4 貪婪匹配/非貪婪模式

import re

content = 'Hello 1234567 World_This is a Regex Demo'
result = re.match('^He.*(\d+).*Demo$', content)
result1 = re.match('^He.*?(\d+).*Demo$', content)
print(result.group(1))
print(result1.group(1))

輸出：
7
1234567

1.5 匹配模式

re.S（.包括換行符）

import re

content = '''Hello 1234567 World_This
is a Regex Demo
'''
result = re.match('^He.*?(\d+).*?Demo$', content, re.S)	
print(result.group(1))

1234567

1.6 轉義字元

content = 'price is $5.00'
result = re.match('price is \$5\.00', content)

總結：儘量使用泛匹配、使用括號得到匹配目標、儘量使用非貪婪模式、有換行符就用re.S

2 re.search

掃描整個字串並返回第一個成功的匹配。

總結：為匹配方便，能用search就不用match

import re

content = 'Extra stings Hello 1234567 World_This is a Regex Demo Extra stings'
result = re.search('Hello.*?(\d+).*?Demo', content)
print(result)
print(result.group(1))

<_sre.SRE_Match object; span=(13, 53), match=‘Hello 1234567 World_This is a Regex Demo’>

1234567

3 re.findall

搜尋字串，以列表形式返回全部能匹配的子串。

import re

html = '''<div id="songs-list">
    <h2 class="title">經典老歌</h2>
    <p class="introduction">
        經典老歌列表
    </p>
    <ul id="list" class="list-group">
        <li data-view="2">一路上有你</li>
        <li data-view="7">
            <a href="/2.mp3" singer="任賢齊">滄海一聲笑</a>
        </li>
        <li data-view="4" class="active">
            <a href="/3.mp3" singer="齊秦">往事隨風</a>
        </li>
        <li data-view="6"><a href="/4.mp3" singer="beyond">光輝歲月</a></li>
        <li data-view="5"><a href="/5.mp3" singer="陳慧琳">記事本</a></li>
        <li data-view="5">
            <a href="/6.mp3" singer="鄧麗君">但願人長久</a>
        </li>
    </ul>
</div>'''
results = re.findall('<li.*?>\s*?(<a.*?>)?(\w+)(</a>)?\s*?</li>', html, re.S)
# 另一種匹配策略，html = re.sub('<a.*?>|</a>', '', html)，去掉不同的內容，再匹配
print(results)
for result in results:
    print(result[1])

表示式	描述
*	0個或多個
?	0個或1個
*?	非貪婪模式
\s*?	是否有換行符
()	表示一個組，可用來匹配目標
(<a.*?>)?	是否有a標籤

4 re.sub

替換字串中每一個匹配的子串後返回替換後的字串。

import re

content = 'Extra stings Hello 1234567 World_This is a Regex Demo Extra stings'
content = re.sub('\d+', '', content)
print(content)

Extra stings Hello World_This is a Regex Demo Extra stings

import re

content = 'Extra stings Hello 1234567 World_This is a Regex Demo Extra stings'
content = re.sub('(\d+)', r'\1 8910', content)
print(content)

Extra stings Hello 1234567 8910 World_This is a Regex Demo Extra stings

5 re.compile

將正則字串編譯成正則表示式物件，以便於複用該匹配模式。

pattern = re.compile('^Hello.*Demo$', re.S)
result = re.match(pattern, content)

正則表示式基礎.md

正則表示式基礎模式描述 \w 匹配字母數字及下劃線 \W 匹配非字母數字下劃線 \s 匹配任意空白字元，等價於 [\t\n\r\f]. \S 匹配任意非空字元 \d 匹配任意數字，等價於 [0-9] \D 匹配任意非數字

正則表示式基礎1

註釋：正則表示式的學習記錄1 1.正則表示式 1.1定義正則表示式是具有特殊含義的字串，用來定義匹配規則，在Pattern類中有簡單的規則定義。可以結合字串類的方法使用。 1.2功能正則表示式可用於限制賬號密碼的長度，用於匹配符合規則的字串，用來檢索、替換那些符合某

正則表示式基礎三

註釋：正則表示式的學習記錄3 Date類概述 Date類用於描述特定的瞬間，是對時間的操作，可以精確到毫秒。新建以個Date類將毫秒轉成日期物件： //建立日期物件，把當前的毫秒值轉換為日期 Date date = new Date(160761600000L);

正則表示式基礎2

註釋：正則表示式的學習記錄2 常見表示式 boolean： matches(String regex),稱為匹配字串，其中regex是正則的規則，表示式返回boolean型別值告知此字串是否匹配給定的正則表示式。用法例如,"abc".matches("[a]") 匹配成功返回true

正則表示式 - 基礎篇

正則簡介 - 1.使用特殊的符號來做校驗，目標是操作字串。例如：手機號碼、郵箱、身份證的校驗等。使用正則表示式的優缺點 - 1.使用特殊的符號來做校驗，目標是操作字串。例如：手機號碼、郵箱、身份證的校驗等。 - 2.缺點：雖然能簡化書寫，但是正則

正則表示式基礎及應用

正則表示式,按照我自己的理解,其實就是字串的操作校驗,所以先介紹關於字串操作的知識: 第一個是search 查詢搜尋: var str='abcdef' alert(str.search('b')) //找到對應的位置下標從0開始沒有找到對應的返回是-1 第二個是subs

PHP正則表示式基礎之認識正則表示式

正則表示式是我們平常在程式開發過程中經常用到的一種工具，有關於它的起源以及除程式之外的應用場景咱就不贅述了，咱們只看它在程式中是如何來應用的。這個正則表示式在我們程式中通常是把它當做一種模式去匹配一類字串，通俗地講，就是用一個字串描述一個特徵，完事驗證另外一個字串是否符合這個特徵的公式。你

php正則表示式基礎及使用

概述正則表示式是一種描述字串結果的語法規則，是一個特定的格式化模式，可以匹配、替換、擷取匹配的字串。常用的語言基本上都有正則表示式，如JavaScript、java等。其實，只有瞭解一種語言的正則使用，其他語言的正則使用起來，就相對簡單些。文字主要圍繞解決下面問題展開。有哪

[基礎 18_001] 正則表示式基礎

文字字元字元匹配內容字母字元本身 \0 NULL 字元（\u0000) \t Tab 製表符（\u0009

正則表示式基礎運用

驗證表單背景 <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>正則表單驗證</title> <st

正則表示式-基礎知識Review

正則表示式（Regular Expression)是電腦科學的一個概念。正則表示式使用單個字元竄來描述、匹配一系列符合某個句法規則的字元竄。在很多文字編輯器裡，正則表示式通常用來被檢索替換哪些符合某個模式的文字。建立 JavaScript通過內建物件

Perl正則表示式(1) - 正則表示式基礎知識

Perl正則表示式 1. 基礎知識 Perl中正則表示式(regular expression)預設匹配 $_ 中的字串，匹配成功就返回真，否則返回假； Perl匹配正則表示式時，可以使用變數內插，先完成變數內插，取出變數中的字串後，編譯正則表示式。 1.

正則表示式基礎應用(替換replaceAll(regex,str))

1. 基礎字元替換要求：將字串中的數字串替換成* String e = "asdlfj328238asldfjlsfd32323sdfl";String reg5 ="\\d+";String newStr = e.replaceAll(reg5, "*");Syst

Linux中grep命令，用或的關係查詢多個字串，正則表示式基礎說明

使用 grep 'word1|word2' 檔名這樣的命令是不對的！應該使用如下的命令：1，grep -E 'word1|word2' 檔名 2，egrep 'word1|word2' 檔名 3

爬蟲之正則表示式基礎篇

一點睛 1 正則表示式工具 http://tool.oschina.net/regex/ 2 測試一下 Hello, my phone number is 029-86432100 and email is [email protected]

Linux正則表示式基礎

轉載自實驗樓實驗介紹雖然我們這一節的標題是正則表示式，但實際這一節實驗只是介紹grep，sed，awk這三個命令，而正則表示式作為這三個命令的一種使用方式（命令輸出中可以包含正則表示式）。正則表示式本身的內容很多，要把它說明清楚需要單獨一門課程來實現，不過我們這一節中涉

正則表示式基礎語法

這篇文章主要記錄了正則表示式的一些基本語法、修正模式和php常用的正則表示式函式！一、正則表示式基本語法：界定符原子元字元量詞邊界控制模式單元 1. 界定符表示一個正則表示式的開始和結束。（如：/[0-9]/或#[0-9

正則表示式基礎

正則表示式（regular expression）顯式建立 var searchPattern = new RegExp('+s'); RegExp直接量 var searchPattern = /+s/; 直接量中的兩個斜槓(//)

正則表示式基礎語法例子

literal 功能：匹配文字字串的字面值 literal 例子：foo re1 | re2 功能：匹配正則表示式 re1 或者 re2 例子：foo|bar . 功能：匹配任何字元(除了\n 之外) 例子：表示式：f.o 匹配：在字

正則表示式--基礎常用字元

1.定界符：/***/ 2.反斜槓：\代表轉義（用來特殊輸出） \\代表輸出一個在" "裡要輸出一個 " 要 \" 幾個形式：\r \n \t \\ \" \' \. 3. ^ :匹

正則表示式基礎.md

正則表示式基礎

1 re.match

1.1 常規匹配

1.2 泛匹配

1.3匹配目標

1.4 貪婪匹配/非貪婪模式

1.5 匹配模式

re.S（.包括換行符）

1.6 轉義字元

2 re.search

3 re.findall

4 re.sub

5 re.compile

相關推薦