pyhon正則表示式(python小白筆記九)
#正則表示式,描述字串排列的一套規則 原子,是正則表示式中最基本的組成單位。 (1)普通字元作為原子(“yue”有三個原子,y u e) (2)非列印字元作為原子 (3)通用字元作為原子 (4)原子表
#(1)p普通字元作為原子
import re
pattern="yue"
string="http://yue.cn.com"
resultl=re.search(pattern,string)
print(resultl)
#(2)非列印字元
如果多個換行,不適用,原因是\n用於一個換行符,\t用於匹配一個製表符,如果為空,則為None
pattern2="\n" string2='''http://dsfasdf fadsfsdf''' result2=re.search(pattern2,string2) print(result2)
#(3)通用字元作為原子,匹配python前邊的任意一個字母,資料子或者下劃線以及任意十進位制的數,後邊任意字母數字和下劃線
pattern3="\w\dpythohn\w"
string3="adsd325pythohn_fsdfg"
result3=re.search(pattern3,string3)
print(result3)
為了方便我們寫簡潔的正則表示式,它本身還提供下面這樣的寫法
正則表示式 | 代表的匹配字元 |
---|---|
[0-9] | 0123456789任意之一 |
[a-z] | 小寫字母任意之一 |
[A-Z] | 大寫字母任意之一 |
\d | 等同於[0-9] |
\D | 等同於[^0-9]匹配非數字 |
\w | 等同於[a-z0-9A-Z_]匹配大小寫字母、數字和下劃線 |
\W | 等同於[^a-z0-9A-Z_]等同於上一條取非 |
#(4)原子表,[xyz]表示xyz也可以匹配到,單個,即是pythonx(pythony)pythonz
pattern4="\w\dpython[xyz]\w"
string4="adsd325pythonyz_fsdfg"
result4=re.search(pattern4,string4)
print(result4)