1. 程式人生 > >24 內置模塊re

24 內置模塊re

span 搜索 單詞 sub finditer 劃線 一個 .html find

今日主要內容
1. 正則表達式 匹配字符串
元字符
. 除了換行
\w 數字, 字母, 下劃線
\d 數字
\s 空白符
\n
\t
\b 單詞的邊界
\W 非xxx
\D
\S
[] 字符組
[^xxx] 非xxxx
^ 字符串的開始
$ 字符串的結束
| 或者

量詞
* 0->n
+ 1->n
? 0->1
{p} p次
{p,q} p->q次
{p,} 至少p次

貪婪和惰性
.*
.+
惰性:
.*?寶寶 盡可能少的匹配

轉義 \\\\n => \\n => \n
正則前面加r

分組 ()


2. 在python中使用正則. re

(?P<name>正則)
1. search() 搜索. 搜索到第一個結果返回
2. match() 匹配. 收到一個結果返回. 從頭開始匹配
3. findall() 查找所有匹配結果
4. finditer() 返回叠代器.
5. compile() 編譯
6. group("name") 獲取數據
7. re.S 幹掉 . 的換行


sub
subn
split
1.字符串
2.re模塊

24 內置模塊re