1. 程式人生 > >正則表示式入門01

正則表示式入門01

基礎知識

常用符號 說明 例子
\d 一個數字
\w 一個字母或數字
. 點匹配任意字元
* 星號匹配任意個字元
+ 加號表示至少一個字元
? 表示0個或者1個字元
{n} 表示n個字元
{n,m} n到m個字元
\s 任意一個空白字元
\S 任意非空字元
- -是特殊字元,所以要用斜槓
[] 方括號表示範圍

進階知識

例子 說明
[0-9a-zA-Z_] 可以匹配一個數字、字母或者下劃線;
[0-9a-zA-Z_]+ 可以匹配至少由一個數字、字母或者下劃線組成的字串,比如’a100’,‘0_Z’,'Py3000’等等;
[a-zA-Z_][0-9a-zA-Z_]* 可以匹配由字母或下劃線開頭,後接任意個由一個數字、字母或者下劃線組成的字串,也就是Python合法的變數;
[a-zA-Z_][0-9a-zA-Z_]{0, 19} 更精確地限制了變數的長度是1-20個字元(前面1個字元+後面最多19個字元)。
A|B 可以匹配A或B,所以(P|p)ython可以匹配’Python’或者’python’
^ 表示行的開頭,^\d表示必須以數字開頭。
$ 表示行的結束,\d$表示必須以數字結束。

參考

正則表示式

Python 正則表示式