1. 程式人生 > >JS正則表示式之特殊符號

JS正則表示式之特殊符號

正則表示式中,許多標點符號具有特殊含義,比較難記,現歸納備個份:

這些符號有:^ $ . * +  - ? = ! : | \ / ( ) [ ] { }

1.“[ ]”表示字元類: 即括號裡是個字符集:如/[abc]/,表示和含有a,b,c任何一個字母的字串都匹配。

注:特殊字元類:\s表示空格符、製表符、Unicode空白符。\S表示非Unicode空白符。(也可自定義Unicode字元類:如:

                        /[\u4E00-\u9FA5]/表示只匹配中文字元。)

                       \w 任何單字字元,相當於[a-zA-X0-9_];\W與\w相反。

                       \d 任何數字,相當於[0-9];\D與\w相反。

                       \b在字元類中使用表示退格符。[\b]則表示退格直接量。\b可以用來指定匹配位置,也可稱為錨;如:

                      查詢一個句子裡的單詞 java , 可以使用/\bjava\b/;\B與其相反。

2.“-"表示連字元,如[a-z];

3."."表示除換行符和其他Unicode行終止符之外的任意字元。

4."^"具有兩重含義:開始標記和非,如:/^a/表示以a開始的字元,當在[]中時:/[^a]/表示非a的所有字元。

5."$"表示字元結尾。如:/^abc$/表示以c結束的字元。

6.”{}"表示重複上一項。如/\d{2,4}/表示數字出現兩次,最多出現4次。如/3{2,4}/匹配33...;333....;3333.....;不匹配3和4個3相連以上的了。它的三種格式如下{n,m}表示至少3次,最多m次;{n,}至少n次;{n}恰好n次。

7."?"表示{0,1}。

8."+"表示{1,}。

9."*"表示{0,}。

注:非貪婪的重複(如??,+?,*?,{1,5}?只匹配第一個。)

10."|"表示分割,即或的含義。如:/ab|cd|ef/匹配含有ab或cd或ef的字串。

11."()"包含三重用途:一是定義子表示式。二是在完整的模式中定義子模式。三是子表示式的引用。

子模式的定義可以從目標串中抽取和括號中的子模式相匹配的部分。

子模式的表示式的引用是指:可識別子模式的編號,提取它。如/(abc)\sis\s(string\w*)/;裡面含有兩個字表達式:可通過

\1指(abc);\2指(string\w*); 應用如:/['"][^'"]*['"]/不能取前後同樣的引號,可以這樣寫:/[('")[^'"]*\1]/,可起到約束作用。

注:若想()裡的不想被記憶,可採用(?:.....),將不會對其編號。

還有(?=p),(?!p)如下:

如/(javascript)?(?=\:)/ 表示匹配javascript:,但不包含:;它不匹配javascript,因為他有個條件就是後要接:;

(?!p)反前向宣告,要求接下來的字元不與模式p匹配,與(?=p)相反。