1. 程式人生 > 實用技巧 >Educational Codeforces Round 93 (Rated for Div. 2) 題解

Educational Codeforces Round 93 (Rated for Div. 2) 題解

正則表示式的建立、匹配字串、轉義、字元類、重複以及常用字元

首先是工具推薦:

http://tools.jb51.net/regex/create_reg

http://tools.jb51.net/regex/javascript


i ignoreCase 忽略大小寫

g global 全域性

m multiline 多行


正則匹配

pattern.test(str)

pattern.exec(str)


修飾符的用法

var pattern = new RegExp('js', 'i');
var pattern = /js/i;

使用者輸入獲取要匹配的文字

var pattern = '/' + userInput + '/i';
var pattern = new RegExp(userInput, 'i');

轉義字元\

匹配換行符 \n

    var str = '1.html\n2.css\n3.js';
    var pattern = /\n/;
    console.log(str);
    console.log(pattern.exec(str));

話說這個換行符好Q


匹配空格\t


十六進位制匹配\x開頭:

a=\x61

b=\x62

\n=\x0A

    var str = 'a\nb';
    var pattern = /\x61\x0A\x62/;
    console.log(pattern.exec(str));

unicode表示:

\u0009=\t 空白符

    var str = '    js';
    var pattern = /\u0009/;
    console.log(pattern.exec(str));

基本漢字unicode範圍:\u4e00-\u9fa5


方括號是單個匹配,表示出現j或者s

    var str = 'sjavascript';
    var pattern = /[js]/;

^在[]裡面代表非

^在[]外面代表是為首

    var str = 'jscript';
    var pattern = /[^js]/;//不是j或者s
    console.log(pattern.exec(str));

.代表任意字元,但不能匹配\n

    var str = '\n';
    var pattern = /./;
    console.log(pattern.exec(str));

/[a-zA-Z0-9_]/ /\w/ =數字字母下劃線

/[^a-zA-Z0-9_]/ /\W/ =非數字字母下劃線

\d 匹配數字

\s 匹配空格


匹配價格

    var str = '肯德基豪華午餐:¥15.5!';
    var pattern = /\d{1,}\.{0,1}\d{0,}/;
    console.log(pattern.exec(str));

+ 匹配一次或更多次的重複
+?匹配一次或更多次的重複,但是在能使整個匹配成功的前提下使用最少的重複

貪婪模式

    var str = '<td><p>a</p></td><td><p>b</p></td>';
    var pattern = /<td>.*<\/td>/;
    console.log(pattern.exec(str));

懶惰模式

    var str = '<td><p>a</p></td><td><p>b</p></td>';
    var pattern = /<td>.*?<\/td>/;
    console.log(pattern.exec(str));

正則表示式的() [] {} 有著不同的意思

() 是為了提取匹配字串的,表示式中有幾個()就有幾個相應的匹配字串

(abc)? 表示這一組要麼一起出現,要麼不出現,出現那則按順序出現。

(?:abc)表示找到一樣abc的一組,但是不記錄,不儲存到&#x53D8;&#x91CF;&#x4E2D;&#xFF0C;&#x5426;&#x5219;&#x53EF;&#x4EE5;&#x901A;&#x8FC7;" role="presentation" style="overflow-wrap: normal; max-width: none; max-height: none; min-width: 0px; min-height: 0px; float: none;" id="MathJax-Element-1-Frame">變數中,否則可以通過變數中,否則可以通過x取第幾個括號所匹配到的項。比如(aaa)(bbb)(ccc)(?:ddd)(eee)可以用1&#x83B7;&#x53D6;(aaa)&#x5339;&#x914D;&#x5230;&#x7684;&#x5185;&#x5BB9;&#xFF0C;&#x800C;" role="presentation" style="overflow-wrap: normal; max-width: none; max-height: none; min-width: 0px; min-height: 0px; float: none;" id="MathJax-Element-2-Frame">1獲取(aaa)匹配到的內容,而1獲取(aaa)匹配到的內容,而3則獲取到了(ccc)匹配到的內容,而$4則獲取的是由(eee)。

a(?=bbb)順序環視 表示a後面必須緊跟3個連續的b

(\s*)表示連續空格的字串


[] 是定義匹配的字元範圍。比如[a-zA-Z0-9]表示相應位置的字元要匹配英文字元和數字。[\s*表示空格或者*號]

{}一般是用來匹配的長度。比如\s{3}表示匹配三個空格,\s[1,3]表示匹配1到3個空格

(0-9)匹配'0-9'本身。[0-9]*匹配數字(注意後面有*,可以為空)[0-9]+匹配數字(注意後面有+,不可以為空),

{0-9}寫法是錯誤的

[0-9]{0,9}表示長度為0到9的數字字串。


\1 = ab

    var str = '<p><a>這是一段文字</a></p>';
    var pattern = /<([a-zA-Z]+)>(.*?)<\/\1>/;
    console.log(pattern.exec(str));

指定匹配位置

^開始 $結尾

匹配全是數字,方法一:

    var str = '110119120';
    var pattern = /^\d+$/;
    console.log(pattern.exec(str));
    if (pattern.test(str)) {
        console.log('全是數字!');
    } else {
        console.log('不全是數字!');
    }

匹配全是數字,方法二:

    var str = '11011a9120';
    var pattern = /\D/;
    console.log(pattern.exec(str));
    if (pattern.test(str)) {
        console.log('不全是數字!');
    } else {
        console.log('全是數字!');
    }

\b = 單詞邊界

    var str = '@@@js@@@';
    var pattern = /\bjs\b/; //@也被識別為單詞邊界
    console.log(pattern.exec(str));

通過類名獲取元素

    function getByClassName(className, parentNode) {
        if (document.getElementsByClassName) {
            return document.getElementsByClassName(className);
        } else {
            parentNode = parentNode || document;
            var nodeList = [];
            var allNodes = parentNode.getElementsByTagName('*');
            // 正則匹配某個類名
            var pattern = new RegExp('\\b' + className + '\\b');

            for (var i = 0; i < allNodes.length; i++) {
                if (pattern.test(allNodes[i].className)) {
                    nodeList.push(allNodes[i]);
                }
            }
            // 返回所有匹配到的元素集合
            return nodeList;
        }
    }

\b和\s有什麼區別

\babc\b匹配的是"abc"
\sabc\s匹配的不是"abc", 前後還帶空格" abc "
\b只是匹配字串開頭結尾及空格回車等的位置, 不會匹配空格符本身


如果後面緊跟script,則匹配java

    var str = 'javascript';
    var pattern = /java(?=script)/;
    console.log(pattern.exec(str));

正則表示式 - (?!), (?:), (?=)的區別

(?:pattern) 非獲取匹配,匹配pattern但不獲取匹配結果,不進行儲存供以後使用。

(?=pattern) 非獲取匹配,正向肯定預查。例如,“Windows(?=95|98|NT|2000)”能匹配“Windows2000”中的“Windows”,但不能匹配“Windows3.1”中的“Windows”。

(?!pattern) 非獲取匹配,正向否定預查,例如“Windows(?!95|98|NT|2000)”能匹配“Windows3.1”中的“Windows”,但不能匹配“Windows2000”中的“Windows”。

(?<=pattern) 非獲取匹配,反向肯定預查。例如,“(?<=95|98|NT|2000)Windows”能匹配“2000Windows”中的“Windows”,但不能匹配“3.1Windows”中的“Windows”。

(?<!pattern) 非獲取匹配,反向否定預查,與正向否定預查類似,只是方向相反。例如“(?<!95|98|NT|2000)Windows”能匹配“3.1Windows”中的“Windows”,但不能匹配“2000Windows”中的“Windows”。


RegExp物件

RegExp例項方法

    var pattern = /js/;
    var pattern = new RegExp('js');

獲取所有的匹配

    var str = '1.js 2.js 3.js';
    var pattern = /js/g;
    var total = 0,
        match = '',
        result;

    while ((result = pattern.exec(str)) != null) {
        total++;
        match += '第' + total + '個匹配到的是:' + result[0] + ', 它的位置是:' + result.index + '\n';
    }
    match += '共找到' + total + '處匹配\n';
    console.log(str);
    console.log(match);

valueOf:返回一個 Number 物件的基本數字值。

toString():把數字轉換為字串,使用指定的基數。

toLocalString():把數字轉換為字串,使用本地數字格式順序

    var pattern = new RegExp('a\\nb')
    console.log(pattern.toString());//a\nb
    console.log(pattern.toLocaleString());//a\nb
    console.log(pattern.valueOf() === pattern); //a\nb

RegExp例項屬性

ignoreCase:是一個只讀的布林值,看這個正則表示式是否帶有修飾符i

multiline:是一個只讀的布林值,看這個正則表示式是否帶有修飾符m

source:是一個只讀的字串,包含正則表示式的文字

lastIndex:是一個可讀/寫的整數,如果匹配模式中帶有g修飾符,這個屬性儲存在整個字串中下一次檢索的開始位置,這個屬性會被exec( ) 和 test( ) 方法用到

    var str = 'js js js';
    var pattern = new RegExp('js', 'ig');
    console.log(pattern.ignoreCase); //true
    console.log(pattern.global); //true
    console.log(pattern.multiline); //false
    console.log(pattern.source); //js
    console.log(pattern.exec(str));
    console.log(pattern.lastIndex); //0
    console.log(pattern.exec(str));
    console.log(pattern.lastIndex); //3

RegExp建構函式屬性列表

exec( )接受一個引數時(即要應用模式的字串),返回包含第一個匹配項資訊的陣列

包含兩個額外的屬性

index:表示匹配文字的第一個字元的位置

input:表示存放的為被檢索 的字串string

lastIndex屬性,返回匹配內容的最後一個索引位置,也就是下一個匹配的開始位置,注意字串索引從0開始

lastMatch($&)屬性,只讀屬性,如果沒有匹配資訊,則該屬性的值為空字串

lastParen屬性 只讀靜態屬性,該屬性返回在最近一次匹配檢測中所得到的最後一個子匹配的值,如果沒有子匹配則返回空字串

leftContext屬性 返回匹配內容左側的字元資訊 該屬性的初始值為空字串 ,如果有相應的匹配該屬性的值就會改變

    var str = 'js js js';
    var pattern = /(j)s/;
    pattern.exec(str);
    console.log(RegExp.input);//js js js
    console.log(RegExp.$_); // = input
    console.log(RegExp['$_']); // = input
    console.log(RegExp.lastMatch); //js
    console.log(RegExp['$&']); // = lastMatch
    console.log(RegExp.leftContext);
    console.log(RegExp['$`']); // = leftContext
    console.log(RegExp.rightContext);
    console.log(RegExp["$'"]); // = rightContext
    console.log(RegExp.lastParen);
    console.log(RegExp["$+"]); // = lastParen

String物件中與正則表示式相關的方法

search()

    var str = 'html js js';
    var pattern = /js/g;
    console.log(str.search(pattern));//5

match()

    var str = 'js1\njs2\njs3';
    var pattern = /^js/mg;
    console.log(str);
    console.log(str.match(pattern));

split()

    var str = 'html ,   css  ,   js';
    var pattern = /\s*,\s*/; // 包括,左右出現空格也能匹配到
    console.log(str.split(pattern));

replace()

    var str = 'I love js';
    var pattern = /(js)/;
    document.write(str.replace(pattern, '<strong style="color: red;">$1</strong>'));\

用*遮蔽相關文字

    var str = '中國軍隊和阿扁一起辦證';
    var pattern = /國軍|阿扁|辦證/g;
    console.log(str.replace(pattern, '*'));

幾個文字對應幾個*

    var str = '中國軍隊和阿扁一起辦證';
    var pattern = /國軍|阿扁|辦證/g;
    console.log(str.replace(pattern, function ($0) {
        var result = '';
        for (var i = 0; i < $0.length; i++) {
            result += '*';
        }
        return result;
    }));

常用的正則表示式

1.QQ

全是數字

首位不能為0

最少5位(10000)

目前最多11位?

    /^[1-9]\d{4,10}$/
    /^[1-9]\d{4,}$/

2.暱稱

中、英文、數字以及下劃線

2-18位

    /^[\u4e00-\u9fa5a-zA-Z0-9_]{2,18}$/
    /^[\u4e00-\u9fa5\w]{2,18}$/

3.密碼

6-16位

不能用空白字元\s

    /^\S{6,16}$/
    /^[\w~!@#$%^\[\]]{6,16}$/

4.去除字串首尾的空白字元

    var str = '        Alex         ';
    var pattern = /^\s+|\s+$/g;
    console.log(str.replace(pattern, ''));

函式封裝

    function trim(str) {
        return str.replace(/^\s+/, '').replace(/\s+$/, '');
    }
    var str = '        Alex         ';
    console.log('|' + trim(str) + '|');

5.-轉駝峰

    var str = 'background-color';
    var pattern = /-([a-z])/gi;
    console.log(str.replace(pattern, function (all, letter) {
        return letter.toUpperCase();
    }));

函式封裝

    function toCamelCase(str) {
        return str.replace(pattern, function (all, letter) {
            return letter.toUpperCase();
        })
    }

6.匹配HTML標籤

    var str = '<p class="odd" id="odd">123</p>';
    var pattern = /<[^>]+>/g;// <>中間沒有再出現>
    console.log(str.match(pattern));

7.郵箱

[email protected]

[email protected]

alex_1.a-sdasd.asdasdas.com@yah-o_o.com.adasdsd.cn

    /(?:\w+\.)*\w+@(?:\w+\.)+[a-z]/i
    /^[a-z0-9]+(?:[._-][a-z0-9]+)*@[a-z0-9]+(?:[._-][a-z0-9]+)*\.[a-z]{2,4}$/i

8.URL

(協議:\/\/)主機名(:埠號)(/路徑)

ftp|http|https|mailto|file:///

    /^(https?:\/\/)?([^:\/]+)(:\d+)?(\/.*)?$/

9、匹配主機名

/[^:\/]+/

-www.-imos-oc.casfasf.sadasd.com

    /[a-z0-9]|[a-z0-9][-a-z0-9]*[a-z0-9]/i
    /^([a-z0-9]\.|[a-z0-9][-a-z0-9]*[a-z0-9]\.)*(com|edu|gov|net|org|[a-z]{2})$/i
    /^([a-z0-9]\.|[a-z0-9][-a-z0-9]*[a-z0-9]\.)*([a-z]+)$/i

10、匹配所有字元

    /[\w\W]//[\d\D]//[\s\S]//[^]/

11、分別寫出匹配正整數、負整數以及既能匹配正整數,也能匹配負整數的正則表示式

提示:1.注意0是整數,不是正整數,也不是負整數

    正整數: /[1-9]\d*/
    負整數: /-[1-9]\d*/
    正整數和負整數:/-?[1-9]\d*/
整數:/0|-?[1-9]\d*/

12、?禁止貪婪模式,請匹配第一個[]以及它裡面的內容

    var str = 'js[javascript];html[hyper text markup language];css[cascading style sheet];';
    var pattern = /\[.*?\]/; 
    console.log(pattern.exec(str));

13、html標籤的屬性值既可以放在""中,也可以放在''中,例如<p class="box" id='box'></p>

寫出既能匹配""中內容,又能夠匹配''中內容的正則表示式

    /(["'])[^"']\1/

14、現有字串'Windows98, WindowsXP, Windows7',請分別寫出匹配後面是XP的Windows和後面不是7的Windows的兩個正則表示式

提示:1.前瞻性匹配和負向前瞻性匹配

    /Windows(?=XP)/
    /Windows(?!7)/

15、RegExp物件

匹配字串'weekend,endfor,end'中所有的end,並分別打印出其中的字母e

提示:1.全域性匹配 2.exec迴圈列印

()包起來的會被儲存到結果中

    var str = 'weekend,endfor,end';
    var pattern =/(e)nd/g;
    var result;
    while((result = pattern.exec(str)) != null) {
        console.log(result[1]);
    }

String物件與正則表示式相關的方法

16、找出字串'110報警120急救119火警114查詢'中的所有數字,並打印出來

提示:1.全域性匹配 2.match

    var str = '110報警120急救119火警114查詢';
    var pattern =/\d+/g;
    console.log(str.match(pattern));

17、找出字串'asdfgaaaafdgdgaaaadgsxcvcxva'中出現次數最多的字元,並打印出其出現的次數

提示:1.利用陣列排序 2.利用引用匹配相同的字元

    var str = 'asdfgaaaafdgdgaaaadgsxcvcxva';
    var arr = str.split(''); // 轉換成陣列
    str = arr.sort().join(''); // 排序之後再拼成字串,此時相同的字元緊挨在了一起
    var value = ''; // 出現次數最多的字元
    var count = 0; // 出現次數
    var pattern =/(\w)\1+/g; // 匹配緊挨著的相同字元
    str.replace(pattern, function ($0, $1) {
        // $0表示匹配到的所有相同字元,$1表示第一個分組匹配的字元,也就是單個字元
        if (count < $0.length) {
        // 如果$0.length>count,就表示此時匹配到的字元,到目前為止是出現次數最多的
            count = $0.length;
            value = $1;
        }
    });
    console.log('出現次數最多的字元是:'+value+',共出現'+count + '次');