關於正則表示式的一些常用困惑

阿新 • • 發佈：2018-12-01

前言:因為業務需要需要匹配出文件中特定的資料,並且賦值到到特定的陣列上面，
    所以需要用到特定的關係進行匹配,正則表示式是一個不錯的選擇,但是畢竟
    是普通人所以沒辦法!習慣性遺忘...說句實話還是用的少的原因,下面簡單的
    複習下為了以後自己看，簡單的做下筆記,雖然今天的事蠻多的,還有一道演算法
    沒有寫完,我會努力的

正則表示式

基本概念:正則表示式本質上是一個字串,用於格式的驗證,匹配,查詢,替換等,為了與
        普通的字串進行區分,該字串通常使用"^"開頭，使用"&"結尾,可以省略。

常用的規則:
-[abc]   - 表示可以出現a,b以及c.
-[^abc]  - 表示可以出現任何字元除a,b,c.
-[a-zA-Z]- 表示可以出現任何字母,也就是a到z和A到Z之間的任意字元.

-\d -表示可以出現任何數字,相當於[0-9].
-\D -表示可以出現任何非數字,相當於[^0-9].
-\s -表示可以出現任何空白字元,相當於[\t\n\xob\f\r].
-\S -表示可以出現任何非空白字元,相當於[^\s].
-\w -表示可以出現單詞字母,相當於[a-zA-Z_0-9],就是字母數字下劃線.
-\W -表示可以出現任何非單詞字元,相當於[^\w].

-X? -表示X可以出現一次或者一次也沒有,也就是可以出現0~1次.
-X* -表示X可以出現零次或多次,也就是可以去出現0~n次.
-X+ -表示X可以出現一次或者多次,也就是可以出現1~n次.
-X{n}   -表示X恰好出現n次.
-X{n,}  -表示X可以出現至少n次,也就是 >=n次
-X{n,m} -表示X可以出現至少n次,但是不超過m次,也就是 >=n次並且<=m次

提示:有的時候String類中的split()方法可以進行字串拆分.
下面寫幾個例項:
1) 描述銀行卡密碼的規則：要求必須是數字，而且必須是6位
    String reg = "^\d{6}&";
    但是很遺憾這樣子寫是錯誤的,因為在Java中存在一個轉義問題正確的寫法如下:
    String reg = "^\\d{6}&";

2) 描述使用者名稱的規則，要求由6 ~ 8位數字字母以及下劃線組成
    String reg = "^\\w{6,8}&";

3) 描述座機號碼的規則，要求3~4位區號由數字組成、-、7~8位數字組成的號碼
    String reg = "^\\d{3,4}[-]{1}\\d{7,8}&";

4) 描述手機號碼的規則，要求11位數字組成，第一位必須是1
    String reg = "^[1]{1}\\d{10}";

5) 描述身份證號的規則，要求總共18位，前面17位必須是數字，後面1位可以是數字也可以X
    String reg = "^\\d{17}\\[0-9x]{1}&";
6) 描述郵箱的規則，要求郵箱名必須由數字字母下劃線組成,至少一位，@，
   分析:常見的郵箱字尾為@qq.com,@126.com,@org.com反正我就見到過這三種   
    String reg = "^\\w+[@]{1}[0-9a-zA-Z]{2,4}(.com.cn.com.cn|.org)$";

提示:如果需要過濾或者替換...上面說過了.忘了的自己去翻，號我自己翻回去看看一般用到了String裡
面的方法.
以下方法全部參考自JDK api 1.6(1.8還沒有追,更別說1.9了...)

a.如果判斷是否符合特定的格式
    String str = " 
[email protected]"; //需要驗證的字串
    String reg = "^\\w+[@]{1}[0-9a-zA-Z]{2,4}(.com|.cn|.com.cn|.org)$";//驗證的格式

    boolean boo = str.matches(reg);

    呼叫此方法的 str.matches(regex) 形式與以下表達式產生的結果完全相同： 

    Pattern.matches(regex, str)

    引數：
    regex - 用來匹配此字串的正則表示式 
    返回：
    當且僅當此字串匹配給定的正則表示式時，返回 true 

附加匹配資訊：
    我們在工作中難免會碰到漢字的可能性,查了下資料發現匹配的公式是這個樣子的：
    [\u4E00-\u9FA5]  需要注意的一點是前後並不能加 '^','&'或者是兩個全家,至於原因以後我會補上

下面補充一個例子:
7)      
        String str = "規劃路線的座標 x541y440";
        String reg = "[\u4E00-\u9FA5]+\\s+\\w+"; 
        if(str.matches(reg)){
            System.out.println("匹配成功!");
        }else{
            System.out.println("匹配失敗!");
        }

經過驗證是沒有問題的.

我複習正則表示式的目的

以下是部分驗證程式碼:

    String str1 = "12-01 21:"; //暫時先來驗證這一段字串
    String str2 = "12-01";
    String str3 = "12-01 21:34:36.401";
    String str4 = "12-01 21:34:36.401 719-719/";
    String str5 = "12-01 21:34:36.401 719-719/com.hiteam.ghyj I/System.out:";
    String str6 =  "12-01 21:34:36.401 719-719/com.hiteam.ghyj I/System.out: 規劃路線的座標 x577y96";
    /** 根據我的分析是這個樣子的**/
    String regex =  "^\\d+[-]+\\d+\\s+\\d+[:]+";
    String regex3 = "^\\d+[-]+\\d+\\s+\\d+[:]+\\d+[:]+\\d+[.]+\\d+";
    String regex4 = "^\\d+[-]+\\d+\\s+\\d+[:]+\\d+[:]+\\d+[.]+\\d+\\s+\\d+[-]+\\d+[/]+";
    String regex5 = "^\\d+[-]+\\d+\\s+\\d+[:]+\\d+[:]+\\d+[.]+\\d+\\s+\\d+[-]+\\d+[/]+\\w+[.]+\\w+[.]+\\w+\\s+\\w+[/]+\\w+[.]+\\w+[:]+";
    String regex6 = "^\\d+[-]+\\d+\\s+\\d+[:]+\\d+[:]+\\d+[.]+\\d+\\s+\\d+[-]+\\d+[/]+\\w+[.]+\\w+[.]+\\w+\\s+\\w+[/]+\\w+[.]+\\w+[:]+\\s+[\u4E00-\u9FA5]+\\s+\\w+";

    if(str6.matches(regex6)){
        System.out.println(1);
    }else{
        System.out.println(0);
    }

下面根據String提供的方法split進行分割

    public String[] split(String regex)根據給定正則表示式的匹配拆分此字串。 
    該方法的作用就像是使用給定的表示式和限制引數 0 來呼叫兩引數 split 方法。因此，所得陣列中不包括結尾空字串。 

    例如，字串 "boo:and:foo" 使用這些表示式可生成以下結果： 

    Regex 結果 
    : { "boo", "and", "foo" } 
    o { "b", "", ":and:f" } 


    引數：
    regex - 定界正則表示式 

    也就是把跟表示式相同的部分全部過濾掉了,且返回的型別是一個String[]很有意思
    下面是拆分之後的程式碼

    // 先來驗證一部分字串
    String str1 = "12-01 21:"; //暫時先來驗證這一段字串
    String str2 = "12-01";
    String str3 = "12-01 21:34:36.401";
    String str4 = "12-01 21:34:36.401 719-719/";
    String str5 = "12-01 21:34:36.401 719-719/com.hiteam.ghyj I/System.out:";
    String str6 =  "12-01 21:34:36.401 719-719/com.hiteam.ghyj I/System.out: 規劃路線的座標 x577y96";
    /** 根據我的分析是這個樣子的**/
    String regex =  "^\\d+[-]+\\d+\\s+\\d+[:]+";
    String regex3 = "^\\d+[-]+\\d+\\s+\\d+[:]+\\d+[:]+\\d+[.]+\\d+";
    String regex4 = "^\\d+[-]+\\d+\\s+\\d+[:]+\\d+[:]+\\d+[.]+\\d+\\s+\\d+[-]+\\d+[/]+";
    String regex5 = "^\\d+[-]+\\d+\\s+\\d+[:]+\\d+[:]+\\d+[.]+\\d+\\s+\\d+[-]+\\d+[/]+
                     \\w+[.]+\\w+[.]+\\w+\\s+\\w+[/]+\\w+[.]+\\w+[:]+";
    String regex6 = "^\\d+[-]+\\d+\\s+\\d+[:]+\\d+[:]+\\d+[.]+\\d+\\s+\\d+[-]+\\d+[/]+
                    \\w+[.]+\\w+[.]+\\w+\\s+\\w+[/]+\\w+[.]+\\w+[:]+\\s+[\u4E00-\u9FA5]+\\s+\\w+";
    /** 根據需求知道我需要擷取的是後面的x和y那麼如下:**/
    String regex7 = "^\\d+[-]+\\d+\\s+\\d+[:]+\\d+[:]+\\d+[.]+\\d+\\s+\\d+[-]+\\d+[/]+
                    \\w+[.]+\\w+[.]+\\w+\\s+\\w+[/]+\\w+[.]+\\w+[:]+\\s+[\u4E00-\u9FA5]+\\s+";
    if(str6.matches(regex6)){
        System.out.println(1);
    }else{
        System.out.println(0);
    }
    String[] strValue = str6.split(regex7);
    for(int i = 0; i < strValue.length; i++){
        if(!"".equals(strValue[i])){

            System.out.println(strValue[i]);
        }
    }
輸出結果為:
1
x577y96
是沒有問題的,感覺收穫蠻大的.爭取一週更新兩篇部落格.

人生為棋，我願為卒，行動雖慢，可誰見我都會後退一步...

正則表示式中常用字串方法

1，search()用於檢索字串中指定的子字串，或檢索與正則表示式相匹配的子字串，並返回子串的起始位置。search()方法不支援全域性搜尋，因為會忽略正則表示式引數的標識g，並且也忽略了regexp的lastIndex屬性，總是從字串的開始位置進行檢索，所以它會總是返回str的第一個匹配的位置。 &n

python之re模組（正則表示式）常用函式

1、compile() 編譯正則表示式模式，返回一個物件的模式。（可以把那些常用的正則表示式編譯成正則表示式物件，這樣可以提高一點效率。）格式： re.compile(pattern,flags=0) pattern: 編譯時用的表示式字串。 flags 編譯標誌位，用於修改正

正則表示式中常用符號

一：正則在Perl、Py森、Ruby、Java等語言中文字的正則表示式幾乎是一樣的以前常用到的在網上都有現成的例子拿來用，比如電話格式、郵箱格式之類的。但是自然語言處理中往往會根據自己的需求來制定一個表示式，如果正則的知識掌握的比較片面，在編寫自然語言

Java正則表示式和常用正則

1匹配驗證-驗證Email是否正確 Java | 複製 1 2 3 4 5 6 7 8 9 10 11 12 13 14 public static void main(String[] ar

JS正則表示式的常用用法

1、js擷取兩個字串之間的內容： var str = "123456"; str = str.match(/123(\S*)56/)[1]; alert(str);//結果4 2、js擷取某個字串前面的內容： var str = "123456"; tr = str.match(/(\S

正則表示式的常用字元整合文件

1、普通字元匹配規則：匹配相應的普通字元 e.g. In [9]: re.findall("abc","abcksjdabclkjks") Out[9]: ['abc', 'abc'] 2、或：元字元：ab | cd 匹配規則：匹配|兩邊任意一個正則表示式符合的

JS正則表示式中常用的方法

正則常用的符號知識點限定符 * 表示前面的表示式出現0次到多次{0,} + 表示前面的表示式出現一次到多次{1,} ？最少0次，最多一次（可以阻止貪婪模式）{0,1} {} 更加明確的表示前面的表示式出現的次數其它 . 表示的是除

正則表示式筆記--常用正則表示式

在學會使用下面的正則之前應該先了解基本的正則語法。可以從下面的連結進行學習。常用正則表示式一、校驗數字的表示式 1 數字：^[0-9]*$ 2 n位的數字：^\d{n}$ 3 至少n位的數字：^\d{n,}$ 4 m-n位的數字：^\d{m

C# 正則表示式及常用正則表示式

匹配模式+環視(順序環視、逆序環視)+貪婪與非貪婪 RegexOptions.Multiline “^”匹配結果分析在不開啟多行模式時，“^”只匹配字串的開始位置，也就是位置0。在開啟了多行模式後，“^”匹配字串開始位置和每個“\n”之後的行起始位置。 “$”匹配結果分析在不開啟多行模式時，如

Linux_Shell_Shell 中的正則表示式與常用正則表示式

在Linux Shell 程式設計中，我們常需要用到正則表示式進行檔案的匹配在本篇文章中，我們對Linux shell 中的正則表示式做一個總結，方便之後的shell 編寫。參考文章：shell程式設計之正則表示式shell script 在if 的判斷條件正則表示式

正則表示式和常用規則

* 常用的正則表示式規則： * a:字元 * x 字元 x , 舉例：'a'表示字元a * \\ 反斜線字元 , 在正則表示式中，只有兩個\\才能表達一個\ * \n 新行（換行）符 ('\u000A') * \r 回車符 ('\u000D') * b:字元類

正則表示式的常用場景

import re #一、 4到16位（字母，數字，下劃線，減號） if re.match(r'^[a-zA-Z0-9_-]{4,16}$', "abwc"): print("匹配1") #########################################

手機號碼，郵箱，qq完整正則表示式及常用正則表示式

（1）手機號碼 String regex = "^(((1[3,5,8][0-9])|(14[5,7])|(17[0,6,7,8]))+\\d{8})$"; ( 2 ) 郵箱 String regex="^([a-zA-Z0-9_-])[email prot

正則表示式--基礎常用字元

1.定界符：/***/ 2.反斜槓：\代表轉義（用來特殊輸出） \\代表輸出一個在" "裡要輸出一個 " 要 \" 幾個形式：\r \n \t \\ \" \' \. 3. ^ :匹

正則表示式最常用的幾種情形

正則表示式提供了一種字串匹配模式的描述形式，通過簡單的符號就能表達豐富的文字結構。如 [a-z]+ 就可以表示所有字母的組合。以下是在實際專案中使用得最多的三種情形。 1 判斷如判斷使用者的輸入是否符合要求。通常使用正則表示式的 test 方法，當傳入的字串符合正則表示式的模式要求時會返回 true。

關於正則表示式的一些常用困惑

前言:因為業務需要需要匹配出文件中特定的資料,並且賦值到到特定的陣列上面，所以需要用到特定的關係進行匹配,正則表示式是一個不錯的選擇,但是畢竟是普通人所以沒辦法!習慣性遺忘...說句實話還是用的少的原因,下面簡單的複習下為了以後自己看，簡單的做下筆記,雖然今

常用的必要的一些正則表示式

1 . 校驗密碼強度密碼的強度必須是包含大小寫字母和數字的組合，不能使用特殊字元，長度在8-10之間。 ^(?=.*\\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$ 2. 校驗中文字串僅能是中文。 ^[\\u4e00-\\u9fa5]{0,}$ 3

java_正則簡單介紹，正則匹配頁面時經常會遇見各種不匹配，下面是我copy過來的一些正則語法嘗試和一些常用正則表示式

正則表示式語法一個正則表示式就是由普通字元（例如字元 a 到 z）以及特殊字元（稱為元字元）組成的文字模式。該模式描述在查詢文字主體時待匹配的一個或多個字串。正則表示式作為一個模板，將某個字元模式與所搜尋的字串進行匹配。這裡有一些可能會遇到的正則表示式示例： Visual

一些常用的正則表示式

常用的正則表示式匹配中文字元的正則表示式： [\u4e00-\u9fa5] 匹配雙位元組字元(包括漢字在內)：[^\x00-\xff] 匹配空行的正則表示式：\n[\s| ]*\r 匹配HTML標記的正則表示式：/<(.*)>.*<\/\1&g

js一些常用的校驗（工作中用的較多的，並附常用正則表示式）

做web的經常會遇到一些js校驗，比如身份證呀，手機號呀，郵箱呀等等，分享下我工作中遇到的這些，整理了下 /* * 校驗是否為空(null/空串) */ var checkNull = function(str){ if(str == null || str ==

關於正則表示式的一些常用困惑

正則表示式

相關推薦