1. 程式人生 > >正則表達式簡單用法及常用正則表達式

正則表達式簡單用法及常用正則表達式

而不是 區分 匹配規則 true 127.0.0.1 字符類 正數 判斷 com

正則表達式的概念:

  是一個字符串,使用單個字符串來描述、用來定義匹配規則,匹配一系列符合某個句法規則的字符串。在開發中,正則表達式通常被用來檢索、替換那些符合某個規則的文本。

正則表達式的匹配規則:

  參照幫助文檔,在jdk中:java.util.regex.Pattern類中有正則表達式的的規則定義,正則表達式中明確區分大小寫字母。我們來學習語法規則。

  正則表達式的語法規則:

  字符:x

    含義:代表的是字符x

    例如:匹配規則為 "a",那麽需要匹配的字符串內容就是 ”a”

  字符:\\

    含義:代表的是反斜線字符‘\‘

    例如:匹配規則為"\\" 那麽需要匹配的字符串內容就是 ”\”

  字符:\t

    含義:制表符

    例如:匹配規則為"\t" ,那麽對應的效果就是產生一個制表符的空間

  字符:\n

    含義:換行符

    例如:匹配規則為"\n",那麽對應的效果就是換行,光標在原有位置的下一行

  字符:\r

    含義:回車符

    例如:匹配規則為"\r" ,那麽對應的效果就是回車後的效果,光標來到下一行行首

  字符類:[abc]

    含義:代表的是字符a、b 或 c

    例如:匹配規則為"[abc]" ,那麽需要匹配的內容就是字符a,或者字符b,或字符c的一個

  字符類:[^abc]

    含義:代表的是除了 a、b 或 c以外的任何字符

    例如:匹配規則為"[^abc]",那麽需要匹配的內容就是不是字符a,或者不是字符b,或不是字符c的任意一個字符

  字符類:[a-zA-Z]

    含義:代表的是a 到 z 或 A 到 Z,兩頭的字母包括在內

    例如:匹配規則為"[a-zA-Z]",那麽需要匹配的是一個大寫或者小寫字母

  字符類:[0-9]

    含義:代表的是 0到9數字,兩頭的數字包括在內

    例如:匹配規則為"[0-9]",那麽需要匹配的是一個數字

  字符類:[a-zA-Z_0-9]

    含義:代表的字母或者數字或者下劃線(即單詞字符)

    例如:匹配規則為" [a-zA-Z_0-9] ",那麽需要匹配的是一個字母或者是一個數字或一個下滑線

  預定義字符類:.

    含義:代表的是任何字符

    例如:匹配規則為" . ",那麽需要匹配的是一個任意字符。如果,就想使用 . 的話,使用匹配規則"\\."來實現

  預定義字符類:\d

    含義:代表的是 0到9數字,兩頭的數字包括在內,相當於[0-9]

    例如:匹配規則為"\d ",那麽需要匹配的是一個數字

  預定義字符類:\w

    含義:代表的字母或者數字或者下劃線(即單詞字符),相當於[a-zA-Z_0-9]

    例如:匹配規則為"\w ",,那麽需要匹配的是一個字母或者是一個數字或一個下滑線

  邊界匹配器:^

    含義:代表的是行的開頭

    例如:匹配規則為^[abc][0-9]$ ,那麽需要匹配的內容從[abc]這個位置開始, 相當於左雙引號

  邊界匹配器:$

    含義:代表的是行的結尾

    例如:匹配規則為^[abc][0-9]$ ,那麽需要匹配的內容以[0-9]這個結束, 相當於右雙引號

  邊界匹配器:\b

    含義:代表的是單詞邊界

    例如:匹配規則為"\b[abc]\b" ,那麽代表的是字母a或b或c的左右兩邊需要的是非單詞字符([a-zA-Z_0-9])

  數量詞:X?

    含義:代表的是X出現一次或一次也沒有

    例如:匹配規則為"a?",那麽需要匹配的內容是一個字符a,或者一個a都沒有

  數量詞:X*

    含義:代表的是X出現零次或多次

    例如:匹配規則為"a*" ,那麽需要匹配的內容是多個字符a,或者一個a都沒有

  數量詞:X+

    含義:代表的是X出現一次或多次

    例如:匹配規則為"a+",那麽需要匹配的內容是多個字符a,或者一個a

  數量詞:X{n}

    含義:代表的是X出現恰好 n 次

    例如:匹配規則為"a{5}",那麽需要匹配的內容是5個字符a

  數量詞:X{n,}

    含義:代表的是X出現至少 n 次

    例如:匹配規則為"a{5, }",那麽需要匹配的內容是最少有5個字符a

  數量詞:X{n,m}

    含義:代表的是X出現至少 n 次,但是不超過 m 次

    例如:匹配規則為"a{5,8}",那麽需要匹配的內容是有5個字符a 到 8個字符a之間

正則表達式規則匹配練習

  ①:請寫出滿足如下匹配規則的字符串:

    規則:"[0-9]{6,12}"

    解釋:該規則需要匹配的內容是:長度為6位到12位的數字。

    示例:使用數據"123456789"進行匹配結果為true;

    使用數據"12345"進行匹配結果為false。

    規則:"1[34578][0-9]{9}"

    解釋:該規則需要匹配的內容是:11位的手機號碼,第1位為1,第2位為3、4、5、7、8中的一個,後面9位為0到9之間的任意數字

    示例:使用數據"12345678901"進行匹配結果為false;

    使用數據"13312345678"進行匹配結果為true。

    規則:"a*b"

    解釋:該規則需要匹配的內容是:在多個a或零個a後面有個b;b必須為最後一個字符。

    示例:使用數據"aaaaab"進行匹配結果為true;

    使用數據"abc"進行匹配結果為false。

    規則:

      匹配正整數:”\\d+”

      匹配正小數:”\\d+\\.\\d+”

      匹配負整數:”-\\d+”

      匹配負小數:”-\\d+\\.\\d+”

      匹配保留兩位小數的正數:”\\d+\\.\\d{2}”

      匹配保留1-3位小數的正數:”\\d+\\.\\d{1,3}”

    解釋:匹配正確的數字

    規則:”[a-zA-Z_0-9][email protected][a-zA-Z_0-9]+(\\.[a-zA-Z_0-9]+)+\\[email protected]\\w+(\\.\\w+)+”

    解釋:匹配合法的郵箱

字符串類中涉及正則表達式的常用方法

技術分享圖片

代碼示例:

 1 /**
 2 *    matches(String regex):判斷字符串是否匹配給定的規則
 3 *    校驗qq號碼.規則:[1-9][0-9]{4,14}
 4 *    1: 要求必須是5-15位數字
 5 *    2: 0不能開頭
 6 */
 7 public void matchesTest(){
 8     String qq = "604154942";
 9     String regex = "[1-9][0-9]{4,14}";
10     boolean flag = qq.matches(regex);
11 }
 1 /**
 2 *    split(String regex):根據給定正則表達式的匹配規則,拆分此字符串
 3 *    分割出字符串中的的數字:_
 4 *    通過"_"拆分
 5 */
 6 public void splitTest01(){
 7     String s = "18-22-40-65";
 8     String regex = "-";
 9     String[] result = s.split(regex);
10     System.out.println(result);//[18,22,40,65]15 }
16 /**
17 *    按空格分割出字符串中的的數字: +
18 *    18    22      40            65
19 *    註意:當有多個空格的時候,正則條件不能單純的寫成“ ”(空格),這樣只會匹配一個空格,切出來的數據不符合我們要求,
20 *    要寫成“ +”("空格+"),+表示匹配一個或多個
21 */
22 public void splitTest02(){
23     String s = "18    22      40            65";
24     String regex = " +";
25     String[] result = s.split(regex);
26     System.out.println(result);//[18,22,40,65]
27 }
1 /**
2 *    切IP地址:“\\.”
3 */
4 public void splitTest03(){
5     Spring ip = "127.0.0.1";
6     // "."在正則中有特殊含義,通過轉譯符"\"將其轉譯
7     Spring regex = "\\.";
8     Spring[] result = ip.split(regex);    
9 }
 1 /**
 2 *    replaceAll(String regex,String replacement):將符合規則的字符串內容,全部替換為新字符串
 3 *    將數字替換成#號
 4 */
 5 public void replaceAllTest01(){
 6     String s = "Hello12345World6789012";
 7     // "\\d"匹配的是一個位置是否為數字
 8     String regex = "[\\d]";
 9     String result = s.replaceAll(regex, "#");
10     System.out.println(result); // 結果是:Hello#####World#######
11 }
12 /**
13 *    將數字替換成一個#號
14 */
15 public void replaceAllTest02(){
16     String s = "Hello12345World6789012";
17     // "\\d"匹配的是一個位置是否為數字,+表示一個或多個,註意+不能寫[]裏面
18     String regex = "[\\d]+";
19     String result = s.replaceAll(regex, "#");
20     System.out.println(result); // 結果是:Hello#World#

常用正則表達式

一、校驗數字的表達式

  • 數字:^[0-9]*$
  • n位的數字:^\d{n}$
  • 至少n位的數字:^\d{n,}$
  • m-n位的數字:^\d{m,n}$
  • 零和非零開頭的數字:^(0|[1-9][0-9]*)$
  • 非零開頭的最多帶兩位小數的數字:^([1-9][0-9]*)+(\.[0-9]{1,2})?$
  • 帶1-2位小數的正數或負數:^(\-)?\d+(\.\d{1,2})$
  • 正數、負數、和小數:^(\-|\+)?\d+(\.\d+)?$
  • 有兩位小數的正實數:^[0-9]+(\.[0-9]{2})?$
  • 有1~3位小數的正實數:^[0-9]+(\.[0-9]{1,3})?$
  • 非零的正整數:^[1-9]\d*$ 或 ^([1-9][0-9]*){1,3}$ 或 ^\+?[1-9][0-9]*$
  • 非零的負整數:^\-[1-9][]0-9"*$ 或 ^-[1-9]\d*$
  • 非負整數:^\d+$ 或 ^[1-9]\d*|0$
  • 非正整數:^-[1-9]\d*|0$ 或 ^((-\d+)|(0+))$
  • 非負浮點數:^\d+(\.\d+)?$ 或 ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$
  • 非正浮點數:^((-\d+(\.\d+)?)|(0+(\.0+)?))$ 或 ^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$
  • 正浮點數:^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$ 或 ^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$
  • 負浮點數:^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$ 或 ^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$
  • 浮點數:^(-?\d+)(\.\d+)?$ 或 ^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$

校驗字符的表達式

  • 漢字:^[\u4e00-\u9fa5]{0,}$
  • 英文和數字:^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$
  • 長度為3-20的所有字符:^.{3,20}$
  • 由26個英文字母組成的字符串:^[A-Za-z]+$
  • 由26個大寫英文字母組成的字符串:^[A-Z]+$
  • 由26個小寫英文字母組成的字符串:^[a-z]+$
  • 由數字和26個英文字母組成的字符串:^[A-Za-z0-9]+$
  • 由數字、26個英文字母或者下劃線組成的字符串:^\w+$ 或 ^\w{3,20}$
  • 中文、英文、數字包括下劃線:^[\u4E00-\u9FA5A-Za-z0-9_]+$
  • 中文、英文、數字但不包括下劃線等符號:^[\u4E00-\u9FA5A-Za-z0-9]+$ 或 ^[\u4E00-\u9FA5A-Za-z0-9]{2,20}$
  • 可以輸入含有^%&‘,;=?$\"等字符:[^%&‘,;=?$\x22]+
  • 禁止輸入含有~的字符:[^~\x22]+

三、特殊需求表達式

  • Email地址:^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$
  • 域名:[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?
  • InternetURL:[a-zA-z]+://[^\s]* 或 ^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$
  • 手機號碼:^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$
  • 電話號碼("XXX-XXXXXXX"、"XXXX-XXXXXXXX"、"XXX-XXXXXXX"、"XXX-XXXXXXXX"、"XXXXXXX"和"XXXXXXXX):^(\(\d{3,4}-)|\d{3.4}-)?\d{7,8}$
  • 國內電話號碼(0511-4405222、021-87888822):\d{3}-\d{8}|\d{4}-\d{7}
  • 電話號碼正則表達式(支持手機號碼,3-4位區號,7-8位直播號碼,1-4位分機號): ((\d{11})|^((\d{7,8})|(\d{4}|\d{3})-(\d{7,8})|(\d{4}|\d{3})-(\d{7,8})-(\d{4}|\d{3}|\d{2}|\d{1})|(\d{7,8})-(\d{4}|\d{3}|\d{2}|\d{1}))$)
  • 身份證號(15位、18位數字),最後一位是校驗位,可能為數字或字符X:(^\d{15}$)|(^\d{18}$)|(^\d{17}(\d|X|x)$)
  • 帳號是否合法(字母開頭,允許5-16字節,允許字母數字下劃線):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
  • 密碼(以字母開頭,長度在6~18之間,只能包含字母、數字和下劃線):^[a-zA-Z]\w{5,17}$
  • 強密碼(必須包含大小寫字母和數字的組合,不能使用特殊字符,長度在 8-10 之間):^(?=.*\d)(?=.*[a-z])(?=.*[A-Z])[a-zA-Z0-9]{8,10}$
  • 強密碼(必須包含大小寫字母和數字的組合,可以使用特殊字符,長度在8-10之間):^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$
  • 日期格式:^\d{4}-\d{1,2}-\d{1,2}
  • 一年的12個月(01~09和1~12):^(0?[1-9]|1[0-2])$
  • 一個月的31天(01~09和1~31):^((0?[1-9])|((1|2)[0-9])|30|31)$
  • 錢的輸入格式:
    1. 有四種錢的表示形式我們可以接受:"10000.00" 和 "10,000.00", 和沒有 "分" 的 "10000" 和 "10,000":^[1-9][0-9]*$
    2. 這表示任意一個不以0開頭的數字,但是,這也意味著一個字符"0"不通過,所以我們采用下面的形式:^(0|[1-9][0-9]*)$
    3. 一個0或者一個不以0開頭的數字.我們還可以允許開頭有一個負號:^(0|-?[1-9][0-9]*)$
    4. 這表示一個0或者一個可能為負的開頭不為0的數字.讓用戶以0開頭好了.把負號的也去掉,因為錢總不能是負的吧。下面我們要加的是說明可能的小數部分:^[0-9]+(.[0-9]+)?$
    5. 必須說明的是,小數點後面至少應該有1位數,所以"10."是不通過的,但是 "10" 和 "10.2" 是通過的:^[0-9]+(.[0-9]{2})?$
    6. 這樣我們規定小數點後面必須有兩位,如果你認為太苛刻了,可以這樣:^[0-9]+(.[0-9]{1,2})?$
    7. 這樣就允許用戶只寫一位小數.下面我們該考慮數字中的逗號了,我們可以這樣:^[0-9]{1,3}(,[0-9]{3})*(.[0-9]{1,2})?$
    8. 1到3個數字,後面跟著任意個 逗號+3個數字,逗號成為可選,而不是必須:^([0-9]+|[0-9]{1,3}(,[0-9]{3})*)(.[0-9]{1,2})?$
    9. 備註:這就是最終結果了,別忘了"+"可以用"*"替代如果你覺得空字符串也可以接受的話(奇怪,為什麽?)最後,別忘了在用函數時去掉去掉那個反斜杠,一般的錯誤都在這裏
  • xml文件:^([a-zA-Z]+-?)+[a-zA-Z0-9]+\\.[x|X][m|M][l|L]$
  • 中文字符的正則表達式:[\u4e00-\u9fa5]
  • 雙字節字符:[^\x00-\xff] (包括漢字在內,可以用來計算字符串的長度(一個雙字節字符長度計2,ASCII字符計1))
  • 空白行的正則表達式:\n\s*\r (可以用來刪除空白行)
  • HTML標記的正則表達式:<(\S*?)[^>]*>.*?|<.*? /> ( 首尾空白字符的正則表達式:^\s*|\s*$或(^\s*)|(\s*$) (可以用來刪除行首行尾的空白字符(包括空格、制表符、換頁符等等),非常有用的表達式)
  • 騰訊QQ號:[1-9][0-9]{4,} (騰訊QQ號從10000開始)
  • 中國郵政編碼:[1-9]\d{5}(?!\d) (中國郵政編碼為6位數字)
  • IP地址:((?:(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d)\\.){3}(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d))

正則表達式簡單用法及常用正則表達式