正則表達式簡單用法及常用正則表達式
正則表達式的概念:
是一個字符串,使用單個字符串來描述、用來定義匹配規則,匹配一系列符合某個句法規則的字符串。在開發中,正則表達式通常被用來檢索、替換那些符合某個規則的文本。
正則表達式的匹配規則:
參照幫助文檔,在jdk中:java.util.regex.Pattern類中有正則表達式的的規則定義,正則表達式中明確區分大小寫字母。我們來學習語法規則。
正則表達式的語法規則:
字符:x
含義:代表的是字符x
例如:匹配規則為 "a",那麽需要匹配的字符串內容就是 ”a”
字符:\\
含義:代表的是反斜線字符‘\‘
例如:匹配規則為"\\" ,那麽需要匹配的字符串內容就是 ”\”
字符:\t
含義:制表符
例如:匹配規則為"\t" ,那麽對應的效果就是產生一個制表符的空間
字符:\n
含義:換行符
例如:匹配規則為"\n",那麽對應的效果就是換行,光標在原有位置的下一行
字符:\r
含義:回車符
例如:匹配規則為"\r" ,那麽對應的效果就是回車後的效果,光標來到下一行行首
字符類:[abc]
含義:代表的是字符a、b 或 c
例如:匹配規則為"[abc]" ,那麽需要匹配的內容就是字符a,或者字符b,或字符c的一個
字符類:[^abc]
含義:代表的是除了 a、b 或 c以外的任何字符
例如:匹配規則為"[^abc]",那麽需要匹配的內容就是不是字符a,或者不是字符b,或不是字符c的任意一個字符
字符類:[a-zA-Z]
含義:代表的是a 到 z 或 A 到 Z,兩頭的字母包括在內
例如:匹配規則為"[a-zA-Z]",那麽需要匹配的是一個大寫或者小寫字母
字符類:[0-9]
含義:代表的是 0到9數字,兩頭的數字包括在內
例如:匹配規則為"[0-9]",那麽需要匹配的是一個數字
字符類:[a-zA-Z_0-9]
含義:代表的字母或者數字或者下劃線(即單詞字符)
例如:匹配規則為" [a-zA-Z_0-9] ",那麽需要匹配的是一個字母或者是一個數字或一個下滑線
預定義字符類:.
含義:代表的是任何字符
例如:匹配規則為" . ",那麽需要匹配的是一個任意字符。如果,就想使用 . 的話,使用匹配規則"\\."來實現
預定義字符類:\d
含義:代表的是 0到9數字,兩頭的數字包括在內,相當於[0-9]
例如:匹配規則為"\d ",那麽需要匹配的是一個數字
預定義字符類:\w
含義:代表的字母或者數字或者下劃線(即單詞字符),相當於[a-zA-Z_0-9]
例如:匹配規則為"\w ",,那麽需要匹配的是一個字母或者是一個數字或一個下滑線
邊界匹配器:^
含義:代表的是行的開頭
例如:匹配規則為^[abc][0-9]$ ,那麽需要匹配的內容從[abc]這個位置開始, 相當於左雙引號
邊界匹配器:$
含義:代表的是行的結尾
例如:匹配規則為^[abc][0-9]$ ,那麽需要匹配的內容以[0-9]這個結束, 相當於右雙引號
邊界匹配器:\b
含義:代表的是單詞邊界
例如:匹配規則為"\b[abc]\b" ,那麽代表的是字母a或b或c的左右兩邊需要的是非單詞字符([a-zA-Z_0-9])
數量詞:X?
含義:代表的是X出現一次或一次也沒有
例如:匹配規則為"a?",那麽需要匹配的內容是一個字符a,或者一個a都沒有
數量詞:X*
含義:代表的是X出現零次或多次
例如:匹配規則為"a*" ,那麽需要匹配的內容是多個字符a,或者一個a都沒有
數量詞:X+
含義:代表的是X出現一次或多次
例如:匹配規則為"a+",那麽需要匹配的內容是多個字符a,或者一個a
數量詞:X{n}
含義:代表的是X出現恰好 n 次
例如:匹配規則為"a{5}",那麽需要匹配的內容是5個字符a
數量詞:X{n,}
含義:代表的是X出現至少 n 次
例如:匹配規則為"a{5, }",那麽需要匹配的內容是最少有5個字符a
數量詞:X{n,m}
含義:代表的是X出現至少 n 次,但是不超過 m 次
例如:匹配規則為"a{5,8}",那麽需要匹配的內容是有5個字符a 到 8個字符a之間
正則表達式規則匹配練習
①:請寫出滿足如下匹配規則的字符串:
規則:"[0-9]{6,12}"
解釋:該規則需要匹配的內容是:長度為6位到12位的數字。
示例:使用數據"123456789"進行匹配結果為true;
使用數據"12345"進行匹配結果為false。
規則:"1[34578][0-9]{9}"
解釋:該規則需要匹配的內容是:11位的手機號碼,第1位為1,第2位為3、4、5、7、8中的一個,後面9位為0到9之間的任意數字。
示例:使用數據"12345678901"進行匹配結果為false;
使用數據"13312345678"進行匹配結果為true。
規則:"a*b"
解釋:該規則需要匹配的內容是:在多個a或零個a後面有個b;b必須為最後一個字符。
示例:使用數據"aaaaab"進行匹配結果為true;
使用數據"abc"進行匹配結果為false。
規則:
匹配正整數:”\\d+”
匹配正小數:”\\d+\\.\\d+”
匹配負整數:”-\\d+”
匹配負小數:”-\\d+\\.\\d+”
匹配保留兩位小數的正數:”\\d+\\.\\d{2}”
匹配保留1-3位小數的正數:”\\d+\\.\\d{1,3}”
解釋:匹配正確的數字
規則:”[a-zA-Z_0-9][email protected][a-zA-Z_0-9]+(\\.[a-zA-Z_0-9]+)+\\[email protected]\\w+(\\.\\w+)+”
解釋:匹配合法的郵箱
字符串類中涉及正則表達式的常用方法
代碼示例:
1 /** 2 * matches(String regex):判斷字符串是否匹配給定的規則 3 * 校驗qq號碼.規則:[1-9][0-9]{4,14} 4 * 1: 要求必須是5-15位數字 5 * 2: 0不能開頭 6 */ 7 public void matchesTest(){ 8 String qq = "604154942"; 9 String regex = "[1-9][0-9]{4,14}"; 10 boolean flag = qq.matches(regex); 11 }
1 /** 2 * split(String regex):根據給定正則表達式的匹配規則,拆分此字符串 3 * 分割出字符串中的的數字:_ 4 * 通過"_"拆分 5 */ 6 public void splitTest01(){ 7 String s = "18-22-40-65"; 8 String regex = "-"; 9 String[] result = s.split(regex); 10 System.out.println(result);//[18,22,40,65]15 } 16 /** 17 * 按空格分割出字符串中的的數字: + 18 * 18 22 40 65 19 * 註意:當有多個空格的時候,正則條件不能單純的寫成“ ”(空格),這樣只會匹配一個空格,切出來的數據不符合我們要求, 20 * 要寫成“ +”("空格+"),+表示匹配一個或多個 21 */ 22 public void splitTest02(){ 23 String s = "18 22 40 65"; 24 String regex = " +"; 25 String[] result = s.split(regex); 26 System.out.println(result);//[18,22,40,65] 27 }
1 /** 2 * 切IP地址:“\\.” 3 */ 4 public void splitTest03(){ 5 Spring ip = "127.0.0.1"; 6 // "."在正則中有特殊含義,通過轉譯符"\"將其轉譯 7 Spring regex = "\\."; 8 Spring[] result = ip.split(regex); 9 }
1 /** 2 * replaceAll(String regex,String replacement):將符合規則的字符串內容,全部替換為新字符串 3 * 將數字替換成#號 4 */ 5 public void replaceAllTest01(){ 6 String s = "Hello12345World6789012"; 7 // "\\d"匹配的是一個位置是否為數字 8 String regex = "[\\d]"; 9 String result = s.replaceAll(regex, "#"); 10 System.out.println(result); // 結果是:Hello#####World####### 11 } 12 /** 13 * 將數字替換成一個#號 14 */ 15 public void replaceAllTest02(){ 16 String s = "Hello12345World6789012"; 17 // "\\d"匹配的是一個位置是否為數字,+表示一個或多個,註意+不能寫[]裏面 18 String regex = "[\\d]+"; 19 String result = s.replaceAll(regex, "#"); 20 System.out.println(result); // 結果是:Hello#World#
常用正則表達式
一、校驗數字的表達式
- 數字:^[0-9]*$
- n位的數字:^\d{n}$
- 至少n位的數字:^\d{n,}$
- m-n位的數字:^\d{m,n}$
- 零和非零開頭的數字:^(0|[1-9][0-9]*)$
- 非零開頭的最多帶兩位小數的數字:^([1-9][0-9]*)+(\.[0-9]{1,2})?$
- 帶1-2位小數的正數或負數:^(\-)?\d+(\.\d{1,2})$
- 正數、負數、和小數:^(\-|\+)?\d+(\.\d+)?$
- 有兩位小數的正實數:^[0-9]+(\.[0-9]{2})?$
- 有1~3位小數的正實數:^[0-9]+(\.[0-9]{1,3})?$
- 非零的正整數:^[1-9]\d*$ 或 ^([1-9][0-9]*){1,3}$ 或 ^\+?[1-9][0-9]*$
- 非零的負整數:^\-[1-9][]0-9"*$ 或 ^-[1-9]\d*$
- 非負整數:^\d+$ 或 ^[1-9]\d*|0$
- 非正整數:^-[1-9]\d*|0$ 或 ^((-\d+)|(0+))$
- 非負浮點數:^\d+(\.\d+)?$ 或 ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$
- 非正浮點數:^((-\d+(\.\d+)?)|(0+(\.0+)?))$ 或 ^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$
- 正浮點數:^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$ 或 ^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$
- 負浮點數:^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$ 或 ^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$
- 浮點數:^(-?\d+)(\.\d+)?$ 或 ^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$
校驗字符的表達式
- 漢字:^[\u4e00-\u9fa5]{0,}$
- 英文和數字:^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$
- 長度為3-20的所有字符:^.{3,20}$
- 由26個英文字母組成的字符串:^[A-Za-z]+$
- 由26個大寫英文字母組成的字符串:^[A-Z]+$
- 由26個小寫英文字母組成的字符串:^[a-z]+$
- 由數字和26個英文字母組成的字符串:^[A-Za-z0-9]+$
- 由數字、26個英文字母或者下劃線組成的字符串:^\w+$ 或 ^\w{3,20}$
- 中文、英文、數字包括下劃線:^[\u4E00-\u9FA5A-Za-z0-9_]+$
- 中文、英文、數字但不包括下劃線等符號:^[\u4E00-\u9FA5A-Za-z0-9]+$ 或 ^[\u4E00-\u9FA5A-Za-z0-9]{2,20}$
- 可以輸入含有^%&‘,;=?$\"等字符:[^%&‘,;=?$\x22]+
- 禁止輸入含有~的字符:[^~\x22]+
三、特殊需求表達式
- Email地址:^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$
- 域名:[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?
- InternetURL:[a-zA-z]+://[^\s]* 或 ^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$
- 手機號碼:^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$
- 電話號碼("XXX-XXXXXXX"、"XXXX-XXXXXXXX"、"XXX-XXXXXXX"、"XXX-XXXXXXXX"、"XXXXXXX"和"XXXXXXXX):^(\(\d{3,4}-)|\d{3.4}-)?\d{7,8}$
- 國內電話號碼(0511-4405222、021-87888822):\d{3}-\d{8}|\d{4}-\d{7}
- 電話號碼正則表達式(支持手機號碼,3-4位區號,7-8位直播號碼,1-4位分機號): ((\d{11})|^((\d{7,8})|(\d{4}|\d{3})-(\d{7,8})|(\d{4}|\d{3})-(\d{7,8})-(\d{4}|\d{3}|\d{2}|\d{1})|(\d{7,8})-(\d{4}|\d{3}|\d{2}|\d{1}))$)
- 身份證號(15位、18位數字),最後一位是校驗位,可能為數字或字符X:(^\d{15}$)|(^\d{18}$)|(^\d{17}(\d|X|x)$)
- 帳號是否合法(字母開頭,允許5-16字節,允許字母數字下劃線):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
- 密碼(以字母開頭,長度在6~18之間,只能包含字母、數字和下劃線):^[a-zA-Z]\w{5,17}$
- 強密碼(必須包含大小寫字母和數字的組合,不能使用特殊字符,長度在 8-10 之間):^(?=.*\d)(?=.*[a-z])(?=.*[A-Z])[a-zA-Z0-9]{8,10}$
- 強密碼(必須包含大小寫字母和數字的組合,可以使用特殊字符,長度在8-10之間):^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$
- 日期格式:^\d{4}-\d{1,2}-\d{1,2}
- 一年的12個月(01~09和1~12):^(0?[1-9]|1[0-2])$
- 一個月的31天(01~09和1~31):^((0?[1-9])|((1|2)[0-9])|30|31)$
- 錢的輸入格式:
- 有四種錢的表示形式我們可以接受:"10000.00" 和 "10,000.00", 和沒有 "分" 的 "10000" 和 "10,000":^[1-9][0-9]*$
- 這表示任意一個不以0開頭的數字,但是,這也意味著一個字符"0"不通過,所以我們采用下面的形式:^(0|[1-9][0-9]*)$
- 一個0或者一個不以0開頭的數字.我們還可以允許開頭有一個負號:^(0|-?[1-9][0-9]*)$
- 這表示一個0或者一個可能為負的開頭不為0的數字.讓用戶以0開頭好了.把負號的也去掉,因為錢總不能是負的吧。下面我們要加的是說明可能的小數部分:^[0-9]+(.[0-9]+)?$
- 必須說明的是,小數點後面至少應該有1位數,所以"10."是不通過的,但是 "10" 和 "10.2" 是通過的:^[0-9]+(.[0-9]{2})?$
- 這樣我們規定小數點後面必須有兩位,如果你認為太苛刻了,可以這樣:^[0-9]+(.[0-9]{1,2})?$
- 這樣就允許用戶只寫一位小數.下面我們該考慮數字中的逗號了,我們可以這樣:^[0-9]{1,3}(,[0-9]{3})*(.[0-9]{1,2})?$
- 1到3個數字,後面跟著任意個 逗號+3個數字,逗號成為可選,而不是必須:^([0-9]+|[0-9]{1,3}(,[0-9]{3})*)(.[0-9]{1,2})?$
- 備註:這就是最終結果了,別忘了"+"可以用"*"替代如果你覺得空字符串也可以接受的話(奇怪,為什麽?)最後,別忘了在用函數時去掉去掉那個反斜杠,一般的錯誤都在這裏
- xml文件:^([a-zA-Z]+-?)+[a-zA-Z0-9]+\\.[x|X][m|M][l|L]$
- 中文字符的正則表達式:[\u4e00-\u9fa5]
- 雙字節字符:[^\x00-\xff] (包括漢字在內,可以用來計算字符串的長度(一個雙字節字符長度計2,ASCII字符計1))
- 空白行的正則表達式:\n\s*\r (可以用來刪除空白行)
- HTML標記的正則表達式:<(\S*?)[^>]*>.*?|<.*? /> ( 首尾空白字符的正則表達式:^\s*|\s*$或(^\s*)|(\s*$) (可以用來刪除行首行尾的空白字符(包括空格、制表符、換頁符等等),非常有用的表達式)
- 騰訊QQ號:[1-9][0-9]{4,} (騰訊QQ號從10000開始)
- 中國郵政編碼:[1-9]\d{5}(?!\d) (中國郵政編碼為6位數字)
- IP地址:((?:(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d)\\.){3}(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d))
正則表達式簡單用法及常用正則表達式