Java正則表示式筆記

阿新 • • 發佈：2020-07-18

正則表示式

1.概念

正則表示式，又稱規則表示式。（英語：Regular Expression，在程式碼中常簡寫為regex、regexp或RE），電腦科學的一個概念。正則表通常被用來檢索、替換那些符合某個模式(規則)的文字。

正則表示式是對字串操作的一種邏輯公式，就是用事先定義好的一些特定字元、及這些特定字元的組合，組成一個“規則字串”，這個“規則字串”用來表達對字串的一種過濾邏輯。
給定一個正則表示式和另一個字串，我們可以達到如下的目的：
- 1.給定的字串是否符合正則表示式的過濾邏輯（稱作“匹配”）；
- 2.可以通過正則表示式，從字串中獲取我們想要的特定部分。（爬蟲應用）
相關類：

java.lang.String

java.util.regex.Pattern

java.util.regex.Matcher

2.正則表示式(常見的規則)

兩個特殊的符號'^'和'$'。他們的作用是分別指出一個字串的開始和結束。例子如下：

//兩個特殊的符號'^'和'$'。他們的作用是分別指出一個字串的開始和結束
"^The"：表示所有以"The"開始的字串（"There"，"The cat"等）；
"of despair$"：表示所以以"of despair"結尾的字串；
"^abc$"：表示開始和結尾都是"abc"的字串——呵呵，只有"abc"自己了；
"notice"：表示任何包含"notice"的字串。
// * ? +來表示次數
"ab*"：表示一個字串有一個a後面跟著零個或若干個b。（"a", "ab", "abbb",……）；
"ab+"：表示一個字串有一個a後面跟著至少一個b或者更多；
"ab?"：表示一個字串有一個a後面跟著零個或者一個b；
"a?b+$"：表示在字串的末尾有零個或一個a跟著一個或幾個b。
   
// {}指定範圍
"ab{2}"：表示一個字串有一個a跟著2個b（"abb"）；
"ab{2,}"：表示一個字串有一個a跟著至少2個b；
"ab{3,5}"：表示一個字串有一個a跟著3到5個b。
 
// . 可以代替任何字元  
"a.[0-9]"：表示一個字串有一個"a"後面跟著一個任意字元和一個數字；
"^.{3}$"：表示有任意三個字元的字串（長度為3個字元）；
方括號表示某些字元允許在一個字串中的某一特定位置出現：
"[ab]"：表示一個字串有一個"a"或"b"（相當於"a¦b"）；
"[a-d]"：表示一個字串包含小寫的'a'到'd'中的一個（相當於"a¦b¦c¦d"或者"[abcd]"）；
"^[a-zA-Z]"：表示一個以字母開頭的字串；
"[0-9]%"：表示一個百分號前有一位的數字；
",[a-zA-Z0-9]$"：表示一個字串以一個逗號後面跟著一個字母或數字結束。

 可以在方括號裡用'^'表示不希望出現的字元，'^'應在方括號裡的第一位。
（如："%[^a-zA-Z]%"表示兩個百分號中不應該出現字母）。為了逐字表達，你必須在"^.$()|*+?{\"這些字元前加上轉移字元'\'。

字元類 
[abc] ----   a、b 或 c（簡單類） （某一位上只能是a,b,c）
[^abc] ----   任何字元，除了 a、b 或 c（否定） 
[a-zA-Z] ----  a 到 z 或 A 到 Z，兩頭的字母包括在內（範圍） 
[a-d[m-p]] ----  a 到 d 或 m 到 p：[a-dm-p]（並集） 
[a-z&&[def]] ----  d、e 或 f（交集） 
[a-z&&[^bc]] ----  a 到 z，除了 b 和 c：[ad-z]（減去） 
[a-z&&[^m-p]] ----  a 到 z，而非 m 到 p：[a-lq-z]（減去） 

預定義字元類 
.   ----  任何字元（與行結束符可能匹配也可能不匹配） 
\d  ----  數字：[0-9] 
\D  ----  非數字： [^0-9] 
\s  ----  空白字元：[ \t\n\x0B\f\r] 
\S  ----  非空白字元：[^\s] 
\w  ----  單詞字元：[a-zA-Z_0-9] 
\W  ----  非單詞字元：[^\w] 

邊界匹配器 
^  ---- 行的開頭    
$  ---- 行的結尾       
\b  ---- 單詞邊界      

\B  ---- 非單詞邊界 
\A ---- 輸入的開頭 
\G ---- 上一個匹配的結尾 
\Z ---- 輸入的結尾，僅用於最後的結束符（如果有的話） 
\z ---- 輸入的結尾 

Greedy 數量詞 
X?  ---- X，一次或一次也沒有   （舉例演示）
X*  ---- X，零次或多次 
X+  ---- X，一次或多次 
X{n} ---- X，恰好 n 次 
X{n,} ---- X，至少 n 次 
X{n,m} ---- X，至少 n 次，但是不超過 m 次

3.常用操作

//1、匹配其實使用的就是String類中的matches()方法
"15115282455".matches("1[3-9]\\d{9}")
//2、切割其實使用的就是String類中的split()方法
System.out.println(Arrays.toString("lzp.is.666".split("\\.")));
System.out.println(Arrays.toString("lzp  is 666".split(" +")));
System.out.println(Arrays.toString("zhangsantttxiaowangqqqlaowangzzz".split("(.)\\1+")));    //[zhangsan, xiaowang, laowang] 重複字元出現多個時分為一組看次數來分割
//3、替換其實使用的就是String類中的replaceAll()方法
System.out.println("zhangsantttxiaowangqqqlaowangzzz".replaceAll("(.)\\1+","$1")); //zhangsantxiaowangqlaowangz  將字串中重複的多個字元用一個字元替換

4.案例

4.1匹配手機號

String regex = "1[3-9][0-9]{9}";
String regex = "1[3-9]\\d{9}";
System.out.println("15115282455".matches(regex));

4.2匹配三個字母組成的單詞

public static void main(String[] args) throws IOException {
    //獲取三個字母組成的單詞
    String str = "da jia hao,ming tian bu fang jia";
    //String regex = "[a-z]{3}";
    String regex = "\\b[a-z]{3}\\b";//  單詞邊界 \\b

    //1、將正則規則進行物件的封裝
    Pattern p = Pattern.compile(regex);
    //2、通過正則物件獲取匹配器物件
    Matcher m = p.matcher(str);
    //3、使用Matcher物件的方法對字串進行操作。
    // 既然要獲取三個字母組成的單詞
    // 查詢find();
    //    	m.find();
    //    	System.err.println(m.group());//獲取匹配的子序列
    System.out.println(str);
    while(m.find()){
        System.out.println(m.group());//獲取匹配的子序列
        System.out.println(m.start()+" : "+m.end());
    }
}

4.3匹配必須包含字母、數字

username.matches("[^a-z]+|[^A-Z]+|[^0-9]+")   //如果不包含大寫、小寫、數字中的任何一個則為true

4.4匹配身份證（自制）

idCard.matches("\\d{6}\\d{4}(([0][1-9])|([1][0-2]))(([0][1-9])|([1][0-9])|([2][0-9])|([3][0-1]))[0-9]{3}[xX0-9]")   //沒考慮閏年和年份

Java正則表示式筆記

正則表示式 1.概念正則表示式，又稱規則表示式。（英語：Regular Expression，在程式碼中常簡寫為regex、regexp或RE），電腦科學的一個概念。正則表通常被用來檢索、替換那些符合某個模式(規則)的文字。

[學習筆記] Java正則表示式

正則表示式正則表示式定義了字串的模式，可以用於搜尋、編輯或處理文字；

Java正則表示式Pattern和Matcher原理詳解

這篇文章主要介紹了Java正則表示式Pattern和Matcher原理詳解,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

JAVA 正則表示式陳廣佳版本(超詳細)

在Sun的Java JDK 1.40版本中，Java自帶了支援正則表示式的包，本文就拋磚引玉地介紹瞭如何使用java.util.regex包。

Java正則表示式匹配的坑

今天在判斷字串是否存在某個字串，直接用String.matches(regex)，死活匹配不出來，線上正則工具用了很多都是可以的，後面找到問題，總結一下，防止再次踩坑。

Java（27）java正則表示式

java正則表示式正則表示式規則可以匹配 A 指定字元 A \\u548c 指定Unicode字元和 . 任意字元

Java正則表示式如何匹配特定html標籤內的內容

如題：使用正則表示式，怎麼匹配特定html標籤內的內容。比如，對於如下文字串：

java正則表示式之Pattern與Matcher類詳解

Pattern.split方法詳解 /** * 測試Pattern.split方法 */ @Test public void testPatternSplit() { String str = \"{0x40,0x11,0x00,0x00}\";

Java正則表示式的替換和分組功能

前言這篇來學習正則表示式的替換和分組功能，替換很好理解，分組有點複雜，特別是如何寫有效的分組的正則表示式。這篇通過幾個練習，簡單瞭解下替換和分組功能。

Java正則表示式的例項操作指南

前言 Regular Expression正則表示式，簡稱RegExp，常規通用的表示式，在多個開發語言中都有它的實現，可以通過正則表示式來快速的檢索、匹配、查詢、替換字串中的文字。

ParameterUtils【java正則表示式】【多測師_王sir】

import static org.testng.Assert.assertEqualsNoOrder; import java.util.HashMap; import java.util.Map; import java.util.regex.Matcher;

【Java正則表示式 01】

一、正則表示式概述 1、正則表示式用於操作字元資料 2、通過舉例初步瞭解正則

JAVA入門教程14-Java 正則表示式

Java 正則表示式正則表示式定義了字串的模式。正則表示式可以用來搜尋、編輯或處理文字。

Java-正則表示式

　　　正則表示式（Regular Expression）又稱正規表示法，常規表示法，在程式碼中常簡寫為regex，regexp或RE，他是電腦科學的一個概念。

常用正則表示式筆記

常用正則表示式筆記常用正則表示式筆記 \\w 大小寫字母以及0-9 下劃線 \\s 匹配空格 . 除\\n 都能匹配 re.verbos 忽略正則表示式中的換行？0個或1個 *0個或多個 +一個或多個 re.dotall 表示 . 可以看作空

Java正則表示式工具方法彙總

1.獲取某字串中漢字的個數 ... private int getChineseCount(String text) { String Reg = \"^[\\u4e00-\\u9fa5]{1}$\";// 正則

Java正則表示式

如何匹配字串？如何判斷字串是否是有效的電話號碼？如何判斷字串是否是有效的電子郵件地址？

java正則表示式匹配所有數字的案例

用於匹配的正則表示式為：([1-9]\\d*\\.?\\d*)|(0\\.\\d*[1-9]) ( [1-9] ：匹配1~9的數字；

如何利用JAVA正則表示式輕鬆替換JSON中的大欄位

（一）背景在軟體開發工作中我們經常用JSON來傳輸資料，根據業務需要不免會在JSON資料中傳輸比較大的資料，有時傳輸一個圖片資料會達到幾百K或者幾M，而這些大欄位資料在記錄日誌時，不論是檔案日誌還是資料庫日誌

玩轉Java正則表示式

前言正則表示式是一種強大而靈活的文字處理工具。通過正則表示式，我們能夠以程式設計的方式，構建複雜的文字模式，對輸入的字串進行搜尋。一旦找到匹配的部分，我們就能隨心所欲的對它們進行處理。

Java正則表示式筆記

正則表示式

1.概念

2.正則表示式(常見的規則)

3.常用操作

4.案例

4.1匹配手機號

4.2匹配三個字母組成的單詞

4.3匹配必須包含字母、數字

4.4匹配身份證（自制）

相關推薦