1. 程式人生 > 程式設計 >Java正則表示式Pattern和Matcher原理詳解

Java正則表示式Pattern和Matcher原理詳解

這篇文章主要介紹了Java正則表示式Pattern和Matcher原理詳解,文中通過示例程式碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

基本使用

Scanner中的使用正則表示式

//Scanner 支援的分組
    Scanner cin=new Scanner("red a bbc").useDelimiter("\\s*a\\s*");
    System.out.println(cin.next());
    System.out.println(cin.next());out:
redbbc

等同於下面程式碼

//等於 正則
Scanner cin2=new Scanner("red a bbc");
cin2.findInLine("\\s*"); // findLine 允許存在多個,match()為最終需要匹配的字串
MatchResult result = cin2.match();
for (int i = 0; i < result.groupCount(); i++) {
  System.out.println(result.group(i));
}

Pattern:

 //基本匹配
    boolean b = Pattern.matches("a*b","aaaab");
    System.out.println(b);

String的aplit的實現

//按照數字分割
    Pattern p=Pattern.compile("\\d+");
    String[] str=p.split("好456456像:0532214是");
    for (int i = 0; i < str.length; i++) {
      System.out.println(str[i]);

    }

一般使用Pattern.matches(String regex,CharSequence input)是一個靜態方法,用於快速匹配字串,該方法適合用於只匹配一次,且匹配全部字串.

Java程式碼示例:

Pattern.matches("\\d+","2223");//返回true 
Pattern.matches("\\d+","2223aa");//返回false,需要匹配到所有字串才能返回true,這裡aa不能匹配到 
Pattern.matches("\\d+","22bb23");//返回false,這裡bb不能匹配到 Pattern p=Pattern.compile("\\d+"); Matcher m=p.matcher("22bb23"); m.pattern();//返回p 也就是返回該Matcher物件是由哪個Pattern物件的建立的

重點:

matches 方法嘗試將整個輸入序列與該模式匹配。

lookingAt 嘗試將輸入序列從頭開始與該模式匹配。

find 方法掃描輸入序列以查詢與該模式匹配的下一個子序列。

// matches()對整個字串進行匹配,只有整個字串都匹配了才返回true
    Pattern p=Pattern.compile("\\d+");
    Matcher m=p.matcher("22bb23");
    m.matches();//返回false,因為bb不能被\d+匹配,導致整個字串匹配未成功.
    Matcher m2=p.matcher("2223");
    m2.matches();//返回true,因為\d+匹配到了整個字串

    // lookingAt()對前面的字串進行匹配,只有匹配到的字串在最前面才返回true
    Pattern p1=Pattern.compile("\\d+");
    Matcher m3=p1.matcher("22bb23");
    m.lookingAt();//返回true,因為\d+匹配到了前面的22
    Matcher m4=p1.matcher("aa2223");
    m2.lookingAt();//返回false,因為\d+不能匹配前面的aa

    // find()對字串進行匹配,匹配到的字串可以在任何位置.
    Pattern p2=Pattern.compile("\\d+");
    Matcher m5=p2.matcher("22bb23");
    m.find();//返回true
    Matcher m6=p2.matcher("aa2223");
    m2.find();//返回true
    Matcher m7=p2.matcher("aa2223bb");
    m3.find();//返回true
    Matcher m8=p2.matcher("aabb");
    m4.find();//返回false

Mathcer.start()/ Matcher.end()/ Matcher.group()

當使用matches(),lookingAt(),find()執行匹配操作後,就可以利用以上三個方法得到更詳細的資訊.

  • start()返回匹配到的子字串在字串中的索引位置.
  • end()返回匹配到的子字串的最後一個字元在字串中的索引位置. 即為最後位置加一
  • group()返回匹配到的子字串

Java程式碼示例:

Pattern p=Pattern.compile("\\d+"); 
Matcher m=p.matcher("aaa2223bb"); 
m.find();//匹配2223 
m.start();//返回3 
m.end();//返回7,返回的是2223後的索引號 
m.group();//返回2223 

Mathcer m2=p.matcher("2223bb"); 
m2.lookingAt();  //匹配2223 
m2.start();  //返回0,由於lookingAt()只能匹配前面的字串,所以當使用lookingAt()匹配時,start()方法總是返回0 
m2.end();  //返回4 
m2.group();  //返回2223 

Matcher m3=p.matcher("2223"); //如果Matcher m3=p.matcher("2223bb"); 那麼下面的方法出錯,因為不匹配返回false
m3.matches();  //匹配整個字串 
m3.start();  //返回0
m3.end();  //返回3,原因相信大家也清楚了,因為matches()需要匹配所有字串 
m3.group();  //返回2223

說了這麼多,相信大家都明白了以上幾個方法的使用,該說說正則表示式的分組在java中是怎麼使用的.

start(),end(),group()均有一個過載方法它們是start(int i),end(int i),group(int i)專用於分組操作,Mathcer類還有一個groupCount()用於返回有多少組.

Java程式碼示例:

Pattern p=Pattern.compile("([a-z]+)(\\d+)"); 
Matcher m=p.matcher("aaa2223bb"); 
m.find();  //匹配aaa2223 
m.groupCount();  //返回2,因為有2組 
m.start(1);  //返回0 返回第一組匹配到的子字串在字串中的索引號 
m.start(2);  //返回3 
m.end(1);  //返回3 返回第一組匹配到的子字串的最後一個字元在字串中的索引位置. 
m.end(2);  //返回7 
m.group(1);  //返回aaa,返回第一組匹配到的子字串 
m.group(2);  //返回2223,返回第二組匹配到的子字串

驗證手機號

// 驗證手機號
    Pattern compile = Pattern.compile("^[1][3,4,5,7,8][0-9]{9}$");
    Matcher matcher1 = compile.matcher("15071089603");
    while(matcher1.find()){
      System.out.println(matcher1.group());
    }

/**
   * 驗證手機號碼
   *
   * 移動號碼段:139、138、137、136、135、134、150、151、152、157、158、159、182、183、187、188、147、182
   * 聯通號碼段:130、131、132、136、185、186、145
   * 電訊號碼段:133、153、180、189、177
   *
   */
 String regex = "^((13[0-9])|(14[5|7])|(15([0-3]|[5-9]))|(18[0,1,2,5-9])|(177))\\d{8}$";

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支援我們。