詳解正則表示式中的\B和\b

阿新 • • 發佈：2019-02-20

對於正則表示式的中\B和\b 有些地方會出現弄不懂的情況

或許你看了下面這篇部落格你就能夠對\B和\b認識加深了

根據檢視API可以知道 \B和\b都是邊界匹配符

這裡寫圖片描述

先說說\b這個單詞邊界吧！竟然想了解首先必須清楚什麼叫單詞邊界！我們可以以\b為分割來探究一下

單詞邊界

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class matcher1 {
    public static void main(String[] args) {
      String str="(中文問號？123???英文)問號?我是華麗[的製表符\t]我是華麗{的空格符 我是華麗}的換行符\n" 
;
      String rex="\\b";

      Pattern pattern=Pattern.compile(rex);
      Matcher matcher=pattern.matcher(str);

      String [] result=pattern.split(str); 

      for(String string:result){
          System.out.println("分割的字串:"+"["+string+"]");
      }
    }
}

執行結果

分割的字串:[(]
分割的字串:[中文問號]
分割的字串:[？]
分割的字串:[123 
]
分割的字串:[???]
分割的字串:[英文]
分割的字串:[)]
分割的字串:[問號]
分割的字串:[?]
分割的字串:[我是華麗]
分割的字串:[[]
分割的字串:[的製表符]
分割的字串:[    ]]
分割的字串:[我是華麗]
分割的字串:[{]
分割的字串:[的空格符]
分割的字串:[ ]
分割的字串:[我是華麗]
分割的字串:[}]
分割的字串:[的換行符]
分割的字串:[
]

從這些分割的字串中我們可以知道單詞邊界就是單詞和符號之間的邊界

這裡的單詞可以是中文字元,英文字元,數字；符號可以是中文符號,英文符號,空格,製表符,換行

下面我們看一個例子

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public 
 class matcher1 {
    public static void main(String[] args) {
      String str=" 2 ";
      String rex="\\b2\\b";

      Pattern pattern=Pattern.compile(rex);
      Matcher matcher=pattern.matcher(str);

      if(matcher.matches()){
          System.out.println("匹配成功");
      }else{
          System.out.println("匹配不成功");
      }
    }
}

在沒有看上面分割的例子前估計很多人包括我都會認為這執行的結果是匹配成功

經過分割的例子後就知道了空格並不是邊界空格與數字2之間的那個才叫邊界所以執行結果不言而喻肯定是匹配不成功

當如果你這樣寫就執行出來就是匹配成功

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class matcher1 {
    public static void main(String[] args) {
      String str="2";
      String rex="\\b2\\b";

      Pattern pattern=Pattern.compile(rex);
      Matcher matcher=pattern.matcher(str);

      if(matcher.matches()){
          System.out.println("匹配成功");
      }else{
          System.out.println("匹配不成功");
      }
    }
}

\b的用法

一般來說\b不用來判斷當前字串是否符合某種規則

一般我們都用\b來進行獲取

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class matcher1 {
    public static void main(String[] args) {
      String str=",,,,呵呵,,,,";
      String rex="\\b呵呵\\b";

      Pattern pattern=Pattern.compile(rex);
      Matcher matcher=pattern.matcher(str);

      if(matcher.find()){
          System.out.println(matcher.group());
      }
    }
}

執行結果

呵呵

\B的用法

瞭解了\b的用法我們再來說說\B \B是非單詞邊界

也就說\B=[^\b]//符號^是非的意思

\b是單詞與符號的邊界那非單詞與符號的邊界的其它都是\B

所以我們的猜想\B是符號與符號,單詞與單詞的邊界

當然猜想需要認證！下面我們寫一個例子來證明一個！

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class matcher1 {
    public static void main(String[] args) {
      String str="123456我是JAVA{，、；‘asd";
      String rex="\\B";

      Pattern pattern=Pattern.compile(rex);
      Matcher matcher=pattern.matcher(str);

      String [] result=pattern.split(str);

      for(String string:result){
          System.out.println("分割的字串:"+string);
      }
    }
}

執行結果

分割的字串:1
分割的字串:2
分割的字串:3
分割的字串:4
分割的字串:5
分割的字串:6
分割的字串:我
分割的字串:是
分割的字串:J
分割的字串:A
分割的字串:V
分割的字串:A{      //單詞與符號之間的邊界不算\B的邊界
分割的字串:，
分割的字串:、
分割的字串:；
分割的字串:‘a
分割的字串:s
分割的字串:d

事實證明\B作為非單詞邊界確實是單詞與單詞,符號與符號之間的邊界

\B一般也是用來獲取字串的

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class matcher1 {
    public static void main(String[] args) {
      String str=",,,,,和呵呵,,,,,";
      String rex="\\B呵\\B";

      Pattern pattern=Pattern.compile(rex);
      Matcher matcher=pattern.matcher(str);

      if(matcher.find()){
          System.out.println(matcher.group());
      }

    }
}

因為字元與字元之間的邊界

所以執行的結果是

呵

END！！！！！！！！！！！！！！！

詳解正則表示式中的\B和\b

對於正則表示式的中\B和\b 有些地方會出現弄不懂的情況或許你看了下面這篇部落格你就能夠對\B和\b認識加深了根據檢視API可以知道 \B和\b都是邊界匹配符先說說\b這個單詞邊界吧！竟然想了解首先必須清楚什麼叫單詞邊界！我們可以以\b為分

詳解正則表示式實現二代身份證號碼驗證

最近專案需要對身份證進行比較合理的篩選,並不想用到第三方介面,所以寫了個方法: 包括支援身份證號合法性驗證, 支援18位身份證號,支援地址編碼、出生日期、校驗位驗證. 基本上這樣就可以了. IdCodeValid:function(code){ //身份證號合法性驗證 //支援15位和18位

關於java正則表示式中的 ^和$的使用

java正則表示式的邊界匹配符中，有兩個比較常用的字元：“ ^ ”和“ $ ”,這兩個字元理解起來比較容易混淆。先說下這兩個字元的含義： “ ^ ”：匹配輸入字串開始的位置。如果設定了 RegExp 物件的 Multiline 屬性，^ 還會與”\n”或”\r

正則表示式中group和groups的區別

第一點，搞清楚它們用在什麼地方？正則表示式中，group（）用來提取分組截獲的字串，（）用來分組。組是通過 "(" 和 ")" 元字元來標識的。 "(" 和 ")" 有很多在數學表示式中相同的意思；它們一起把在它們裡面的表示式組成一組。舉個例子，你可以用重複限制符

Sed 命令詳解 & 正則表示式

1.簡介 sed是非互動式的編輯器。它不會修改檔案，除非使用shell重定向來儲存結果。預設情況下，所有的輸出行都被列印到螢幕上。 sed編輯器逐行處理檔案（或輸入），並將結果傳送到螢幕。具體過程如下：首先sed把當前正在處理的行儲存在一個臨時快取區中（也稱為模式空間

Java學習筆記之Pattern類的用法詳解 (正則表示式)

Implements: Serializable 正則表示式的編譯表示形式。指定為字串的正則表示式必須首先被編譯為此類的例項。然後，可將得到的模式用於建立 Matcher 物件，依照正則表示式，該物件可以與任意字元序列匹配。執行匹配所涉及的所有狀態都駐留在匹配器中，

正則表示式中Pattern類、Matcher類和matches()方法簡析

1.簡介： java.util.regex是一個用正則表示式所訂製的模式來對字串進行匹配工作的類庫包。它包括兩個類：Pattern和Matcher 。 Pattern：一個Pattern是一個正則表示式經編譯後的表現模式。 Matcher：一個Matcher物件

Word中使用正則表示式進行查詢和替換（高效進行文書處理）

術語開始前，我們先定義一對術語：萬用字元指的是您可以用來代表一個或多個字元的鍵盤字元。例如，星號 (*) 通常代表一個或多個字元，問號 (?) 通常代表單個字元。對我們來說，正則表示式指的是您可以用來查詢和替換文字模式的文字字元和萬用字元組合。文字字元指的是必須存在於目標文

正則表示式中的貪婪模式和懶惰模式

1，需求：從這段字串的匹配出<h3></h3>中的內容 <h3>abd</h3><h3>bcd</h3><h3>dfsd</h3> 我們可以寫這兩種正則表示式來實現 1，<h3>.{0,}<

Python正則表示式中的貪心模式和非貪心模式

宣告：最近發現有人利用我在百度雲盤裡免費分享的127課Python視訊盈利，並聲稱獲得我的授權。

正則表示式中^/$和i、m、g的使用

正則表示式中\b跟\s的或運算

正則表示式： \s 匹配空格； \b 匹配邊界包括空格、回車、字串開頭跟結尾（但不包括空格、回車）。不多說上圖。第一張：匹配 \s|\b 第二張：匹配 \b|\s 第三張：匹配 \s 第四張：匹配 \b 先看第一張跟第二張，

［深坑］關於groovy正則表示式中的限位符 `^` 和 `$`

問題提出最近在工作中需要自己寫正則表示式，而且是用 groovy，本以為 groovy 是沿用了 java.util.regex 包，只要 java 中執行沒問題就可以，結果問題就出現了。 java 中程式如下： import java.util.r

【轉載】詳解 $_SERVER 函數中QUERY_STRING和REQUEST_URI區別

host dex 執行 sel 實例 server 文件 uri cal 實例：1，http://localhost/aaa/ (打開aaa中的index.php)結果：$_SERVER[‘QUERY_STRING‘] = "";$_SERVER[‘REQUEST_URI‘

js正則表示式中關於零寬斷言的奇異現象

碰到一個特別的需求，就是有一段Sql Server 的 SQL片段，內容大概就是所有JOIN表的集合，要求把這個SQL片段分割成陣列，每個元素就是包含單個表的字串。例如： SQL = INNER JOIN Sale b ON 1=1 LEFT JOIN OutStock c

JAVA正則表示式區分IPv4和IPv6地址

PS*程式碼直接見第二部分：一、進入正題前先說說JAVA正則表示式相關概念： 1、常用字元類： [abc] == a||b||c [a-zA-Z] == 所有大小寫字母中的任意一個 [0-9A-Za-z] == 任意

正則表示式（Pattern和Matcher類）

正則表示式: 概念：正確規則的表示式規則java給我們定的，是指一個用來描述或者匹配一系列符合某個句法規則的字串的單個字串。其實就是一種規則。有自己特殊的應用。正則表示式的組成規則規則字元在java.util.regex Pattern類中 A:字元 x 字元 x。舉例：‘

Python學習筆記模式匹配與正則表示式之使用和不使用正則表示式

隨筆記錄方便自己和同路人查閱。 #------------------------------------------------我是可恥的分割線------------------------------------------- 　　假設你希望在字串中查詢電話號碼。你知道模式：3個數字，一

正則表示式的學習和練習

正則表示式通常被用來檢索、替換那些符合某個模式(規則)的文字。是用正則表示式來完成郵箱，賬號的驗證可以省去繁雜的邏輯，用更少的程式碼完成更復雜的事務。通過學習我大致把當前學習的常見的字元分為四種： 1，預定義字元類 .：任何字元 \d ：數字[0-9]

php 正則表示式中的 .*? 表示什麼意思

我們知道我 .* 是任意字元，有的時候比較困惑在加個?什麼意思。 ?是非貪婪模式.*會匹配後面的一切字元，就是到結束的意思加？後就是不貪婪模式，這時要看？後邊的字元是什麼了，如.*?"的意思是遇到雙引號則匹配結束例如：現在我要匹配出圖片中的src，圖片格式為："圖片01<img src='ht

詳解正則表示式中的\B和\b

相關推薦