JS: RegExp（正則表示式）

阿新 • • 發佈：2018-12-29

RegExp語法（包含ES2018標準）

注意：本次所有程式碼都僅在Chrome 70中進行測試

正則表示式是什麼？

正則表示式是用於匹配字串中字元組合的模式。（mdn）

簡單來說，正則表示式是用來提取、捕獲文字（匹配字元）的。

建立：

字面量：let regex = / pattern / flags
```
let regex1 = /foo/i;
```

建構函式：let regex = new RegExp(pattern, falgs);

let regex2 = new RegExp('bar', ig); // ES5
let regex3 = new RegExp(/bat/im); // ES5
let regex4 = new RegExp(/cat/ig, 'g'); // ES6
/* regex4 建立方法在ES5中會丟擲TypeError,因為第一個引數已經是一個正則表示式，而ES5不允許此時再使用第二個引數新增修飾符。ES6則允許這種寫法，但第二個引數會作為修飾符覆蓋第一個引數中的修飾符。*/
console.log(regex4); // /cat/g

例項屬性：

每個正則表示式例項都擁有下面的屬性，以便獲取例項模式的資訊。
- global：布林值，表示是否設定了 g（全域性匹配）標誌。
- ignoreCase：布林值，表示是否設定了 i（忽略大小寫）標誌。
- multiline：布林值，表示是否設定了 m（多行）標誌。
- unicode：布林值，表示是否設定了 u（識別 unicode 字元中大於\uFFFF的 unicode 字元）標誌。
- sticky：布林值，表示是否設定了 y（粘連）標誌。
- lastIndex：上次成功匹配後的索引位置，會成為下次匹配的開始索引位置，只在全域性匹配或粘滯匹配模式下可用。
- source：正則表示式中pattern
  
  （模式）的字串表示，與呼叫toString()或者valueOf()方法得到的結果並不一樣。
- flags：返回正則表示式中flags（修飾符）的字串表示。
- dotAll：返回一個布林值，表示是否設定了 s（dotAll）標誌。
```
let str2 = 'batfoocat';
let pattern2 = /at/g;

pattern2.global;  // true
pattern2.sticky;  // false
pattern2.source; // at
pattern2.flags; // g
pattern2.toString(); // /at/g
pattern2.valueOf(); // /at/g
pattern2.lastIndex; // 0

let matches = pattern2.exec(str2); // 第一次
matches[0]; // at
matches.index; // 1
pattern2.lastIndex; // 3

matches = pattern2.exec(str2); // 第二次
matches[0]; // at
matches.index; // 7
pattern2.lastIndex; // 9

/*第三次會出現報錯，是因為已經沒有匹配項了，exec()方法返回了null，再執行第四次就會返回第一次匹配的結果，即重新開始匹配*/
matches = pattern2.exec(str2); // 第三次
matches[0]; // error
matches.index); // error
pattern2.lastIndex; // 0 
```
  補充：已經廢棄的屬性（https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Reference/Deprecated_and_obsolete_features）
  
  這些廢棄的特性仍然可以使用,但你要保持謹慎,因為它們很可能會在未來的某個時候被刪除.（mdn）
方法：
- exec：在指定字串中進行匹配字元，每次只會返回一個匹配項的資訊。
  
  匹配成功，則返回一個數組，並更新正則表示式例項的屬性，否則返回 null。
  
  返回的陣列是 Arrary 例項，但包含了兩個屬性：index（匹配項在字串中的位置）和 input（正則表示式進行匹配的字串），陣列第一項（下標0）存放匹配到的文字。
  
  注意：如果使用了全域性匹配（g）,再次使用exec()方法會返回第二個匹配項的資訊，否則無論使用多少次exec()方法都只會返回第一個匹配項資訊。
  
  補充：ES2018在返回陣列中新增了一個屬性groups（命名捕獲組的資訊）
```
let str1 = 'batfoocat';
let pattern1 = /at/g;
pattern1.exec(str1); // 第一次
// ["at", index: 1, input: "batfoocat", groups: undefined]
pattern1.exec(str1); // 第二次
// ["at", index: 7, input: "batfoocat", groups: undefined]
pattern1.exec(str1); // 第三次
// null
// 第四次會重新開始匹配，即返回第一次匹配的結果
```
- test()：測試當前正則表示式是否能匹配目標字串，返回布林值。
```
let str3 = 'batfoocat';
let str4 = 'abcde';
let pattern3 = /at/g;
pattern3.test(str3); // true
pattern3.test(str4); // false
```
- String.prototype.search()：檢索與正則表示式相匹配的子字串，匹配成功返回第一個匹配項在字串中的下標，否則返回-1。
```
let str5 = 'abcdea';
str5.search(/a/g); // 0
str5.search(/f/g); // -1
```
- String.prototype.match()：檢索與正則表示式相匹配的子字串，匹配成功返回一個存放所有匹配項的陣列，否則返回null，如果正則表示式中沒有標誌 g（全域性標誌），那麼match()方法就只能執行一次匹配。
  
  注意：在全域性檢索模式下，match() 即不提供與子表示式匹配的文字的資訊，也不宣告每個匹配子串的位置。如果需要這些全域性檢索的資訊，可以使用RegExp.exec()。
```
let str6 = 'abcdea';
str6.match(/a/g);
// ["a", "a"]
str6.match(/a/);
// ["a", index: 0, input: "abcdea", groups: undefined]
str6.match(/f/g);
// null
```
- String.prototype.replace(regexp, replacement)：替換一個與正則表示式匹配的子串。
```
let str7 = 'batfoocat';
let a = str7.replace(/at/g, 'oo');
// "boofoocoo"

let b = str7.replace(/at/, 'oo');
// "boofoocat"

let c = str7.replace(/at/g, (value)=> {
    return  '!' + value;
});
// "b!atfooc!at"
```
- String.prototype.split(separator [, howmany])：把一個字串分割成字串陣列，第二個引數為可選，該引數可指定返回的陣列的長度，不填則返回所有。
```
let str8 = 'batfoocat';
let a = str8.split(/at/g); // ["b", "fooc", ""]
let b = str8.split(/at/); // ["b", "fooc", ""]
let c = str8.split(/at/, 2); // ["b", "fooc"]
```

修飾符（標誌 - flags）：

g：全域性匹配，找到所有匹配，而不是在發現第一個匹配項後立即停止。

let str9 = 'batfoocat';
str9.match(/at/);
// ["at", index: 1, input: "batfoocat", groups: undefined]
str9.match(/at/g);
// ["at", "at"]

i：忽略大小寫。

let str10 = 'AabbccDD';
str10.match(/a/gi); // ["A", "a"]
str10.match(/a/g); // ["a"]
str10.match(/A/g); // ["A"]

m：執行多行匹配，和^和$搭配起來使用。

多行; 將開始和結束字元（^和$）視為在多行上工作（也就是，分別匹配每一行的開始和結束（由 \n 或 \r 分割），而不只是只匹配整個輸入字串的最開始和最末尾處。（mdn）

`
abc
def
`.match(/def/);
// ["def", index: 5, input: "↵abc↵def↵", groups: undefined]

`
abc
def
`.match(/def/m);
// ["def", index: 5, input: "↵abc↵def↵", groups: undefined]

`
abc
def
`.match(/^def$/);
// null

`
abc
def
`.match(/^defc$/m);
// ["def", index: 5, input: "↵abc↵def↵", groups: undefined]

u：Unicode 模式，可以正確處理碼點大於\uFFFF的 Unicode 字元。
```
/\u{20BB7}/.test('   
 
 
```

 
 
              
           
              
              
            
            相關推薦
			   
            
            
            
 

    

    
    JS: RegExp（正則表示式）
      RegExp語法（包含ES2018標準）
注意：本次所有程式碼都僅在Chrome 70中進行測試

正則表示式是什麼？

正則表示式是用於匹配字串中字元組合的模式。（mdn）

簡單來說，正則表示式是用來提取、捕獲文字（匹配字元）的。
建立：

字面量：let regex = / pattern / flag 

  
 

    

    
    驗證URL連結和IP有效性的JS程式碼（正則表示式）
       
 
 #js驗證一個URl字串是否有效 
 function isValidURL(url){
    var urlRegExp=/^((https|http|ftp|rtsp|mms)?:\/\/)+[A-Za-z0-9]+\.[A-Za-z0-9]+[\/=\?%\-&_~`@[\]\':+ 

  
 

    

    
    從零開始的全棧工程師——js篇（正則表示式）
      正則 就是一條規則 用來檢驗字串的格式 目標就是字串 
只要是通過表單提交的資料 都是字串1.正則定義var reg = new RegExp( )var reg = /格式/ <--簡寫 
  
2.正則的方法兩大功能：一個是匹配 匹配成功就是true 第二個是捕獲 如果有就拿出來test( 

  
 

    

    
    JS高階（正則表示式）
      
                本文參考自: 原文地址 
 正則表示式
 第1章 什麼是正則表示式
 1.1 概述
 <body>
    <img src="1.png" alt="">
</body>
<script>
    var img = docu 

  
 

    

    
    js實驗-表單驗證（正則表示式）
       
 
 
  
 <!DOCTYPE html>
<html lang="en">
<head>
    <title>Document</title>
</head>
<script src="./1.js"></s 

  
 

    

    
    js筆記（正則表示式續）
      
                //\b 單詞邊界
//\B 非單詞邊界
例5：
    var reg = /\bcde\B/g;
    str = "abc cdefgh";
//str.match(reg)  返回結果為"cde"

//\t匹配的不是視覺上的縮排，而是內容上的\t
同理：\n 也是 

  
 

    

    
    Python爬蟲（正則表示式）
       
 
  
  
 Python爬蟲（正則表示式） 
 最近接觸爬蟲比較多，下面我來展示一個剛爬取的成果，使用正則表示式的方法，希望對剛開始接觸爬蟲的小夥伴有所幫助，同時希望大佬們給予點評和指導 
 接下來，步入正題，使用正則表示式爬取資料是一種原始且有效的方法，正則表示式的作用即字元匹配，匹配出你想得到的 

  
 

    

    
    （轉）應該是目前最詳細的（正則表示式）語音視訊講解教程
       
  
  
 （轉）應該是目前最詳細的（正則表示式）語音視訊講解教程 優酷線上地址： 
 http://v.youku.com/v_show/id_XMzg2ODE4MTQ5Mg==.html?x&sharefrom=android&sharekey=a9c982b1c99597d3e1b 

  
 

    

    
    【知識積累】（二）、深入Regex（正則表示式）
       
 
 \：將下一個字元標記符、或一個向後引用、或一個八進位制轉義符。例如，“\\n”匹配\n。“\n”匹配換行符。序列“\\”匹配“\”而“\(”則匹配“(”。即相當於多種程式語言中都有的“轉義字元”的概念。
 ^：匹配輸入字串的開始位置。如果設定了RegExp物件的Multiline屬性，^也匹配“\n 

  
 

    

    
    【知識積累】（一）、瞭解Regex（正則表示式）
       
 
 
 一、正則表示式簡介
 一種可以用於模式匹配和替換的規範，由普通字元 + 特殊字元構成一個模板，用於對目標字串進行匹配、查詢、替換、判斷。
 原始碼：JDK1.4中的java.util.regex下的Pattern和Matcher類。
 二、常用語法
 1、字元取值範圍
 [abc]：表示可能是a 

  
 

    

    
    Python：re模組（正則表示式）
       
 
 #!/usr/bin/env python
# coding:UTF-8


"""
@version: python3.x
@author:曹新健
@contact: [email protected]
@software: PyCharm
@file: re模組簡介.py
@time: 

  
 

    

    
    python之re模組（正則表示式）常用函式
       
 
 1、compile() 
 編譯正則表示式模式，返回一個物件的模式。（可以把那些常用的正則表示式編譯成正則表示式物件，這樣可以提高一點效率。） 
 格式： 
 re.compile(pattern,flags=0) 
 pattern: 編譯時用的表示式字串。 
 flags 編譯標誌位，用於修改正 

  
 

    

    
    少說話多寫程式碼之Python學習064——標準模組（正則表示式）
       
 
 
 Python中re模組包含的是對正則表示式的支援。正則表示式是一個很有趣，對處理字串作用比較大，我們可以花一點時間瞭解一下。 正則表示式是可以匹配文字片段的一組規則。最簡單的正則表示式就是一個字串，能匹配自身。比如字串a='迢遞嵩高下，歸來且閉關'，可以匹配字串b='迢遞嵩高下，歸來且閉關'。  

  
 

    

    
    python re庫（正則表示式）入門
       
 
 正則表示式（英文名稱：regular expression，regex，RE）是用來簡潔表達一組字串特徵的表示式。最主要應用在字串匹配中。 
  
  
 \d 數字：[0-9] \D 非數字： [^0-9] \s 空白字元：[ \t\n\x0B\f\r] \S 非空白字元：[^\s] \w 單詞字 

  
 

    

    
    shell之文字過濾（正則表示式）
      
                
當從一個檔案或命令輸出中抽取或過濾文字時，可以使用正則表示式（R E） ，正則表示式是一些特殊或不很特殊的字串模式的集合。

^ 只只匹配行首
$ 只只匹配行尾
* 只一個單字元後緊跟*，匹配0個或多個此單字元
[ ] 只匹配[ ] 內字元。可以是一個單字元，也可以是字元序 

  
 

    

    
    shell指令碼學習筆記 （正則表示式）
      
								
								            
						
                
         正則表示式一般有三個部分組成，他們分別是：字元類，數量限定符，位置限定符。規定一些特殊語法表示字元類、數
量限定符和位置關係,然後用這些特殊語法和普通字元一起表示一個模式,這就是正則 

  
 

    

    
    Java簡單註冊格式驗證（正則表示式）
      
							
							
							一、用正則表示式寫的簡單的註冊驗證，具體要求如下：

使用者註冊驗證（使用者名稱，密碼，暱稱，中文名字，手機號，郵箱）所有資訊符合以下條件才允許註冊：

1.使用者名稱格式：由字母數字下劃線組成且開頭必須是字母，不能超過16位；

2.密碼格式：字母和數字構成， 

  
 

    

    
    JavaScript驗證手機號是否正確（正則表示式）
      
								
								            
							
							
							為了在使用者輸入時驗證手機號格式是否輸入正確的JS函式如下：

function validatemobile(newname) {
    if (newname.length == 0) {
    

  
 

    

    
    表單驗證（正則表示式）
      
                
表單驗證是為了使用者友好提示而設計的，當用戶填寫如身份證、IP、日期、電話等如果輸入錯誤的則會提示。
不多說看程式碼：
public static class ValidationStrUtil

{

//驗證電話號碼

public static bool isTele 

  
 

    

    
    java 技巧  去除字串中的空格、回車、換行符、製表符（正則表示式）
      
                
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class StringUtils {

    public static String replaceBlank(String

JS: RegExp（正則表示式）

RegExp語法（包含ES2018標準）

JS: RegExp（正則表示式）

驗證URL連結和IP有效性的JS程式碼（正則表示式）

從零開始的全棧工程師——js篇（正則表示式）

JS高階（正則表示式）

js實驗-表單驗證（正則表示式）

js筆記（正則表示式續）

Python爬蟲（正則表示式）

（轉）應該是目前最詳細的（正則表示式）語音視訊講解教程

【知識積累】（二）、深入Regex（正則表示式）

【知識積累】（一）、瞭解Regex（正則表示式）

Python：re模組（正則表示式）

python之re模組（正則表示式）常用函式

少說話多寫程式碼之Python學習064——標準模組（正則表示式）

python re庫（正則表示式）入門

shell之文字過濾（正則表示式）

shell指令碼學習筆記（正則表示式）

Java簡單註冊格式驗證（正則表示式）

JavaScript驗證手機號是否正確（正則表示式）

表單驗證（正則表示式）

java 技巧去除字串中的空格、回車、換行符、製表符（正則表示式）