十分鐘學會正則表示式

阿新 • • 發佈：2019-01-29

1、正則表示式

正則表示式(regular expression)描述了一種字串匹配的模式，可以用來檢查一個串是否含有某種子串、將匹配的子串做替換或者從某個串中取出符合某個條件的子串等。

模式：使用一種特殊符號來實現字串的匹配

2、建立正則物件

①隱式建立

var 正則物件 = /正則表示式/匹配模式;

②直接例項化

var 正則物件 = new RegExp(‘正則表示式’, ‘匹配模式’);

兩者之間的功能是完全一致的，都是為了獲得正則物件。但是兩者之間的區別主要在於語法的不同。

3、匹配模式

基本語法：

var reg = /正則表示式/匹配模式;

在正則表示式中，匹配模式常用的有兩種形式：

g ：global縮寫，代表全域性匹配，匹配出所有滿足條件的結果

i ：ignore縮寫，代表忽略大小寫，匹配時，會自動忽略字串的大小寫

4、與正則表示式相關的幾個方法

① RegExp類下的方法(reg.test或reg.exec)

test(str) ：判斷字串中是否具有指定模式的子串，返回結果是一個布林型別的值

exec(str) ：返回字串中指定模式的子串，一次只能獲取一個與之匹配的結果

② String類下的方法(str.方法(reg))

search(reg) ：與indexOf非常類似，返回指定模式的子串在字串首次出現的位置

match(reg) ：以陣列的形式返回指定模式的字串，可以返回所有匹配的結果

replace(reg,’替換後的字元’) ：把指定模式的子串進行替換操作

split(reg) ：以指定模式分割字串，返回結果為陣列

5.幾個重要概念

1.子表示式：在正則表示式中，通過一對圓括號括起來的內容，我們就稱之為“子表示式”。如：

var reg = /\d(\d)\d/gi;

2.捕獲：在正則表示式中，子表示式匹配到相應的內容時，系統會自動捕獲這個行為，然後將子表示式匹配到的內容放入系統的快取區中。我們把這個過程就稱之為“捕獲”。

3.反向引用：在正則表示式中，我們可以使用\n（n>0，正整數，代表系統中的緩衝區編號）來獲取緩衝區中的內容，我們把這個過程就稱之為“反向引用”。

6.編寫正則表示式三步走

1.匹配符（查什麼）

匹配符：字元匹配符用於匹配某個或某些字元

在正則表示式中，通過一對中括號括起來的內容，我們就稱之為“字元簇”。字元簇代表的是一個範圍，但是匹配時，只能匹配某個固定的結果。

[a-z] ：匹配字元a到字元z之間的任一字元

[A-Z] ：匹配字元A到字元Z之間的任一字元

[0-9] ：匹配數字0到9之間的任一數字

[0-9a-z] ：匹配數字0到9或字元a到字元z之間的任一字元

[0-9a-zA-Z] ：匹配數字0到9或字元a到字元z或字元A到字元Z之間的任一字元

[abcd] ：匹配字元a或字元b或字元c或字元d

[1234] ：匹配數字1或數字2或數字3或數字4

在字元簇中，通過一個^脫位元組來表示取反的含義。

[^a-z] ：匹配除字元a到字元z以外的任一字元

[^0-9] ：匹配除數字0到9以外的任一字元

[^abcd] ：匹配除a、b、c、d以外的任一字元

幾個比較特殊的匹配符

\d ：匹配一個數字字元，還可以使用[0-9]

\D ：匹配一個非數字字元，還可以使用[^0-9]

\w ：匹配包括下劃線的任何單詞字元，還可以使用[0-9a-zA-Z_]

\W ：匹配任何非單詞字元，還可以使用[^\w]

\s ：匹配任何空白字元，space縮寫

\S ：匹配任何非空白字元，還可以使用[^\s]

.(我是一個點號) ：匹配除 "\n" 之外的任何單個字元

[\u4e00-\u9fa5] ：匹配中文字元中的任一字元

2.限定符（查多少）

限定符可以指定正則表示式的一個給定元件必須要出現多少次才能滿足匹配。

* ：匹配前面的子表示式零次或多次，0到多，{0,}

+ ：匹配前面的子表示式一次或多次，1到多，{1,}

? ：匹配前面的子表示式零次或一次，0或1，{0,1}

{n} ：匹配確定的 n 次

{n,} ：至少匹配n 次

{n,m} ：最少匹配 n 次且最多匹配 m 次

特別說明：

貪婪匹配

在正則表示式中，預設情況下，能匹配多的就不匹配少的，我們把這種匹配模式就稱之為“貪婪匹配。所有的正則表示式，預設情況下采用的都是貪婪匹配原則。

非貪婪匹配

在限定符的後面新增一個問號？，那我們的貪婪匹配原則就會轉化為非貪婪匹配原則，優先匹配少的。

3.定位符（從哪查）

定位符可以將一個正則表示式固定在一行的開始或結束。也可以建立只在單詞內或只在單詞的開始或結尾處出現的正則表示式。

^ ：匹配輸入字串的開始位置

$ ：匹配輸入字串的結束位置

\b ：匹配一個單詞邊界

\B ：匹配非單詞邊界

7.幾個需要注意的點

1.轉義符

在正則表示式中，我們可以使用反斜槓\對某些特殊字元進行轉義操作。需要轉義的字元：

點號.

小括號()

中括號[]

左斜槓/

右斜槓\

選擇匹配符|

2.選擇匹配符：在正則表示式中，我們可以通過一個豎線|代表選擇匹配符。可以理解成“或”。

3.特殊用法：

(?=) ：正向預查；

(?!) ：負向預查；

特別說明：在正則表示式中，如果子表示式遇到了exec就會產生上面的結果。其返回結果是一個數組。

第一組元素，索引為0的資料hellophp，代表正則匹配到的結果

索引為1的資料php，代表是第一個子表示式匹配到的結果

第二組元素，索引為0的資料hellojavascript，代表正則表示式匹配到的結果

索引為1的資料javascript，代表是第一個子表示式匹配到的結果

如何解決以上問題呢？答：可以使用(?:)的形式，讓正則表示式中的子表示式只輸出內容，但不捕獲。

(?:)：輸出內容但不捕獲（要用到的知識點：子表示式與exec方法）

十分鐘學會正則表示式

1、正則表示式正則表示式(regular expression)描述了一種字串匹配的模式，可以用來檢查一個串是否含有某種子串、將匹配的子串做替換或者從某個串中取出符合某個條件的子串等。模式：使用一種特殊符號來實現字串的匹配 2、建立正則物件 ①隱式建立 var 正則物件

十分鐘學習正則表示式|上手python re模組

請給我10分鐘，我有把握讓你10分鐘上手正則表示式。用一句通俗的語言解釋：正則表示式就是記錄文字規則的程式碼。正則表示式之所以難學，是因為它有大量的符號，每個符號的意義和用法又是不一樣的，但是隻要掌握了用法，正則表示式也可以很友好。本文中所有的程式碼都在python的re模組下

Python3基礎之（三十五）正則表示式

一、正則表示式正則表示式(Regular Expression)又稱 RegEx, 是用來匹配字元的一種工具. 在一大串字元中尋找你需要的內容. 它常被用在很多方面, 比如網頁爬蟲, 文稿整理,資料篩選等等. 最簡單的一個例子, 比如我需要爬取網頁中每一頁的標題. 而網頁中的標題常

鳥哥的Linux私房菜基礎篇第十一章正則表示式與檔案格式化處理

1. 正則的概念正則表示式就是處理字串的方法，他是以行為單位來進行字串的處理行為，正則表示式通過一些特殊符號的輔助，可以讓使用者輕易的達到“搜尋/刪除/取代”某特定字串的處理程式！ 2. 基礎

學會正則表示式，玩弄文字於股掌之中

1950 年, 一位叫斯蒂芬·科爾·克萊尼的數學家發表了一篇標題為《神經網事件的表示法》的論文，引入了正則表示式的概念。正則表示式就是用來描述他稱為"正則集的代數"的表示式，因此採用"正則表示式"這個術語。隨後，肯·湯普遜將這一符號系統引入 Unix 中的

為什麼要學會正則表示式

　　一直以來，我都認為能手寫正則表示式的人都是大神，至少不會是坑。正則表示式這個知識領域，在各種語言中被大神們運用的淋漓盡致。作為一個菜雞程式設計師，向大神看齊的最簡單的方式就是寫一手簡單粗暴的正則表示式。　　正則表示式是幹什麼的呢？　　舉個最簡單的例子，今天下午的時候測試人員給我提了一個bug，並且打上

十二，正則表示式整理

基本符號： ^ 表示匹配字串的開始位置 (例外用在中括號中[ ] 時,可以理解為取反,表示不匹配括號中字串) $ 表示匹配字串的結束位置 * 表示匹配零次到多次 + 表示匹配一次到多次 (至少有一

LeetCode(中國)第十題：正則表示式匹配

題目：給定一個字串 (s) 和一個字元模式 (p)。實現支援 ‘.’ 和 ‘*’ 的正則表示式匹配。 ‘.’ 匹配任意單個字元。 ‘*’ 匹配零個或多個前面的元素。匹配應該覆蓋整個字串 (s) ，而不是部分字串。說明: s 可能為空，且只包含從 a

JavaScript基礎（十一）正則表示式、3D拖拽相簿

正則表示式、3D拖拽相簿正則表示式需求：找出一串字串中的數字初識正則表示式正則表示式-匹配子項正則表示式-轉義字元 \b應用案例 \1的使用正則表示式-字符集正

學會正則表示式讓你的程式設計如虎添翼

本次我們要討論的專案是正則表示式。很多小夥伴會困惑：正則表示式是專案嗎？你要是問出這樣的問題，說明你太輕視正則表示式啦。學會正則表示式，你的程式設計之路如虎添翼，這麼說一點都不誇張。什麼是正則表示式？正則表示式，又稱規則表示式。（英語：Regular Express

1小時教你學會正則表示式

想必很多人都對正則表示式都頭疼.今天,我以我的認識,加上網上一些文章,希望用常人都可以理解的表達方式.來和大家分享學習經驗.　　開篇,還是得說說 ^ 和 $ 他們是分別用來匹配字串的開始和結束，以下分別舉例說明　　"^The": 開頭一定要有"The"字串; 　　"of despair$": 結尾一定要有"

Java學習系列(二十四)Java正則表示式詳解

前言正則表示式可以說是用來處理字串的一把利器，它是一個專門匹配n個字串的字串模板，本質是查詢和替換。在例項演示之前先了解一下Pattern、Matcher這兩個工具類，Pattern：編譯好的帶匹配的模板(如：Pattern.compile("[a-z]{2}")

30分鐘瞭解正則表示式

本文目標 30分鐘內讓你明白正則表示式是什麼，並對它有一些基本的瞭解，讓你可以在自己的程式或網頁裡使用它。如何使用本教程最重要的是——請給我30分鐘，如果你沒有使用正則表示式的經驗，請不要試圖在30秒內入門——除非你是超人 :) 別被下面那些複雜的

【十分鐘學會】正則表示式字元匹配攻略

閱讀建議：看一下正則表示式基礎，有一定的基本概念，效果最佳。正則表示式是匹配模式，要麼匹配字元，要麼匹配位置。請記住這句話。然而關於正則如何匹配字元的學習，大部分人都覺得這塊比較雜亂。畢竟元字元太多了，看起來沒有系統性，不好記。本

3分鐘搞定Linux系統正則表示式

正則表示式是一種字元模式，用於在查詢過程中匹配製定的字元。元字元通常在Linux中分為兩類：Shell元字元，由Linux Shell進行解析；正則表示式元字元，由vi/grep/sed/awk等文字處理工具進行解析；正則表示式一

你願意給我五分鐘，讓我帶你掌握正則表示式嗎？爬蟲必會知識點！

今天小編給大家分享的是Python正則表示式的簡單應用和示例演示，將前面學習的Python正則表示式做一個概括。進群：548377875 即可獲取大量的零基礎學習資料以及從零基礎到專案實戰的PDF一套哦！ &nb

Python進階(十六)-正則表示式

分享一下我的偶像大神的人工智慧教程！http://blog.csdn.net/jiangjunshow 也歡迎轉載我的文章，轉載請註明出處 https://blog.csdn.net/mm2zzyzzp Python進階(十六)-正則表示式正則表

正則表示式（十五）——統計程式碼中的程式碼行、註釋行和空白行

package com.wy.regular; import java.io.BufferedReader; import java.io.File; import java.io.FileNotFo

正則表示式（十七）——不捕獲分組

package com.wy.regular; import java.util.regex.Matcher; import java.util.regex.Pattern; public clas

正則表示式（十八）——向前引用

package com.wy.regular; import java.util.regex.Matcher; import java.util.regex.Pattern; public clas

十分鐘學會正則表示式

1、正則表示式

2、建立正則物件

3、匹配模式

4、與正則表示式相關的幾個方法

5.幾個重要概念

6.編寫正則表示式三步走

7.幾個需要注意的點

相關推薦