正則表示式裡字串”不包含”匹配技巧

阿新 • • 發佈：2019-01-26

經常我們會遇到想找出不包含某個字串的文字，程式設計師最容易想到的是在正則表示式裡使用，^(hede)來過濾”hede”字串，但這種寫法是錯誤的。我們可以這樣寫：[^hede]，但這樣的正則表示式完全是另外一個意思，它的意思是字串裡不能包含‘h’，‘e’，‘d’三個但字元。那什麼樣的正則表示式能過濾出不包含完整“hello”字串的資訊呢？

事實上，說正則表示式裡不支援逆向匹配並不是百分之百的正確。就像這個問題，我們就可以使用否定式查詢來模擬出逆向匹配，從而解決我們的問題：

^((?!hede).)*$

上面這個表示式就能過濾出不包含‘hede’字串的資訊。我上面也說了，這種寫法並不是正則表示式“擅長”的用法，但它是可以這樣用的。

解釋

一個字串是由n個字元組成的。在每個字元之前和之後，都有一個空字元。這樣，一個由n個字元組成的字串就有n+1個空字串。我們來看一下“ABhedeCD”這個字串：

    +--+---+--+---+--+---+--+---+--+---+--+---+--+---+--+---+--+
S = |e1| A |e2| B |e3| h |e4| e |e5| d |e6| e |e7| C |e8| D |e9|
    +--+---+--+---+--+---+--+---+--+---+--+---+--+---+--+---+--+

index    0      1      2      3      4      5      6      7

所有的e編號的位置都是空字元。表示式(?!hede).會往前查詢，看看前面是不是沒有“hede”字串，如果沒有(是其它字元)，那麼.(點號)就會匹配這些其它字元。這種正則表示式的“查詢”也叫做“zero-width-assertions”(零寬度斷言)，因為它不會捕獲任何的字元，只是判斷。

在上面的例子裡，每個空字元都會檢查其前面的字串是否不是‘hede’，如果不是，這.(點號)就是匹配捕捉這個字元。表示式(?!hede).只執行一次，所以，我們將這個表示式用括號包裹成組(group)，然後用*(星號)修飾——匹配0次或多次：((?!hede).)*。

你可以理解，正則表示式((?!hede).)*

匹配字串"ABhedeCD"的結果false，因為在e3位置，(?!hede)匹配不合格，它之前有"hede"字串，也就是包含了指定的字串。

在正則表示式裡， ?! 是否定式向前查詢，它幫我們解決了字串“不包含”匹配的問題。

原文地址：

http://www.vaikan.com/regular-expression-to-match-string-not-containing-a-word/

正則表示式裡字串”不包含”匹配技巧

解釋

正則表示式裡字串”不包含”匹配技巧

正則表示式判斷字串是否包含字母，數字，符號

在Python中使用正則表示式去掉字串裡的html標籤

Python 正則表示式，search(不要求從開頭匹配)，findall(匹配所有)，sub(替換)，split(切割)

非貪婪匹配：如何使用正則表示式碰到到第一個匹配到的字串就停止

使用正則表示式去掉字串前面多餘的0和後面多餘的0

js正則表示式驗證字串只包括大小寫字母下劃線和－

使用正則表示式去掉字串前面和後面多餘的0

正則表示式判斷字串是否為數字

正則表示式裡的坑

使用正則表示式替換字串

使用正則表示式對字串進行拆分

利用正則表示式進行字串替換（replace方法）

grok正則表示式一行多個結果匹配

php正則表示式剔除字串中的除了漢字的字元（只保留漢字）

Python正則表示式裡的單行re.S和多行re.M模式

java利用正則表示式提取字串中的整數和小數部分

JS正則表示式--正則表示式常用字串函式

正則表示式裡單雙引號區別

Python3 正則表示式中group()方法獲得匹配結果

正則表示式裡字串”不包含”匹配技巧

解釋

相關推薦