盤點Python正則表示式中的貪婪模式和非貪婪模式

阿新 • • 發佈：2022-04-02

大家好，我是我是皮皮。

一、前言

前幾天在Python最強王者交流群有個叫【傑】的粉絲問了一個關於Python正則表示式的問題，其中涉及到Python正則表示式中的貪婪模式和非貪婪模式，討論十分火熱，這裡拿出來給大家分享下，一起學習。

二、解決過程

這裡分享【小王】大佬的解答，一起來看看吧，下面是他給的一個示例程式碼。

import re

txt = "This is an HTML tag: <head>HEADER</head>. It means the head of the whole HTML document."
pattern1 = re.compile(r"<.*>")
pattern2 = re.compile(r"<.*?>")
result1 = re.findall(pattern1, txt)
result2 = re.findall(pattern2, txt)
print(result1)
print(result2)

輸出結果如下圖所示：

關於輸出的解析如下：

我想匹配HTML標籤中的資料，也就是<>之間的資料。

pattern1 = re.compile(r"<.*>")
pattern2 = re.compile(r"<.*?>")

這兩種只相差了一個?，但是區別卻很大。解析如下圖所示：

直到什麼時候停止呢？

這個就是貪婪模式的匹配方式，那麼非貪婪模式呢？

小彩蛋

分享一個【小王】大佬的程式碼，實現的效果是將正則匹配結果寫成命名分組Python程式碼。

常規寫法如下所示：

import re

txt = "This is an HTML tag: <head>HEADER</head>. It means the head of the whole HTML document."

tag = re.compile(r"<([A-Za-z0-9]+)>.*?</\1>.*")
print(re.findall(tag, txt))

寫成命名分組的寫法如下所示：

txt = "This is an HTML tag: <head>HEADER</head>. It means the head of the whole HTML document."

tag = re.compile(r"<(?P<tag_mark>[A-Za-z0-9]+)>.*?</(?P=tag_mark)>.*")
print(re.findall(tag, txt))

總結

大家好，我是皮皮。這篇文章基於粉絲提問，針對Python正則表示式中的貪婪模式和非貪婪模式問題，給出了具體說明和演示，順利的幫助粉絲解決了問題。

最後感謝粉絲【傑】提問，感謝【小王】大佬給出的解答和示例，感謝【（這是月亮的背面）】、【dcpeng】、【wangning】、【Chloé P.】等大佬們參與學習交流。

小夥伴們，快快用實踐一下吧！如果在學習過程中，有遇到任何問題，歡迎加我好友，我拉你進Python學習交流群共同探討學習。

盤點Python正則表示式中的貪婪模式和非貪婪模式

大家好，我是我是皮皮。一、前言前幾天在Python最強王者交流群有個叫【傑】的粉絲問了一個關於Python正則表示式的問題，其中涉及到Python正則表示式中的貪婪模式和非貪婪模式，討論十分火熱，這裡拿出來給大家分享

python正則表示式的懶惰匹配和貪婪匹配說明

第一次碰到這個問題的時候，確實不知道該怎麼辦，後來請教了一個大神，加上自己的理解，才瞭解是什麼意思，這個東西寫python的會經常用到，而且會特別頻繁，在此寫一篇部落格，希望可以幫到一些朋友。

Python 正則表示式中的group引數使用

Python正則表示式re模組中有個group引數，剛開始看的時候沒理解，自己摸索了一下，終於知道是啥意思了，記錄一下。

關於python正則表示式中的否定預查

python正則表示式中否定預查 (?!與? 好久沒寫過東西了，水一點最近專案中接觸比較多的關於正則的東西吧。寫正則的時候經常會遇到的一個問題是，如果我希望排除某種模式的時候該怎麼做。如果是單個字元的話，我們自

Python正則表示式中的量詞符號與組問題小結

正則表示式中的符號例子是或的關係，只要存在就會被捕獲匹配到的資料只按字串順序返回，而不是按照匹配規則返回

分享一場Python正則表示式中的特殊序列問答交流

大家好，我是我是皮皮。一、前言前幾天在Python最強王者交流群有個叫【傑】的粉絲問了一個關於Python正則表示式的問題，討論十分火熱，這裡拿出來給大家分享下，一起學習。

python 正則表示式中的元字元

符號描述 \\ 將下一個字元標記為一個特殊字元、一個原義字元(Identity Escape,有 \"^\" \"$\" \"(\" \")\" \"*\" \"+\" \"{\" \"|\" 共計12個)、一個向後引用(backreferences)或一個八進位制轉

python正則表示式中的函式

python 的 re 模組提供了很多方便的函式使你可以使用正則表示式來操作字串，每種函式都有它自己的特性和使用場景，熟悉之後對你的工作會有很大幫助

正則表示式中的或|和C++中的邏輯或||

　　正則表示式中的或意義和C++中的||意義相同，均表示滿足其中一個條件即可。如下式表示匹配一個個位數或者小於255的三位數。

python 正則表示式與JSON-正則表示式匹配數字、非數字、字元、非字元、貪婪模式、非貪婪模式、匹配次數指定等

1、正則表示式：目的是為了爬蟲，是爬蟲利器。正則表示式是用來做字串匹配的，比如檢測是不是電話、是不是email、是不是ip地址之類的

正則表示式中的多行和非貪婪模式

多行就是在前邊加\"(?s)\" 非貪婪模式就是在*、？、+ 後邊再加？例子： URL url = new URL(\"http://money.finance.sina.com.cn/corp/go.php/vMS_MarketHistory/stockid/600000.phtml\");

python 正則表示式貪婪模式與非貪婪模式原理、用法例項分析

本文例項講述了python 正則表示式貪婪模式與非貪婪模式原理、用法。分享給大家供大家參考，具體如下：

Python正則表示式匹配字串中的數字

1.使用“\\d+”匹配全數字程式碼： import re zen = \"Arizona 479,501,870. Carlifornia 209,213,650.\"

Python正則表示式--正則模式

1.非列印字元字元　　描述 \\cx　　匹配由x指明的控制字元。例如， \\cM 匹配一個 Control-M 或回車符。x 的值必須為 A-Z 或 a-z 之一。否則，將 c 視為一個原義的 \'c\' 字元。

python 正則表示式模式

I IGNORECASE，忽略大小寫的匹配模式, 樣例如下 s = \'hello World!\' regex = re.compile(\"hello world!\", re.I)

python 正則表示式引數替換例項詳解

正則表示式是一個特殊的字元序列，它能幫助你方便的檢查一個字串是否與某種模式匹配。

python 正則表示式語法學習筆記

正則表示式(regular expression)描述了一種字串匹配的模式（pattern），可以用來檢查一個串是否含有某種子串、將匹配的子串替換或者從某個串中取出符合某個條件的子串等。

Python正則表示式學習小例子

正則表示式是處理字串的強大工具。作為一個概念而言，正則表示式對於Python來說並不是獨有的。但是，Python中的正則表示式在實際使用過程中還是有一些細小的差別。

python正則表示式例項程式碼

re 模組使 Python 語言擁有全部的正則表示式功能。會用到的語法正則字元釋義

盤點Python正則表示式中的貪婪模式和非貪婪模式

一、前言

二、解決過程

小彩蛋

總結

相關推薦