Python正則表示式中的量詞符號與組問題小結

阿新 • • 發佈：2021-08-31

正則表示式中的符號

在這裡插入圖片描述

例子

| 是或的關係，只要存在就會被捕獲
匹配到的資料只按字串順序返回，而不是按照匹配規則返回

In [18]: data = '[email protected]'

In [19]: print(re.findall('insane|com|loafer',data))
['insane','loafer','com']

^ 等同於 \A

In [20]:  print(re.findall('^insane',data))
['insane']

In [21]:  print(re.findall('^insane1',data))
[]

$ 等同於 \Z

In [22]:  print(re.findall('com$',data))
['com']

In [23]:  print(re.findall('net$',data))
[]

* 匹配0次或多次

In [24]:  print(re.findall('\w*','','com','']

+ 匹配1次或多次
w+ 匹配1次或多次數字或字母
@和.屬於0次範圍，不會被匹配出來

In [25]:  print(re.findall('\w+','com']

{3} 表示對於匹配到的資料只獲取3次

In [31]: data = '[email protected]'

In [32]:  print(re.findall('\w{3}',data))
['ins','ane','loa','com']

In [33]:  print(re.findall('[a-z]{3}','com']

[a-zA-Z0-9] 基本上等同於 \w

{M,N} 表示對於匹配到的資料只獲取M~N次

In [34]: data = '[email protected]'

In [35]:  print(re.findall('\w{1,4}',data))
['insa','ne','loaf','com']

反例：N 和 M 中間不能有空格

In [36]:  print(re.findall('\w{1,data))
[]

[^...] 表示不匹配字符集中的字元

In [37]: data = '[email protected]'

In [38]:  print(re.findall('[^insane]',data))
['@','l','o','f','.','c','mwww.cppcns.com 
']

組的概念

在這裡插入圖片描述

組的應用

In [42]: test = 'hello my name is insane'

In [43]: result = re.search('hello (.*) name is (.*)',test)

In [44]: result.groups()
Out[44]: ('my','insane')

In [45]: result.groups(1)
Out[45]: ('my','insane')

In [46]: result.group(1)
Out[46]: 'my'

In [47]: result.group(2)
Out[47]: nMuYiSRb'insane'

貪婪與非貪婪 0次或多次屬於貪婪模式
通過?組合變成非貪婪模式實戰

#!/usr/bin/3
# -*- coding: utf-8 -*-
# @Time     : 2021/8/28 22:13
# @Author   : InsaneLoafer
# @File     : re_test2.py

import re


def check_url(url):
    """
    判斷url是否合法
    :param url:
    :return:
    """
    result = re.findall('[a-zA-Z]{4,5}://\w*\.*\w+\.\w+',url)
    if len(result) != 0:
        return True
    else:
        return False

def get_url(url):
    """
    通過組獲取url中的某一部分
    :param url:
    :return:
    """
    result = re.findall('[https://|http://](\w*\.*\w+\.\w+)',url)
    if len(result) != 0:
        return result[0]
    else:
        return ''

def get_email(data):
    # result = re.findall('[0-9a-zA-Z_]+@[0-9a-zA-Z]+\.[a-zA-Z]+',data)
    result = re.findall('.+@.+\.[a-zA-Z]+',http://www.cppcns.comdata)
    return result


html = ('<div class="s-top-nav" style="display:none;">'
        '</div><div class="s-center-box"></div>')

def get_html_data(data):
    """
    獲取style中的display:
    使用非貪婪模式
    """
    result = re.findall('style="(.*?)"',data)
    return result

def get_all_data_html(data):
    """
    獲取html中所有等號後雙引號內的字元
    :param data:
    :return:
    """
    result = re.findall('="(.+?)"',data)
    return result


if __name__ == '__main__':
    result = check_url('https://www.baidu.com')
    print(result)

    result = get_url('https://www.baidu.com')
    print(result,'https')

    result = get_url('http://www.baidu.com')
    print(result,'http')

    result = get_email('[email protected]')
    print(result)

    result = get_html_data(html)
    print(result)

    result = get_all_data_html(html)
    print(result)

True
www.baidu.com https
www.baidu.com http
['[email protected]']
['display:none;']
['s-top-nav','display:none;','s-center-box']

Process finished with exit code 0

到此這篇關於Python正則表示式中的量詞符號與組的文章就介紹到這了,更多相關python正則表示式量詞內容請搜尋我們以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援我們！

Python正則表示式中的量詞符號與組問題小結

正則表示式中的符號例子是或的關係，只要存在就會被捕獲匹配到的資料只按字串順序返回，而不是按照匹配規則返回

Python 正則表示式完美匹配中文與中文標點符號

匹配中文標點符號： [\\u3002\\uff1b\\uff0c\\uff1a\\u201c\\u201d\\uff08\\uff09\\u3001\\uff1f\\u300a\\u300b]匹配中文字元的正則表示式： [\\u4e00-\\u9fa5]

Python正則表示式的findall函式與分組

在學習Python過程，對於分組與findall不太理解，所以歸納總結了一下，以下為本人python學習總結的一部分：

Python 正則表示式中的group引數使用

Python正則表示式re模組中有個group引數，剛開始看的時候沒理解，自己摸索了一下，終於知道是啥意思了，記錄一下。

關於python正則表示式中的否定預查

python正則表示式中否定預查 (?!與? 好久沒寫過東西了，水一點最近專案中接觸比較多的關於正則的東西吧。寫正則的時候經常會遇到的一個問題是，如果我希望排除某種模式的時候該怎麼做。如果是單個字元的話，我們自

正則表示式中限定符與定位符的使用

目錄 193. 有效電話號碼思路程式碼快速查看錶特殊字元表達限定符表達定位符表達

分享一場Python正則表示式中的特殊序列問答交流

大家好，我是我是皮皮。一、前言前幾天在Python最強王者交流群有個叫【傑】的粉絲問了一個關於Python正則表示式的問題，討論十分火熱，這裡拿出來給大家分享下，一起學習。

盤點Python正則表示式中的貪婪模式和非貪婪模式

大家好，我是我是皮皮。一、前言前幾天在Python最強王者交流群有個叫【傑】的粉絲問了一個關於Python正則表示式的問題，其中涉及到Python正則表示式中的貪婪模式和非貪婪模式，討論十分火熱，這裡拿出來給大家分享

python 正則表示式中的元字元

符號描述 \\ 將下一個字元標記為一個特殊字元、一個原義字元(Identity Escape,有 \"^\" \"$\" \"(\" \")\" \"*\" \"+\" \"{\" \"|\" 共計12個)、一個向後引用(backreferences)或一個八進位制轉

python正則表示式中的函式

python 的 re 模組提供了很多方便的函式使你可以使用正則表示式來操作字串，每種函式都有它自己的特性和使用場景，熟悉之後對你的工作會有很大幫助

Python正則表示式匹配字串中的數字

1.使用“\\d+”匹配全數字程式碼： import re zen = \"Arizona 479,501,870. Carlifornia 209,213,650.\"

Java中正則表示式split()特殊符號使用詳解

特殊情況有 * ^ : | . \\ 一、單個符號作為分隔符 String address=\"上海\\上海市|閔行區\\吳中路\";

python 正則表示式與JSON-正則表示式匹配數字、非數字、字元、非字元、貪婪模式、非貪婪模式、匹配次數指定等

1、正則表示式：目的是為了爬蟲，是爬蟲利器。正則表示式是用來做字串匹配的，比如檢測是不是電話、是不是email、是不是ip地址之類的

python 正則表示式與JSON-JSON

1、json 是一種輕量級的跨語言資料交換格式。輕量的意思是比起xml來說，更加輕量。比xml傳輸的資料更易讀，更易於極細，傳輸的效率要高。

python 正則表示式貪婪模式與非貪婪模式原理、用法例項分析

本文例項講述了python 正則表示式貪婪模式與非貪婪模式原理、用法。分享給大家供大家參考，具體如下：

python 正則表示式按大寫字母、中文、特殊符號分離字串

python 正則表示式按大寫字母、中文、特殊符號分離字串 import re def split_except_alphabetDigitChinese(unicode_str):

js 正則表示式與 python正則表示式

修飾符 1.js i g m i 忽視大小寫g 執行全域性匹配（查詢所有匹配，而非找到第一個匹配後停止）m 執行多行匹配gi 全域性匹配+忽略大小寫

python 正則表示式引數替換例項詳解

正則表示式是一個特殊的字元序列，它能幫助你方便的檢查一個字串是否與某種模式匹配。

python 正則表示式語法學習筆記

正則表示式(regular expression)描述了一種字串匹配的模式（pattern），可以用來檢查一個串是否含有某種子串、將匹配的子串替換或者從某個串中取出符合某個條件的子串等。

Python正則表示式學習小例子

正則表示式是處理字串的強大工具。作為一個概念而言，正則表示式對於Python來說並不是獨有的。但是，Python中的正則表示式在實際使用過程中還是有一些細小的差別。

Python正則表示式中的量詞符號與組問題小結

正則表示式中的符號

例子

組的概念

組的應用

相關推薦