python-re模組(92)

阿新 • • 發佈：2018-12-12


>>> import re
>>> m = re.match('f..','food')  # 匹配到返回物件，匹配開頭
>>> print(re.match('f..','seafood'))    #匹配不到返回None
None
>>> m.group()   #返回匹配的值
'foo'
>>> m = re.search('f..','seafood')  #匹配沒有限制
>>> m.group()
'foo'
>>> re.findall('f..','seafood is food') #返回所有匹配項組成的列表
['foo', 'foo']

>>> result = re.finditer('f..','seafood is food')   # 返回匹配物件組成的迭代器
>>> for m in result:    # 從迭代器中逐個取出匹配物件
...     print(m.group())
...
foo
foo

>>> re.sub('f..','abc','fish is food')  #相當於匹配後替換
'abch is abcd'
>>> re.split('\.|-','hello-word-.tar.gz')   #切割，用.和-做切割符號
['hello', 'word', '', 'tar', 'gz']

>>> patt = re.compile('f..')    # 先把要匹配的模式編譯，提升效率
>>> m = patt.search('seafood')  # 指定在哪個字串中匹配
>>> m.group()
'foo'



#匹配檔案中指定模式
import re
def count_patt(fname,patt):
    cpatt = re.compile(patt)
    result = {}

    with open(fname) as fobj:
        for line in fobj:
            m = cpatt.search(line)  #如果匹配不到，返回None
            if m:
                key = m.group()
                result[key] = result.get(key,0) + 1 #如果有值，返回值key，沒有返回0

    return result

if __name__ == '__main__':
    fname = 'access_log'    # apache日誌檔案
    ip = '^(\d+\.){3}\d+'   # 日誌開頭的ip地址
    print(count_patt(fname,ip))
    br = 'Firefox|MSIE|Chrome'  # 日誌中客戶端瀏覽器
    print(count_patt(fname,br))




#模式匹配進階寫法

import re
from collections import Counter     # Counter物件是有序的，字典無序

class CountPatt:
    def __init__(self,fname):
        self.fname = fname

    def count_patt(self,patt):
        cpatt = re.compile(patt)
        result = Counter()

        with open(self,fname) as fobj:
            for line in fobj:
                m = cpatt.search(line)  #如果匹配不到，返回None
                if m:
                    result.update([m.group()])

        return result

if __name__ == '__main__':
    c = CounterPatt('access_log')
    ip = '^(\d+\.){3}\d+'
    br = 'Firefox|MSIE|Chrome'
    a = c.count_patt(ip)
    print(a)
    print(a.most_common(3))
    print(c.count_patt(br))

python-re模組(92)

>>> import re >>> m = re.match('f..','food') # 匹配到返回物件，匹配開頭 >>> print(re.match('f..','seafood')) #匹配不到返回N

Python--re模組

一、簡介正則表示式本身是一種小型的、高度專業化的程式語言，而在python中，通過內嵌整合re模組，程式媛們可以直接呼叫來實現正則匹配。正則表示式模式被編譯成一系列的位元組碼，然後由用C編寫的匹配引擎執行。二、正則表示式中常用的字元含義 1、普通字元和11個元字元：普通字

Python re 模組以及正則表示式

re.compile( ):將正則表示式編譯成一個物件，加快速度並可以重複使用。 import re re.complie() re.sub() :對字串做替換處理 ''' re.sub(pattern, repl, string, count=0, fl

python--re模組, 正則表示式

正則表示式是對字串操作的一種邏輯公式.我們一般使用正則表示式對字串進行匹配和過濾.使用這則的優缺點: 有點:靈活,功能性強,邏輯性強缺點: 上手男.一旦上手,會愛上這個東西工具: 各大文字編輯器一般都由正則匹配功能. 我們可以去http://tool.chinaz.com/regex/ 線

python re模組常用方法總結

res = re.match(pattern, string, flags=0) #字串的開頭是否能匹配正則表示式。返回_sre.SRE_Match物件，如果 #不能匹配返回None。 # 如果匹配的話

python re模組正則表示式

1 re的工作是在python中執行正則表示式 2 import re 3 4 # find 5 result = re.findall('\d+', 'baby的電話號是:185123456789') 6 print(result) 7 # 8 it = re.finditer('\

十分鐘學習正則表示式|上手python re模組

請給我10分鐘，我有把握讓你10分鐘上手正則表示式。用一句通俗的語言解釋：正則表示式就是記錄文字規則的程式碼。正則表示式之所以難學，是因為它有大量的符號，每個符號的意義和用法又是不一樣的，但是隻要掌握了用法，正則表示式也可以很友好。本文中所有的程式碼都在python的re模組下

Python re模組相關方法介紹

【程式碼示例】re模組方法使用。>>> import re>>> text="172.0.0.1">>> print(re.split("[\.]+",text))#按照模式進行字串分割，此處按照“.”進行分割['172'

python re模組的（...）,group(),groups()

1.(...)用來匹配字串中符合（）內規則的子串，匹配的字串被看成是一個組； 2.接上，這個組可以被後續引用，引用的方式是\N,N是這個組對應的編號； 3.接上，編號是0的組始終代表匹配的是整個字串，所以正則表示式裡的組編號從1開始；既然（）有如此的功能，我們在正則表示式

python-re模組常用的函式及方法

常見的正則表示式屬性僅僅是re模組函式 compile(pattern，flags= 0) 使用任何可選的標記來編譯正則表示式的模式，然後返回一個正則表示式物件 re 模組函式和正則表示式物件的方

Python面試題----Python 的re模組中match、search、findall、finditer的區別

請簡要說明Python 的re模組中match、search、findall、finditer的區別 re是Python中用於正則表示式相關處理的類，這四個方法都是用於匹配字串的，具體區別如下： match 匹配string 開頭，成功返回Match object

Python常用模組——re模組

　　有些人在面臨問題的時候會想：“我知道，我將使用正則表示式來解決這個問題。”這讓他們面臨的問題變成了兩個。　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　—— Jamie Zawinski 首先我們對比一下兩段程式碼處理使用者輸入手機號的不同 1 pho

Python進階——re模組

1.首先匯入re模組 import re (1) re.match()函式對字串的從字串的開頭進行匹配用法： re.match(pattern,string) import re pat="\d+" s="abc123abc123456" print(re.matc

Learning-Python【21】：Python常用模組（4）—— re、logging、hashlib、subprocess

re 模組：與正則相關的模組在使用 re 模組之前，需要先了解正則表示式（regular expression），描述了一種字串匹配的模式（pattern），可以用來檢查一個字串是否含有某個子字串、將匹配的子字串替換或者從某個字串中取出符合某個條件的子字串等。 import

【轉】Python之正則表示式（re模組）

【轉】Python之正則表示式（re模組）本節內容 re模組介紹使用re模組的步驟 re模組簡單應用示例關於匹配物件的說明說說正則表示式字串前的r字首 re模組綜合應用例項參考文件提示：由於該站對MARKDOWN的表格支援的不是很好，所以本文中的表

[Python模組]正則表示式 re模組的使用與例項

很喜歡Python教材中的這句格言: 有些人面臨問題時會想:“我知道, 我將使用正則表示式來解決這個問題.” 這讓他們面臨的問題變成了兩個. ---------Jamie Zawinski 正則表示式的確好用,但是複雜的模式難以閱讀和維護,與其把花在研究用正則表示式處理複雜的問題上,

Python基礎16模組-re模組

1.正則表示式 #^表示在字串開頭匹配，$表示在字串結尾匹配 #*匹配0到無窮多個 #+匹配1到無窮多個 #？匹配0或者1個 #{}定義匹配個數{0，}==*，{1，}==+，{0,1}==？，{6}=={1,6} #上面的元字元一般都是貪婪匹配，在後面加上？變成惰性匹配 #[]匹配括號裡的字元，只匹

Python正則表示式:re模組

正則表示式: 使用單個字串來描述、匹配一系列匹配某個句法規則的字串正則表.通常被用來檢索、替換那些符合某個模式(規則)的文字.python自1.5起提供了re模組,它提供了perl風格的正則表示式. re模組簡介 re.match函式功能嘗試從字串的起始位置開始匹配一個模式,如

python進階（2）——re模組：正則表示式1

實驗結果輸出文件，包括多項引數（大約幾百個），想把所有的loss value對應的值提取出來，畫出曲線圖，這就需要用到正則表示式，基於此，開始學習正則表示式。正則表示式：可匹配文字片段的模式萬用字元：句點.(.ython與jpython與python與 ython都匹配，但不與ython

python進階（2）——re模組：正則表示式2

re.split 根據模式來分割字串 import re text='a, b,,,,c d' print(re.split('[, ]+', text)) #re.split:以空格和字串分割字元 re.findall 返回列表，包含所有與給定模式匹配的子串 import re

python-re模組(92)

相關推薦