python re的findall和finditer的區別詳解

阿新 • • 發佈：2020-11-17

python正則模組re中findall和finditer兩者相似，但卻有很大區別。

兩者都可以獲取所有的匹配結果，這和search方法有著很大的區別，同時不同的是一個返回list，一個返回一個MatchObject型別的iterator

假設我們有這樣的資料：其中數字代表電話號，xx代表郵箱型別

content = '''email:[email protected]
email:[email protected]
email:[email protected]
'''

需求：（正則沒有分組）提取所有的郵箱資訊

result_finditer = re.finditer(r"\d+@\w+.com",content)
#由於返回的為MatchObject的iterator，所以我們需要迭代並通過MatchObject的方法輸出
for i in result_finditer :
  print i.group()

result_findall = re.findall(r"\d+@\w+.com",content)
#返回一個[] 直接輸出or或者迴圈輸出
print result_findall
for i in result_findall :
  print i

需求：（正則有分組）提取出來所有的電話號碼和郵箱型別

result_finditer = re.finditer(r"(\d+)@(\w+).com",content)
#正則有兩個分組，我們需要分別獲取分割槽，分組從0開始，group方法不傳遞索引預設為0，代表了整個正則的匹配結果
for i in result_finditer :
  phone_no = i.group(1)
  email_type = i.group(2)

result_findall = re.findall(r"(\d+)@(\w+).com",content)
#此時返回的雖然為[]，但不是簡單的[],而是一個tuple型別的list 
#如：[('12345678','163'),('2345678',('345678','163')]
for i in result_findall :
  phone_no = i[0]
  email_type = i[1]

命名分組和非命名分組的情況是一樣的。

findall注意點：

1.當正則沒有分組是返回的就是正則的匹配

re.findall(r"\d+@\w+.com",content)
['[email protected]','[email protected]','[email protected]']

2.有一個分組返回的是分組的匹配而不是整個正則的匹配

re.findall(r"(\d+)@\w+.com",content)
['2345678','2345678','345678']

3.多個分組時將分組裝到tuple中返回

re.findall(r"(\d+)@(\w+).com",content)
[('2345678','163')]

因此假如我們需要拿到整個正則和每個分組的匹配，使用findall我們需要將整個正則作為一個分組

re.findall(r"((\d+)@(\w+).com)",content)
[('[email protected]',('[email protected]',('[email protected]','345678','163')]

而使用finditer我們無需手動將整個正則用()括起來group()代表整個正則的匹配

實際中我們根據我們的需求選擇方法既可。

到此這篇關於python re的findall和finditer的區別詳解的文章就介紹到這了,更多相關python re的findall和finditer內容請搜尋我們以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援我們！

python dumps和loads區別詳解

這篇文章主要介紹了python dumps和loads區別詳解,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

Python中repr和str區別詳解

看下面的例子就明白了 class Test(object): def __init__(self,value=\'hello,world!\'): self.data = value

es6 for迴圈中let和var區別詳解

let和var區別： for(var i=0;i<5;i++){ setTimeout(()=>{ console.log(i);//5個5 },100) } console.log(i);//5

JS script指令碼中async和defer區別詳解

一引言程式碼如下 <script src=\"https://www.google.com/recaptcha/api.js\" async defer></script>

.net 中的 StringBuilder 和 TextWriter 區別詳解

最近閒來之餘，看了一些開源的類庫，看到有些類庫喜歡用 TextWriter 類來記錄相關的字串資料，感到比較好奇，為啥不用 StringBuilder 類物件。於是在網上搜索了一番，總結了相關筆記。

芯科新品晶片EFR32系列BG22，與nRF52810和CC2640R2L區別詳解

藍芽聯盟最新推出的BLE 5.2，讓藍芽技術應用到更多的場景當中，依託藍芽5.2的新特性，芯科實驗室（Silicon Labs）於今年年初線上宣佈推出基於Bluetooth 5.2的SoC —EFR32BG22，在釋出會中，Si公司展示了EFR

Redis持久化RDB和AOF區別詳解

RDB是Redis記憶體到硬碟的快照，用於redis持久化，建立RDB二進位制檔案，將儲存在記憶體中的資料，持久化的放到硬碟中，當我們需要這些資料的時候，啟動載入RDB檔案，資料將會被存入記憶體中，其實RDB就是一種快照的

Python getsizeof()和getsize()區分詳解

sys.getsizeof() 獲取程式中宣告的一個整數，儲存在變數中的大小，以位元組（Byte）為單位

12.10 Python seek()和tell()函式詳解

技術標籤：python基礎超詳細Python檔案操作（I/O）在講解 seek() 函式和 tell() 函式之前，首先來了解一下什麼是檔案指標。

Python str / bytes / unicode 區別詳解 - Python零基礎入門教程

目錄一.前言二.Python str / bytes / unicode 區別 1.Python2.x 版本中 str / bytes / unicode 區別

Servlet中/和/*的區別詳解

目錄本文提綱版本約定✍正文點撥“市面上”的錯誤答案1、/用於Servlet，/*用於Filter2、/不會匹配.p請求，而/*可以匹配到.jsp請求3、/*匹配範圍比/大4、/匹配所有url(路徑+字尾)，/*只匹配路徑型Servlet四種匹配

Python | time和datetime模組詳解

對時間進行處理 python與時間處理相關的模組有兩個： time模組和datetime模組（python的內建標準庫，不需要去下載）

python re的findall和finditer的區別詳解

python正則模組re中findall和finditer兩者相似，但卻有很大區別。兩者都可以獲取所有的匹配結果，這和search方法有著很大的區別，同時不同的是一個返回list，一個返回一個MatchObject型別的iterator

Python時間差中seconds和total_seconds的區別詳解

如下所示： import datetime t1 = datetime.datetime.strptime(\"2017-9-06 10:30:00\",\"%Y-%m-%d %H:%M:%S\")

基於python cut和qcut的用法及區別詳解

我就廢話不多說了，直接上程式碼吧： from pandas import Series,DataFrame import pandas as pd

Python中*args和**kwargs的區別詳解

一、*args的使用方法 *args 用來將引數打包成tuple給函式體呼叫 def args_test(x,y,*args):

對python中 math模組下 atan 和 atan2的區別詳解

atan 和 atan2 都是反正切函式，返回的都是弧度對於兩點形成的直線，兩點分別是 point(x1,y1) 和 point(x2,y2)，其斜率對應角度的計算方法可以是：

python中urllib.request和requests的使用及區別詳解

urllib.request 我們都知道，urlopen()方法能發起最基本對的請求發起，但僅僅這些在我們的實際應用中一般都是不夠的，可能我們需要加入headers之類的引數,那需要用功能更為強大的Request類來構建了

Python生成器next方法和send方法區別詳解

yield的語法規則是：在yield這裡暫停函式執行，並返回yield後面表示式的值（預設為None），直到被next()再次呼叫時，從上次暫停的yield程式碼處繼續往下執行。當沒有可繼續next()時，丟擲異常，該異常可被for迴圈處

python字串的index和find的區別詳解

1.find函式 find() 方法檢測字串中是否包含子字串 str ，如果指定 beg（開始）和 end（結束）範圍，則檢查是否包含在指定範圍內，如果指定範圍內如果包含指定索引值，返回的是索引值在字串中的起始位置。如果不包含

python re的findall和finditer的區別詳解

相關推薦