1. 程式人生 > 其它 >如何在python中使用正則表示式從多行字串中刪除特定字元

如何在python中使用正則表示式從多行字串中刪除特定字元

技術標籤:程式語言python

我有一個如下所示的多行字串:

st = '''emp:firstinfo\n
       :secondinfo\n
       thirdinfo
     '''
print(st)

我正在嘗試做的是從我的字串中跳過第二個’:’,並獲得如下所示的輸出:

 '''emp:firstinfo\n
   secondinfo\n
   thirdinfo
   '''

簡單說,如果它以’:'開頭,我只想忽略它。

這是我所做的:

'''
遇到問題沒人解答?小編建立了一個Python學習交流QQ群:778463939
尋找有志同道合的小夥伴,互幫互助,群裡還有不錯的視訊學習教程和PDF電子書!
'''
mat_obj = re.match(r'(.*)\n*([^:](.*))\n*(.*)' , st) print(mat_obj.group())

顯然,我沒有看到我的錯誤,但是誰可以幫助我告訴我哪裡出錯了嗎?

1 Answer:

您可以在此正則表示式中使用re.sub:

'''
遇到問題沒人解答?小編建立了一個Python學習交流QQ群:778463939
尋找有志同道合的小夥伴,互幫互助,群裡還有不錯的視訊學習教程和PDF電子書!
'''
>>> print (re.sub(r'([^:\n]*:[^:\n]*\n)\s*:(.+)', r'\1\2', st))
emp:firstinfo secondinfo thirdinfo

正則表示式詳細資訊:

(: 開始第一個捕獲組
[^:\n]*: 匹配0個或多個不是:的任何字元和換行符
:: 匹配冒號
[^:\n]*: 匹配0個或多個不是:的任何字元和換行符
\n: 匹配換行
): 結束第一個捕獲組
\s*: 匹配0個或多個空格
::匹配一個冒號
(.+): 匹配第二個捕獲組中的任何一個或多個字元(換行符除外)
\1\2: 用於替換組12中捕獲的子字串。

2 Answer:

您可以改用sub,只是不要捕獲不需要的部分。

(.*\n)[^:]*:(.*\n)(.*)

在這裡插入圖片描述

\1\2\3

替換為

import re
 
regex = r"(.*\n)[^:]*:(.*\n)(.*)"
 
test_str = ("emp:firstinfo\\n\n"
    "       :secondinfo\\n\n"
    "       thirdinfo")
 
subst = "\\1\\2\\3"
 
# You can manually specify the number of replacements by changing the 4th argument
result = re.sub(regex, subst, test_str, 0, re.MULTILINE)