使用Python提取文字中含有特定字串的方法示例

阿新 • • 發佈：2020-12-10

今天搞了一天的文字處理，發現python真的太適合做資料處理了。廢話不多說，一起學習吧！

1.我的原始資料是這樣的，如圖

2.如果要提取每行含有pass的字串，程式碼如下：

import re

filepath = "E:/untitled1/analyze_log/test.log"
txt = open(filepath,"r").read()

result=""
test_text = re.findall("..............+pass",txt)#取出每行含有pass的文字
result = result +'\n'.join(test_text)#換行輸出
print(result)

3.執行上面程式碼，可以取出每行含有pass的文字，如圖：

使用Python提取文字中含有特定字串的方法示例

4.其實我真正要提取的是每行類似上圖紅色框內的字串，程式碼實現如下：

import re

filepath = "E:/untitled1/analyze_log/test.log"
txt = open(filepath,txt)#取出每行含有pass的文字
result = result +'\n'.join(test_text)#換行輸出
del_num = re.sub("\d+ ","",result)#去掉每行行首的數字
del_awake = del_num.replace("awake","")#去掉awake
del_commd = del_awake.replace("commd","")#去掉commd
del_string1 = re.sub("-a+\d\d\d\d-\d.wav",del_commd)#去掉-a0023-1.wav型別的字串
del_string2 = re.sub("-a+\d\d\d\d.wav",del_string1)#去掉-a0016.wav型別的字串
print(del_string2)

5.執行上面程式碼，可以取出最後我需要的文字，如圖：

使用Python提取文字中含有特定字串的方法示例

6.拓展

使用Python提取文字中含有特定字串的方法示例

7.示例程式碼

import re

str = 'Hello123/World 45_?6bye'
result1 = re.findall('\d',str)#\d匹配任何十進位制數
result2 = re.findall('\d+',str)#\d+可匹配一位或多位數字使用
result3 = re.findall('\D',str)#\d匹配非數字字元任何十進位制數
result4 = re.findall('\w',str)#\w匹配任何字母數字字元，包括下劃線在內
result5 = re.findall('\W',str)#\W匹配非任何字母數字字元，包括下劃線在內
result6 = re.findall('\s',str)#\s匹配任何空白字元
result7 = re.findall('\S',str)#\S匹配非任何空白字元
result8 = re.findall('\AHello',str)#\A僅匹配字串開頭
result9 = re.findall('bye\Z',str)#\Z僅匹配字串結尾
print(result1)
print(result2)
print(result3)
print(result4)
print(result5)
print(result6)
print(result7)
print(result8)
print(result9)

接下來會更幾篇關於文字處理的部落格，一邊學習一邊記筆記。加油！

到此這篇關於使用Python提取文字中含有特定字串的文章就介紹到這了,更多相關Python提取文字特定字串內容請搜尋我們以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援我們！

使用Python提取文字中含有特定字串的方法示例

今天搞了一天的文字處理，發現python真的太適合做資料處理了。廢話不多說，一起學習吧！

python利用正則表示式提取文字中特定內容

正則表示式是一個特殊的字元序列，它能幫助你方便的檢查一個字串是否與某種模式匹配。

【轉載】python自動提取文字中的時間（包含中文日期）

原文出處：https://www.cnblogs.com/i-love-python/p/12763063.html 有時在處理不規則資料時需要提取文字包含的時間日期。dateutil.parser模組可以統一日期字串格式。datefinder模組可以在字串中提取日期。datefinde

python自動提取文字中的時間(包含中文日期)

有時在處理不規則資料時需要提取文字包含的時間日期。 dateutil.parser模組可以統一日期字串格式。

python同時替換多個字串方法示例

本文介紹了python同時替換多個字串方法示例，分享給大家，具體如下： import re

利用python在excel中畫圖的實現方法

一、前言以前大學時候，學EXCEL看到N多大神利用excel畫圖，覺得很不可思議。今個學了一個來月python,膨脹了就想用excel畫圖。當然，其實用畫圖這個詞不甚嚴謹，實際上是利用opencv遍歷每一個畫素的rgb值，再將其轉化

Python 捕獲程式碼中所有異常的方法

問題怎樣捕獲程式碼中的所有異常？解決方案想要捕獲所有的異常，可以直接捕獲 Exception 即可：

如何單獨提取文字中的手機電話號碼

在做電話銷售的時候，經常要打電話，做產品推廣，我們很多時候會拿到一些很雜亂的資料，裡面除了手機號碼、還有各種雜亂的文字，那麼有沒有如何單獨提取文字中的手機電話號碼呢？如果我們一個個單獨挑出來的

Python提取視訊中圖片的示例（按幀、按秒）

一、按幀提取 #coding=utf-8 import os import cv2 def save_img():#提取視訊中圖片按照每幀提取

Python從檔案中讀取資料的方法步驟

一、讀取整個檔案內容在讀取檔案之前，我們先建立一個文字檔案resource.txt作為原始檔。

Pandas使用（二）--篩選出dataframe某列中含有特定元素的行

技術標籤：資料分析python資料分析 Pandas使用（二）–篩選出dataframe某列中含有特定元素的行

python 提取程式碼中的所有漢字

技術標籤：python 遇到一個需求，需要提取程式碼中所有用到的漢字，有lua程式碼c++程式碼還有oc程式碼，於是研究了一個指令碼，專門提取程式碼中的漢字，現在研究好了，在這裡貼一下，供大家參考

Python類定義中的@classmethod(類方法)和@staticmethod(靜態方法)的使用

　　之前的一篇博文詳細講解了什麼函式裝飾器（Python迭代器、生成器、裝飾器的使用）。在類的定義中，我們也常常見到裝飾器的使用，並且最常用的就是@classmethod，@staticmethod來裝飾我們自定義類的函式(方法)，

Python新手必備的15個字串方法，你學廢了嗎？

兄弟們Python都學的怎麼樣了？字串學會了麼？字串是Python最基本的資料型別，遍佈所有Python程式，你要你在用用Python，就都會使用到它。

python提取檔案中所有ip

引用正則表示式 import re, socket ip_lists = []ip_regex = re.compile(r\'(25[0-5]|2[0-4][0-9]|[0-1]?[0-9]?[0-9])\\.(25[0-5]|2[0-4][0-9]|[0-1]?[0-9]?[0-9])\\.(25[0-5]|2[0-4][0-9]|[0-1]?[0-9]?[0-9])\\.(25