字串處理神器——Python Regular Expression

阿新 • • 發佈：2019-01-02

正則表示式是一個特殊的字元序列（也可以理解為匹配模式）

它可以幫助方便地檢查文字是否與該模式匹配。

匹配的資訊包括匹配的子串、分組和在本文中的索引等等。

在python中所有正則表示式的函式都在模組re中，有很多與字串操作類似的函式。

放一些在ECNU Online Judge上能用re處理的例題（後續遇到了再更新~）

1、EOJ 2897 英文縮寫詞

傳送門：http://acm.ecnu.edu.cn/problem/2897/

除了預處理+stringstream的標準做法之外，使用re.split有奇效

import re
del_word = ["THE", "AN", "A", "OF", "FOR", "AND"]
while True:
    try:
        for word in re.split(r"[ -]", input().upper()):
            if not (word in del_word):
                print(word[0], end = '')
        print('')
    except:
        break

2、EOJ 3124 英文縮寫詞

傳送門：http://acm.ecnu.edu.cn/problem/3124/ 這題的大致思路是：用標點和空格分割字元，filter過濾後用set去重，最後排序

import re
cas = int(input())
for t in range(cas):
    s = input()
    print("case #%d:" %t)
    lis = list(set(filter(lambda x: x, re.split(r'[,.!? ]+', s))))
    lis.sort()
    print(' '.join(lis))

Tips：當輸出要求各個數字/字串用空格隔開時（有的還要求沒有行末空格）

python的常規輸出會很麻煩。

一個解決的辦法是將存放輸出結果的list轉成str型別（lambda一下）

然後像上面程式碼一樣join輸出。

3、EOJ 3143 純虛數的冪

傳送門：http://acm.ecnu.edu.cn/problem/3143/

這題用python做直接解決了高精度問題，需要做的就是利用re.split將a和b提取出。

from re import split
cas = int(input())
for t in range(cas):
    a, b = map(int, split(r"[j ]+", input()))
    s = str(a ** b)
    dic = {0: s, 1:s+'j', 2:'-'+s, 3:'-'+s+'j'}
    print("case #%d:\n%s" %(t, dic[b%4]))

4、EOJ 2959 正則表示式簡化版

傳送門：http://acm.ecnu.edu.cn/problem/2959/

題意就是給定一個模式串和若干文字串，問文字串是否和模式匹配。

上來用re直接search，WA了幾發以後發現了問題所在：

python自帶的正則表示式系統在文字串和模式串過長的情況下會丟擲OverFlowError

當資料過大搜索持續的時候會RE（出題人硬要卡Python咯？）

所以可以改成一旦catch到Error就認為匹配失敗就蜜汁AC了（霧）

from re import search
while True:
	try:
		s = input()
		while True:
			try:
				text = input()
				if text == '0': break
				m = search(s, text)
				print('Regular Expression is Fun!') if m else print('Boring String Matching...')
			except OverflowError:
				print('Boring String Matching...')
	except:
		break

字串處理神器——Python Regular Expression

正則表示式是一個特殊的字元序列（也可以理解為匹配模式）它可以幫助方便地檢查文字是否與該模式匹配。匹配的資訊包括匹配的子串、分組和在本文中的索引等等。在python中所有正則表示式的函式都在模組re中，有很多與字串操作類似的函式。放一些在ECNU Online Jud

[Python]Regular Expression Syntax(CHN)

簡介 Python 自1.5版本起增加了re 模組，它提供 Perl 風格的正則表示式模式。Python 1.5之前版本則是通過 regex 模組提供 Emecs 風格的模式。Emacs 風格模式可讀性稍差些，而且功能也不強，因此編寫新程式碼時儘量不要再使用 regex 模組

【原創】python學習筆記（10）--《笨辦法學python》字串處理

字串基本操作（1）字串+字串（2）字串*數字（3）字串+str（其他） # -*- coding:utf-8 -*- print ("test1") name1="alice" name2="bob" name_new=name1+name2 print

大資料處理神器map-reduce實現(僅python和shell版本)

熟悉java的人直接可以使用java實現map-reduce過程，而像我這種不熟悉java的怎麼辦？為了讓非java程式設計師方便處理資料，我把使用python，shell實現streaming的過程，也即為map-reduce過程，整理如下： 1.如果資料不在hive裡面，而在

python庫--pandas--Series.str--字串處理

python內建字串處理方法 S: Series　　I: Index 方法返回值引數說明 .capitalize() S/I 將Series/Index中的字串大

Python 輸入輸出及字串處理

1.Python內建函式 Built-in Functions abs() dict()

python中字串處理

日常程式碼中經常要對字串做各種各樣的處理，python也有很多字串處理方法 #首字母大寫使用capitalizs = 'im OK's1 = s.capitalize() #全字母大寫使用upper s2 = s.upper() #全字母小寫 s3 = s.lower() #大小寫翻轉 s4 =

Python複雜場景下字串處理相關問題與解決技巧

1.如何拆分含有多種分隔符的字串¶ ''' 實際案例: 我們要把某個字串依據分隔符號拆分不同的欄位，該字串包含多種不同的分隔符，例如： s=’ab;cd|efg|hi,jkl|mn\topq

Python 字串處理

字串是 Python 中最常用的資料型別。如： S='ABCD_1234' 一、字串中的字元定位字串本質上就是單個字元組在的一個列表，可通過S[x]運算子指代相應字元，x標註在字元之前的位置，類似於打字的游標，代表該位置後的一個字元。第一個位置為0，S[0]表示字元'

python使用pandas模組實現檔案讀取、字串處理、去重排序、excel生成

最近學習python，用python實現一個小需求,最後寫入excel使用到pandas模組：某中學學生在500米短跑訓練比賽中的資料，體育老師把學生成績結果記錄在檔案中（studentdata.txt）,記錄格式如下：卡納瓦, 2001-11-8,2:27,2:33,

LintCode刷題指南：字串處理（C++，Python）

題目：兩個字串是變位詞題目難度：簡單題目描述：寫出一個函式 anagram(s, t) 判斷兩個字串是否可以通過改變字母的順序變成一樣的字串。解題思路： C++：引入雜湊的思維，這道題就迎刃而解了。 C++ Code： class Solution {public: /** * @par

python 正則表示式（三）字串處理

import re ''' 1）切割字串時，不確定空格的個數，如："sun today mood eath" ''' str1 = "sun today mood eath" print(re.split(r" +",str1)) ''' 2）字串的替換和修改 def su

[LeetCode] 010. Regular Expression Matching (Hard) (C++/Java/Python)

010.Regular_Expression_Matching (Hard) 連結：題意：給一個原串和一個正則表示式，問能不能匹配。分析：偷懶的方法是直接用語言自帶的正則實現。(Python 又是一句話 =w=)用 DFS 的方法可以用 DP 的方法用陣

【LeetCode & 劍指offer刷題】字串題17：19 正則表示式匹配（10. Regular Expression Matching）

【LeetCode & 劍指offer 刷題筆記】目錄（持續更新中...） 19 正則表示式匹配（hard，瞭解即可）題目描述請實現一個函式用來匹配包括'.'和'*'的正則表示式。模式中的字元'.'表示任意一個字元，而'*'表示它前面的字元可以出現任意次（包含0次）

LeetCode 10. Regular Expression Matching python特性、動態規劃、遞迴

前言本文主要提供三種不同的解法，分別是利用python的特性、動態規劃、遞迴方法解決這個問題使用python正則屬性 import re class Solution2: # @return a boolean def isM

python 字串處理及io處理常見問題

一、檔案讀寫（io）常見問題 1）將程式內部字串寫入檔案出現編碼錯誤將程式內的字串寫入檔案時，最好將字串解碼成二進位制，然後以二進位制方式寫入檔案中，這個時候檔案自己會對二進位制位元組進行編碼，將二進位制位元組編碼成字串。 &nb

Python的字串處理函式strip()

strip()函式的作用是去除字串中開頭或者結尾中所包含的指定字元，然後返回一個結果，但是原來字串的內容並不會改變。如果只是刪除單個指定的字元應該很好理解，如果刪除多個指定的字元，會得到一種什麼樣的結果呢？這裡我們以去除字串結尾部門的指定字元為例，原始碼如下 pri

Python通過正則表示式和字串處理獲取方式獲取所需子字串的方式

在爬蟲軟體時我們經常需要從url中尋找並獲取我們所需要的那一部分內容此例我們需要從網址new_url= "http://news.sina.com.cn/c/gat/2017-06-14/doc-ifyfzfyz4058260.shtml"中獲取 fyfzf

Python 字串處理特殊空格 \xc2\xa0 Non-breaking space

今天遇到一個問題，使用python的find函式尋找字串中的第一個空格時沒有找到正確的位置，例如： http://zc.whmc.edu.cn ==> 無法訪問的網站或無效的招標網站使用find(" ")函式尋找時找到的第一個空格對應在==>

python 學習筆記（4）解析和字串處理

宣告：本文系本人學習python3總結，如有侵權等，請及時告知；一、解析 1、os 模組 Python 3 帶有一個模組叫做 os，代表“作業系統(operating system)。匯入osmodule

字串處理神器——Python Regular Expression

1、EOJ 2897 英文縮寫詞

2、EOJ 3124 英文縮寫詞

3、EOJ 3143 純虛數的冪

4、EOJ 2959 正則表示式簡化版

相關推薦