2018年4月28日筆記

阿新 • • 發佈：2018-04-30

you 替換其他 pytho HERE art group 結果圖片

正則表達式

技術分享圖片

數量詞的貪婪模式與非貪婪模式

Python中數量詞默認是貪婪的，總是嘗試匹配盡可能多的字符

例如，正則表達式 "ab*" 如果用於查找 "abbbc"，將匹配到 "abbb"；如果是非貪婪方式，則會匹配到 "a"

註意：

+或*後跟？表示非貪婪匹配，即盡可能少的匹配

.*? 表示匹配任意數量的重復，但是在能使整個匹配成功的前提下使用最少的重復

如：a.*?b匹配最短的，以a開始，以b結束的字符串。如果把它應用於aabab的話，它會匹配aab和ab

re 模塊

Python通過re模塊提供對正則表達式的支持.

使用re的一般步驟是先將正則表達式的字符串形式編譯為Pattern實例，然後使用Pattern實例處理文本並獲得匹配結果（一個Match實例），最後使用Match實例獲得信息，進行其他的操作

re模塊常用的方法有：re.compile()　　re.match()　　re.search()　　re.findall　　re.split()　　re.group()

re.compile()

compile()函數用於編譯正則表達式，生成一個正則表達式(Pattern)對象，供match()和search()這兩個函數使用

語法格式為：

　　re.compile(pattern [, flags])

參數：

　　patten　　：一個字符串形式的正則表達式

　　flags　　：可選，表示匹配模式，具體有以下6中模式

re.I　　忽略大小寫
re.L　　表示特殊字符集 \w, \W, \b, \B, \s, \S 依賴於當前環境

re.M　　多行模式
re.S　　即為. 並且包括換行符在內的任意字符（. 不包括換行符）
re.U　　表示特殊字符集 \w, \W, \b, \B, \d, \D, \s, \S 依賴於 Unicode 字符屬性數據庫
re.X　　為了增加可讀性，忽略空格和 # 後面的註釋

 1 import re
 2 
 3 pattern = re.compile(r"\d+")    # 用於匹配至少一個數字
 4                                 # 沒匹配到返回None,否則返回一個Match對象
 5 r1 = pattern.match("one12twothree34four 
")
 6 print(r1)
 7 
 8 r2 = pattern.match("one12twothree34four", 2, 10)
 9 print(r2)
10 
11 r3 = pattern.match("one12twothree34four", 3, 10)
12 print(r3)
13 print(type(r3))
14 
15 print("\n")
16 print(r3.group())   # group()方法用於獲得獲得整個匹配的子串
17 print(r3.start())   # start()獲取匹配字串在整個字符串中的起始位置(子串第一個字符的索引)
18 print(r3.end())     # end()獲取匹配字串在整個字符串中的結束位置(子串最後一個字符的索引+1)
19 print(r3.span())    # span()方法返回 (start(group), end(group))

None
None
<_sre.SRE_Match object; span=(3, 5), match=‘12‘>
<class ‘_sre.SRE_Match‘>


12
3
5
(3, 5)

re.match()

re.match 只從字符串的起始位置匹配一個模式

匹配成功re.match方法返回一個匹配的對象，否則返回None

使用group(num) 或 groups() 匹配對象函數來獲取匹配表達式

 1 import re
 2 
 3 string = "You are beautiful yeah hahaha!"
 4 pattern = r"(.*) are (.*?) (.*)"
 5 m = re.match(pattern, string)
 6 
 7 if m:
 8     print("matchObj.group(): {0}".format(m.group()))
 9     print("matchObj.group(1): {0}".format(m.group(1)))
10     print("matchObj.group(2): {0}".format(m.group(2)))
11     print("matchObj.group(3): {0}".format(m.group(3)))
12 else:
13     print("No match !")
14 
15 print("matchObj.groups: {0}".format(m.groups()))

matchObj.group(): You are beautiful yeah hahaha!
matchObj.group(1): You
matchObj.group(2): beautiful
matchObj.group(3): yeah hahaha!
matchObj.groups: (‘You‘, ‘beautiful‘, ‘yeah hahaha!‘)

re.search()

re.search() 掃描整個字符串並返回第一個成功的匹配

1 import re
2 
3 print(re.search("here", "here you are").span())
4 print(re.search("here", "you are here").span())

(0, 4)
(8, 12)

re.match() 與 re.search() 的區別

re.match只匹配字符串的開始，如果字符串開始不符合正則表達式，則匹配失敗，函數返回None；而re.search匹配整個字符串，直到找到一個匹配

re.findall()

在字符串中找到正則表達式所匹配的所有子串，並返回一個列表，如果沒有找到匹配的，則返回空列表

註意： match() 和 search() 只匹配1次；而 findall() 會匹配所有

 1 import re
 2 
 3 pattern = re.compile(r"\d+")
 4 string = "1one2two3three4four"
 5 
 6 r1 = pattern.findall(string)
 7 r2 = pattern.findall(string, 5, 15)
 8 
 9 print(r1)
10 print(r2)

[‘1‘, ‘2‘, ‘3‘, ‘4‘]
[‘3‘, ‘4‘]

re.split()

split()方法按照能夠匹配的子串將字符串分割後返回列表

1 import re
2 
3 string = "1one# 2two# 3three# 4four# 5#"
4 print(re.split(" ", string))            # 按空格切
5 print(re.split("#", string))            # 按"#"切

[‘1one#‘, ‘2two#‘, ‘3three#‘, ‘4four#‘, ‘5#‘]
[‘1one‘, ‘ 2two‘, ‘ 3three‘, ‘ 4four‘, ‘ 5‘, ‘‘]

re.sub()

re.sub()用於替換字符串中的匹配項

 1 import re
 2 
 3 phone = "2004-959-559  # 這是一個國際號碼"
 4 
 5 # 刪除字符串中的註釋
 6 r1 = re.sub(r"#.*$", "", phone)
 7 print(r1)
 8 
 9 # 刪除非數字的字符串
10 r2 = re.sub("\D", "", phone)
11 print(r2)

2004-959-559  
2004959559

2018年4月28日筆記

you 替換其他 pytho HERE art group 結果圖片正則表達式數量詞的貪婪模式與非貪婪模式 Python中數量詞默認是貪婪的，總是嘗試匹配盡可能多的字符例如，正則表達式 "ab*" 如果用於查找 "abbbc"，將匹配到 "abb

2018年4月10日筆記

統計輸入 ima info mage 情況中文字符串哈哈習題求階乘 Python的編碼常見的支持中文的編碼有：utf-8 , gbk , gb2312 常見術語：decode(解碼) ， encode(編碼) 在Python2中，不寫python代碼擡頭，在p

2018年4月14日筆記

生成 gen ever yield com 分享高階函數 iter tor 函數關鍵字 def　　函數聲明 return　　返回值 pass　　略過，啥也不幹 exit(1)　　直接退出高階函數：可接收另一個函數作為參數的函數常用的高階函數有： map(

2018年4月19日筆記

基類型號查找參數字母 pass DC super clas 類的概念與聲明類(class)：用來描述具有相同屬性和方法的對象的集合。一個類定義了該集合中每個對象所共有的屬性和方法。對象是類的實例(instance)。聲明一個類的一般形式如下：　　c

2018年4月26日筆記

關系 run 用法示例 a+b += .get 是否 hashlib 16進制內置模塊：hashlib Python的hashlib提供了常見的摘要算法，如md5，sha1, sha224, sha256, sha384, sha512等等，其中md5最為常用。什麽

JAVA多執行緒雜學4-2018年10月28日

volatile的應用在多執行緒併發程式設計中synchronized和volatile都扮演著重要的角色，volatile是輕量級的synchronized，它在多處理器開發中保證了共享變數的“可見性”。可見性的意思是當一個執行緒修改一個共享變數時，另外一個執行緒能讀到

2018年4月2日推薦文章精選 “推薦好文，一篇看盡”

好文精選推薦精選好文推薦記錄一次郵件容災恢復過程作者：Juck_Zhang簡介：客戶目前使用的是Exchange Server 2013,兩前兩後，數據盤是存儲掛載過來的，郵件備份使用的是NBU，由於機房漏水，導致存儲服務器宕機。導致絕大部分數據丟失。 Nginx+Tomcat+me

2018年4月12日--python

模式 class line col 換行符指針 file read code Pyhon3 -- 文件操作文件的打開與關閉 open()打開文件；close()關閉文件。打開文件必須要關閉文件，所以open()和close()為成對使用。 open()參數意思。

2018年4月17日JAVA

lin 如意框架整形 aslist 內部類 get_id modify i++ JAVA中的集合類: JAVA中的集合類，是一種工具類，，就像是容器，存儲任意數量的具有共同屬性的對象。集合的作用：一、在類的內部對數據進行組織（如果

2018年4月16日第二階段項目整理

模糊年收入重要其中 mes 可靠性 min dom 處理項目名稱：管家婆記賬軟件產品詳情：使用技術：JavaSE、Mysql。運行環境：Windows 需求簡介：隨著“後理財時代”的到來，“你不理財，財不理你”成為人們常掛在嘴邊的一句口頭禪，個人理財的重

2018年4月23日JAVA

hashtable dir 今天為我 strong otf IT boolean str 一、Java Properties類 Java中有個比較重要的類Properties（Java.util.Properties），主要用於讀取Java的配置文件，各種語言都有

2018年4月24日JAVA

導致神器 original 出了 join() 是個 yield方法效率超時時間多線程用多線程只有一個目的，那就是更好的利用cpu的資源，因為所有的多線程代碼都可以用單線程來實現。說這個話其實只有一半對，因為反應“多角色”的程序代碼，最起碼每個角色要給他一個線程吧

2018年5月3日筆記

表達 pst .text mkdir html str fin 字符串文件常用的正則表達式匹配規則 \d　　表示一個數字字符，等價於 [0-9] \D　　表示一個非數字字符，等價於 [^\d] \s　　表示一個空白字符，等價於 [<空格>\t\r\n\f

2018年5月8日筆記

grep 字節 width RoCE system ID 字符串類型工作 abs CentOS 7上安裝mysql # CentOS 7 安裝mysql 1. 檢測系統是否自帶安裝 mysql rpm -qa | grep mysql 2. 若已安裝，可以進行卸

2018年5月10日筆記

conn imp key port 學生但是 not oot mysql 在Python中如何表示數據庫表方法一：由於數據庫表是一個二維表，所以可用list表示多行，list的每個元素是tuple，表示一行記錄如：有一張學生信息表，包含學生的學號，姓名，年齡，可表

2018年5月13日筆記

class leg 刪除 pass ota pan where ide maker SQL語句復習創建一個庫 create database DB_name; 授權一個用戶 grant all privileges on *.* to ‘user1‘@‘%‘ ide

2018年5月17日筆記

最大返回值 onf delete 常用操作 all 描述 app 筆記 python操作redis set操作 sadd(name, values)　　增加 scard(name)　　　　獲取 spop(name)　　　　刪除並返回set中的一個隨機元素 srem(n

2018年5月19日筆記

共享內存 main 多核cpu 需要 target 創建 uil out lease 進程的概念進程是程序在計算機上的一次執行活動。進程可分為系統進程和用戶進程。所有正在運行的進程輪流使用CPU，任何一個時間點有且只有一個進程占用CPU。進程與線程的區

2018年5月22日筆記

req 阻塞 OS rom ron fun star 因此 -- Python共享內存共享內存有兩個結構，一個是 Value, 一個是 Array，這兩個結構內部都實現了鎖機制，因此是多進程安全的。 Value 和 Array 都需要設置其中存放值的類型，d 是 do

2018年5月26日筆記

tin eas 配置 sel utc zone result config AS 習題1 先在utils.py文件中定義一個工具類 1 # utils.py 2 3 import os 4 import threading 5 import codecs

2018年4月28日筆記

相關推薦