7.2 正則貪婪模式

阿新 • • 發佈：2018-07-02

ret 關系數據庫 clas mys script ima pri split cdn

#coding=utf-8
#2018-7-2 11:25:00

import re
#寫一個郵箱正則
p = r"(\w+)@(163|126|gmail|qq)\.(com|cn|net)$"
r = re.match(p,"[email protected]")
print(r)
b = r.group()
print(b)
# (?P<name>) 分組起名字
#(?P = name) 引用別名為name分組匹配到字符串

s = "<html><h1>itcast</h1></html>"

c = re.match(r"<((?P<key1>).+)><(?P<key2>).+>.+</(?P=key2)></(?P=key1)> 
",s)
print(c )

#用sub講匹配到的數據進行替換

ret  = re.sub(r"\d+",‘988‘,‘python = 997‘)
print(ret )

#split 根據匹配進行切割字符串,並返回一個列表
s = "itcast:php,python,cpp-java"

a = re.split(r":|,|-",s)
print(a)

#python的貪婪模式
"""
三個引號之間部分python仍然可以讀取,
只是沒有運行,並且字符串保存格式
"""

f = """
<div>
        <p>崗位職責：</p>
<p>完成推薦算法、數據統計、接口、後臺等服務器端相關工作</p>
<p><br></p>
<p>必備要求：</p>
<p>良好的自我驅動力和職業素養，工作積極主動、結果導向</p>
<p>&nbsp;<br></p>
<p>技術要求：</p>
<p>1、一年以上 Python 開發經驗，掌握面向對象分析和設計，了解設計模式</p>
<p>2、掌握HTTP協議，熟悉MVC、MVVM等概念以及相關WEB開發框架</p>
<p>3、掌握關系數據庫開發設計，掌握 SQL，熟練使用 MySQL/PostgreSQL 中的一種<br></p>
<p>4、掌握NoSQL、MQ，熟練使用對應技術解決方案</p>
<p>5、熟悉 Javascript/CSS/HTML5，JQuery、React、Vue.js</p>
<p>&nbsp;<br></p>
<p>加分項：</p>
<p>大數據，數理統計，機器學習，sklearn，高性能，大並發。</p>

        </div>
 
"""
r = re.sub(r"<.+>","",f)  #非貪婪模式
print(r)

技術分享圖片

 1 #方法有很多種,要多動腦筋!!!
 2 
 3 #提取其中的url
 4 url = """<img data-original="https://rpic.douyucdn.cn/appCovers/2016/11/13/1213973_201611131917_small.jpg"
 5  src="https://rpic.douyucdn.cn/appCovers/2016/11/13/1213973_201611131917_small.jpg">
 6 """
 7 #當你拿到數據比較多,是因為貪婪模式在作怪 

 8 search  = re.search(r"https.+?\.jpg",url).group()
 9 print(search)
10 
11 #提取網站 http://www.interoem.com/
12 url1 = "http://www.interoem.com/messageinfo.asp?id=35"
13 #逆向:正解的時候後面一串不好提取,前面好提取,.
14 #所以先把前面定義好,然後用個匿名函數,去第一部分就好了
15 r2 = re.sub(r"(http://.+?/).*",lambda x: x.group(1),url1)
16 print(r2)
17 
18 word = "hello  world ha ha"
19 #從分隔符的角度
20 print(re.split(r" +",word))
21 #描述單詞特征的角度
22 print(re.findall(r"\b[a-zA-z]+\b",word))

7.2 正則貪婪模式

ret 關系數據庫 clas mys script ima pri split cdn #coding=utf-8 #2018-7-2 11:25:00 import re #寫一個郵箱正則 p = r"(\w+)@(163|126|gmail|qq)\.(com|cn

PHP正則貪婪/懶惰匹配模式

當正則表示式中包含能接受重複的限定符時，通常的行為是（在使整個表示式能得到匹配的前提下）匹配儘可能多的字元。例如以下表達式將匹配以a開始，以b結束的最長字串： a.*b 如果用來搜尋“aabab”，它會匹配整個字串“aabab”。這就是貪婪匹配。有時，需要匹配儘可能少的字

python 爬蟲2-正則表達式抓取拉勾網職位信息

headers mode data .cn 保存 time exc href ace import requestsimport re #正則表達式import time import pandas #保存成 CSV #header={‘User-Agent‘:‘M

Day9-2 正則工具簡介上

cto 以及取反 key grep eee fff 遍歷 har 正則一串有規律的字符串 grepegrep等效於grep -E grep ‘[word]‘ filename 列出文件中含有word的行-c 行數-i 不區分大小寫-n 顯示行號-v 取反（非目標行）-

8-2正則表達式元字符詳解 1

shell 正則表達式元字符表示前面的字符出現0到多次正則當中有幾個符號是為別人活著的.+表示前面的字符至少出現一次,但是”+”是擴展元字符,需要使用egrep,不能使用greprm -rf .pdf//刪除以.pdf結尾的所有文件或目錄grep ‘abc*’ /etc/passwd 在vi

正則入坑-2--正則結合awk、sed、grep、find、cut等使用

正則表達式 awk sed grep對文檔中目錄名進行替換#sed -e ‘s/\/home\/sxzhou/\/home\/SXZHOU/‘ < sed.txt 查找文件格式是txt和jpg格式的文件#find . ( -name ".txt" -o -name ".jp

吳恩達《機器學習》課程總結（7）正則化

額外分享哪些 TP 回歸分享圖片表現例子兩個 7.1過擬合的問題訓練集表現良好，測試集表現差。魯棒性差。以下是兩個例子（一個是回歸問題，一個是分類問題）解決辦法：（1）丟棄一些不能幫助我們正確預測的特征。可以使用工選擇保留哪些特征，或者使用一些模型選擇

PHP正則表示式模式引數詳解

i (PCRE_CASELESS) 如果設定此修正符，模式中的字元將同時匹配大小寫字母。 m（PCRE_MULTILINE）預設情況下，PCRE 將目標字串作為單一的一“行”字元所組成的（甚至其中包含有換行符也是如此）。“行起始”元字元（^）僅僅匹配字串的起始

2.正則表示式-完結

前言:內容包括正則表示式的子表示式，回溯引用，前後查詢，嵌入條件，以及例子的拆分介紹。如果文字描述有問題可以評論指出，如果概念很模糊，可以關注微信公眾號，JAVA知識總結與分享。子表示式介紹:把一個表示式劃分為多個子表示式，每個都是一個獨立的元素，相關元字元() 正則:\d{1,3}.\d{1,3}

10、常用API(2) & 正則

Date類：類 Date 表示特定的瞬間，精確到毫秒。Date是早期版本出現的，其API中有大量的過時方法，其許多方法由更為新的類Calendar類再次實現。 ☆常見方法：構造方法：public Date() //返回當前時間；public Date(lo

吳恩達深度學習2-Week1課後作業2-正則化

一、deeplearning-assignment 這一節作業的重點是理解各個正則化方法的原理，以及它們的優缺點，而不是去注重演算法實現的具體末節。問題陳述：希望你通過一個數據集訓練一個合適的模型，從而幫助推薦法國守門員應該踢球的位置，這樣法國隊的球員可以用頭打。法國過

《零基礎入門學習Python》第059講：論一隻爬蟲的自我修養7：正則表示式3

今天我們先接著上節課的內容，把 Python3 正則表示式特殊符號及用法（詳細列表）這個表格講完：上節課我們介紹了正則表示式的特殊字元中的元字元，正則表示式的特殊字元除了元字元之外呢，還有一種就是通過反斜槓加上一個普通字元組成的特殊符號。我們接下來談談它們的含義。 \序

吳恩達機器學習練習2——正則化的Logistic迴歸

機器學習練習2——正則化的Logistic迴歸過擬合如果我們有非常多的特徵，我們通過學習得到的假設可能能夠非常好地適應訓練集（代價函式可能幾乎為0），但是可能會不能推廣到新的資料。解決： 1.丟棄一些不能幫助我們正確預測的特徵。可以是手工選擇保留哪些特

一些常用的正則匹配模式

一、校驗數字的表示式數字：^[0-9]*$ n位的數字：^\d{n}$ 至少n位的數字：^\d{n,}$ m-n位的數字：^\d{m,n}$ 零和非零開頭的數字：^(0|[1-9][0-9]*)$ 非零開頭的最多帶兩位小數的數字：^([1-9][0-9]*)

2019/1.2/正則元字元方括號量詞

1.正則的方括號　　[abc]代表查詢方括號直接的任何字元　　[^abc]代表查詢任何一個不在方括號之間的字元　　[0-9]查詢0-9之間的字元　　[a-z]查詢小寫a到小寫z之間的任何字元　　[A-Z]查詢大寫A到大寫Z之間的任何字元　　[A-z]查詢大寫A到小寫z之間的任何字元

2019/1.2/正則的理解

1.var reg=/./　　var reg=/\./ 前者代表任何一個字元，後者代表這個字元中得有一個 2.？的使用如果單獨一個字元後面帶？ var reg=/\d?/ /n?/ 代表一個或0個字元的出現如果是量詞+和*，{2，}後面帶？取消正則的貪婪性

2019.1.7筆記正則表示式&DOM節點

一、Math 　　console.log(Math.E); 　　　　　　　　　　　　　　　　自然常數　　console.log(Math.PI);　　　　　　　　　　　　　　　　圓周率　　console.log(Math.abs(-12

正則表示式二匹配多個正則表示式模式

re1|re2表示匹配正則表示式re1或者re2 >>> m=re.match('ve|be','better') >>> print(m) <_

PHP正則-貪婪匹配(最大匹配) 和最小匹配的問題。

在抓取連結地址時，使用以下正則時發現，當在<a href="XXX">連結標題</a> 連結標題中含有HTML程式碼時，不能抓取到地址。 /<a[^>]+href=[/"/']{0,1}([^>/"/'/s]+)[/"/']{0,1}[^>]*>([^&g

springMVc @RequestMapping正則表示式模式的url

公司最近忙,好一些時間沒有寫了。今天寫一個springMVC的一個很普遍的知識。有時候大家可能會遇到如下問題； @RequestMapping(method = RequestMethod.GET,value="/{provinceId}_{levelId}.htm

7.2 正則貪婪模式

相關推薦