【作業】python實驗3【正則表示式】

阿新 • • 發佈：2019-02-01

1. 匹配網址

有一批網址：
http://www.interoem.com/messageinfo.asp?id=35
http://3995503.com/class/class09/news_show.asp?id=14
http://lib.wzmc.edu.cn/news/onews.asp?id=769
http://www.zy-ls.com/alfx.asp?newsid=377&id=6
http://www.fincm.com/newslist.asp?id=415

需要正則後為：

http://www.interoem.com/
http://3995503.com/
http://lib.wzmc.edu.cn/
http://www.zy-ls.com/
http://www.fincm.com/

import re
S=['http://www.interoem.com/messageinfo.asp?id=35'
   ,'http://3995503.com/class/class09/news_show.asp?id=14',
   'http://lib.wzmc.edu.cn/news/onews.asp?id=769',
   'http://www.zy-ls.com/alfx.asp?newsid=377&id=6',
   'http://www.fincm.com/newslist.asp?id=415']
for i in S:
    t=re.sub(r'(\.com/.+)','.com/',i)
    if t==i:
        t=re.sub(r'(\.cn/.+)','.cn/',i)
    print(t)

2. 查詢所有的單詞

import re
str="hello world ha ha"
pat='[a-zA-Z]+'
ans=re.findall(pat,str)
print(ans)

3. 匹配用一個空格分隔的任意一對單詞，比如，名和姓

"3. 匹配用一個空格分隔的任意一對單詞，比如，名和姓"
import re
test="Lu Xun is a famous writer"
ans=re.findall('[a-zA-Z]+',test)
print(ans)

4. 匹配所有合法的Python識別符號

"""4. 匹配所有合法的Python識別符號"""
import re
str=input("請輸入一串字串")
str=str.split()
pat=re.compile(r'^[_a-zA-Z]\w*$')
ans=[]
for i in str :
    t=pat.findall(i)
    ans.extend(t)
print(ans)
"""abc _123 123 a_b"""

5. 匹配合法的ip地址```

"5. 匹配合法的ip地址```"
"""'^\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}$'"""
import re
test=["192.168.1.1","192.165.2.3","123.4.5","192.168.3,1"]
ans=[]
pat=re.compile(r'^\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}$')
for i in test:
    t=pat.findall(i)
    ans.extend(t)
print(ans)

6. 匹配所有合法的電子郵件地址(先寫出一個限制比較寬鬆的正則表示式，然後儘可能加強限制條件，但要保證功能的正確性)。

"""6. 匹配所有合法的電子郵件地址
(先寫出一個限制比較寬鬆的正則表示式，
然後儘可能加 強限制條件，但要保證功能的正確性)。 
"""

"""
'^\[email protected](\w+\.)+\w+$'
"""
import re
test=["[email protected]","[email protected]"]
ans=[]
pat=re.compile(r'^\[email protected]\w+\.+\w+$')
for i in test:
    t=pat.findall(i)
    ans.extend(t)
print(ans)

7. 將一篇中文文章中的電子郵件地址替換為你自己的電子郵件地址

"""
7. 將一篇中文文章中的電子郵件地址替換為你自己的電子郵件地址
"""

"""
'^\[email protected]\w+\.+\w+$'
"""
import re
test="示例 ： 請替換 電子郵箱 [email protected]"
print(test)
pat=re.compile(r'\[email protected]\w+\.+\w+',re.I)
t=pat.sub('[email protected]',test)
print(t)

8. 取出屬性data-original對應的url

<imgdata-original="https://rpic.douyucdn.cn/z1609/07/15/478748_160907150833.jpg" src="https://rpic.douyucdn.cn/z1609/07/15/478748_160907150833.jpg" style="display: block;">

"""
8.取出屬性data-original對應的url
"""
import re
test="<img data-original=\"https://rpic.douyucdn.cn/z1609/07/15/478748_160907150833.jpg\" src=\"https://rpic.douyucdn.cn/z1609/07/15/478748_160907150833.jpg\" style=\"display: block;\">"
print(test)
pat='<img data-original=\"(.+)\" src=\"(.+)\" style=\"display: block;\">'
result=re.search(pat,test)
t1=result.group(1)
t2=result.group(2)
print(" data-original "+t1)
print(" src "+t2)

【作業】python實驗3【正則表示式】

1. 匹配網址

2. 查詢所有的單詞

3. 匹配用一個空格分隔的任意一對單詞，比如，名和姓

4. 匹配所有合法的Python識別符號

5. 匹配合法的ip地址```

6. 匹配所有合法的電子郵件地址(先寫出一個限制比較寬鬆的正則表示式，然後儘可能加強限制條件，但要保證功能的正確性)。

7. 將一篇中文文章中的電子郵件地址替換為你自己的電子郵件地址

8. 取出屬性data-original對應的url

【作業】python實驗3【正則表示式】

【python 正則表示式】python正則表示式提取郵箱、網址、手機號、ip地址

135.Python修煉之路【140-前端-JQuery-正則表示式】2018.08.04

【傑瑞的專欄】架構師、指令碼語言專家；精通Python、Shell、正則表示式；熟悉Java、C、Tcl、Ruby、Scala、Perl等多種程式語言；在效能，開源，自動化測試方面有非常豐富的經驗

【爬蟲入門】【正則表示式】抓取糗事百科的段子3.0

【Regex】初試Python下的中文正則表示式

一些我經過驗證的-有效的-【正則表示式】-JAVA

【正則表示式】Python3中的正則表示式

【java 正則表示式】java正則表示式匹配圖片個數

【劍指offer】面試題19：正則表示式匹配

【爬蟲入門】【正則表示式】【非同步】爬取人人車車輛資訊1.0

【爬蟲入門】【正則表示式】【同步】爬取人人車車輛資訊1.0

【爬蟲入門】【正則表示式】抓取白敬亭貼吧某個帖子下的圖片2.0

【爬蟲入門】【正則表示式】抓取糗事百科的段子2.0

【爬蟲入門】【正則表示式】【Json】抓取CSDN最新文章

【正則表示式】-基礎

【正則表示式】自動生成各類正則程式碼

【leetcode】10. Regular Expression Matching正則表示式匹配

【正則表示式】——限制只能輸入數字和小數點及位數

【轉載】萬用字元與正則表示式

【作業】python實驗3【正則表示式】

1. 匹配網址

2. 查詢所有的單詞

3. 匹配用一個空格分隔的任意一對單詞，比如，名和姓

4. 匹配所有合法的Python識別符號

5. 匹配合法的ip地址```

6. 匹配所有合法的電子郵件地址(先寫出一個限制比較寬鬆的正則表示式，然後儘可能加 強限制條件，但要保證功能的正確性)。

7. 將一篇中文文章中的電子郵件地址替換為你自己的電子郵件地址

8. 取出屬性data-original對應的url

相關推薦

6. 匹配所有合法的電子郵件地址(先寫出一個限制比較寬鬆的正則表示式，然後儘可能加強限制條件，但要保證功能的正確性)。