python正則匹配URL

阿新 • • 發佈：2018-12-22

正則匹配URL過程

獲得http請求頭的字串列表
正則匹配列表的第二個元素
判斷正則匹配結果

正則匹配url_demo

import re

def main():

	name = """
	GET / HTTP/1.1
	Host: 127.0.0.1:9999
	Connection: keep-alive
	Cache-Control: max-age=0
	Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0                                          .8
	Upgrade-Insecure-Requests: 1
	User-Agent: Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Geck                                          o) Chrome/50.0.2661.102 Safari/537.36
	Accept-Encoding: gzip, deflate, sdch
	Accept-Language: zh-CN,zh;q=0.8

	GET /favicon.ico HTTP/1.1
	Host: 127.0.0.1:9999
	Connection: keep-alive
	User-Agent: Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Geck                                          o) Chrome/50.0.2661.102 Safari/537.36
	Accept: */*
	Referer: http://127.0.0.1:9999/
	Accept-Encoding: gzip, deflate, sdch
	Accept-Language: zh-CN,zh;q=0.8

	"""
	# str.splitlines([keepends])
	# http://www.runoob.com/python3/python3-string-splitlines.html
	# keepends -- 在輸出結果裡是否去掉換行符('\r', '\r\n', \n')，預設為 False，不包含換行符，如果為 True，則保留換行符。

	# str1 = name.splitlines(True)
	# print("保留換行符結果：\n",str1)
	str2 = name.splitlines(False)
	# print("不保留換行符結果：\n",str2)
	url_name = re.match(r"[^/]+(/[^ ]*)",str2[1])
	if url_name:
		url_name = url_name.group(1)
		print("正則匹配到的結果是：",url_name)
	else:
		print("未成功匹配到資料")

	
if __name__ == '__main__':
	main()

執行結果

可以匹配到我們需要的url
在這裡插入圖片描述

學習資料：

python正則匹配URL

正則匹配URL過程獲得http請求頭的字串列表正則匹配列表的第二個元素判斷正則匹配結果正則匹配url_demo import re def main(): name = """ GET / HTTP/1.1 Host: 127.0.0.1:

python正則匹配——中文字符的匹配

pri bsp odi col div class cnblogs mat 結果 # -*- coding:utf-8 -*- import re ‘‘‘python 3.5版本正則匹配中文，固定形式：\u4E00-\u9FA5 ‘‘‘ words = ‘stud

python正則匹配內網IP

rex_ip = re.compile('^(127\\.0\\.0\\.1)|(localhost)|(10\\.\\d{1,3}\\.\\d{1,3}\\.\\d{1,3})|(172\\.((1[6-9])|(2\\d)|(3[01]))\\.\\d{1,3}\\.\\d{1,3}

利用正則匹配url是否合法對於有的url會浪費過長時間使程式卡死，切記！

改進：改成匹配url是否為以某個結尾的，至於非法的url就讓Jsoup.connect(url)把異常拋棄 //啟動該正則匹配特別的慢 // public static String regex = "^([hH][tT]{2}[pP]:/*|[hH][tT]{2}[pP][sS]

python 正則匹配中文字元

正則匹配中文，固定形式：\u4E00-\u9FA5 # -*- coding:utf-8 -*- import re ''' python 3.5版本 ''' words = 'study

python正則匹配目錄、檔名

#!/usr/bin/python # -*- coding: UTF-8 -*- # vim:set shiftwidth=2 tabstop=2 expandtab textwidth=79:

javascript 正則匹配url並新增標籤

//寫的url正則匹配 var reg = /((http|ftp|https):\/\/)?[\w\-_]+(\.[\w\-_]+)+([\w\-\.,@?^=%&:/~\+#]*[\w\-\@?^=%&/~\+#])?/g; //獲取需要

Python 正則匹配數字

電話號碼：\d{3}-\d{8}|\d{4}-\d{7} QQ號：[1-9][0-9]{4,} 中國郵政編碼：[1-9]\d{5}(?!\d) 身份證：\d{15}|\d{18} ip地址：\d+\.\d+\.\d+\.\d+ [1-9]\d*　正整數 -[1-9

javascript 正則匹配url的域名、檔名字

/** 獲取url的字尾名 */ function urlRegEx(url){ var urlRgx=/http(s)?:\/\/([\w-]+\.)+[\w-]+(\/[\w- .\/?%

Python正則匹配判斷手機號是否合法

正則表示式，又稱正規表示式、正規表示法、正規表示式、規則表示式、常規表示法（英語：Regular Expression，在程式碼中常簡寫為regex、regexp或RE），是電腦科學的一

python中正則匹配字符配置單詞邊界不生效的解決辦法

re python duoceshi #-*-coding:utf-8-*-import rename="duoceshi"p= re.compile(‘\bduoceshi\b‘)f = p.search(name)if f: print f.group()################

python正則表達式匹配十六進制數據

fin phy decimal 進制 ref check 十六 http ffi 1. Find any hexadecimal number in a larger body of text \b[0-9a-fA-F]+\b 2. Check whether a

Python 正則re匹配中文、英式數字

article 正則 find tin 中文自動 nbsp ont ron #coding:utf-8 import re s = u‘‘‘ 或多或少的好好讀書電鋸驚魂20202 和水電費後是否會時候1212沒收到風10.12海大富的是粉紅色的和辦法的1244525

Python正則表達式返回首次匹配到的字符及查詢的健壯性

ror exe https -m rec last first sta clas re.findall(pattern,string)會搜索所有匹配的字符，返回的是一個列表，獲取首個匹配需要re.findall(pattern,string)[0]訪問, 但是如果finda

Python: 正則表達式匹配反斜杠 ""

details 字符串 art tails spa .net python 正在 12px Python正則表達式匹配反斜杠 "\" eg: >>>a=‘w\w\w‘ ‘w\\w\\w‘　　# 打印出來的 "\\" 被轉義成一個反斜杠 "\" 如果需要

python 3.x 分析日誌的模塊（正則匹配）

默認值 .get 文件 file 打印 files 日誌當前表達式 #導入正則模塊 import re auth="no_shutdown_" ‘‘‘ 分析日誌的模塊，查找日誌中標誌性信息產生的次數 ‘‘‘ #定義你需要查找的對象的正則表達式wordcheck #需要分

Python: 正則表達式匹配多行，實現多行匹配模式

post 表達式包括實現 body 表達捕獲 blog class 1) 點（.）去匹配任意字符的時候，不能匹配換行符在這個模式中(?:.|\n)是指定了一個非捕獲組（僅僅用來做匹配，部能通過單獨捕獲或者編號的組） 2) re.DOTALL 　　re

python - re正則匹配模塊

電話 wide clas tdi 數字 cat gpo 掃描等價 re模塊 re 模塊使 Python 語言擁有全部的正則表達式功能。 compile 函數根據一個模式字符串和可選的標誌參數生成一個正則表達式對象。該對象擁有一系列方法用於正則表達式匹配和替換。 re 模塊

python正則表達式3-模式匹配

dex import mail blog 正則表達 gpo .cn span OS re.S，使 ‘.‘ 匹配換行在內的所有字符 >>> pattern=r‘ghostwu.com‘ >>> import re >>

python正則一些簡單匹配

元字符貪婪分組非貪婪元字符的使用re.findall(regex,string)功能：在string字符串中，匹配regex正則表達式能夠匹配的項，放到一個列表中返回* 普通字符串元字符：abc 匹配規則：匹配字符串的值匹配示例：abc In [3]: re.findall

python正則匹配URL

正則匹配URL過程

正則匹配url_demo

執行結果

學習資料：

相關推薦