re模塊、os模塊、subprocess模塊

阿新 • • 發佈：2018-06-25

環境變量 posix python解釋器 ins 調用與操作結果註冊非貪婪

一、re模塊

1、什麽是正則
    正則就是用一系列具有特殊含義的字符組成一套規則，該規則用來描述具有某一特征的字符串，
    正則就是用來去一個大的字符串中匹配出符合規則的子字符串

2、為什麽要用正則
    1、用戶註冊
    2、爬蟲程序

3、如何用正則

技術分享圖片

# =================================匹配模式=================================
#一對一的匹配
# ‘hello‘.replace(old,new)
# ‘hello‘.find(‘pattern‘)

#正則匹配
import re
#\w與\W
print 
(re.findall(‘\w‘,‘hello egon 123‘)) #[‘h‘, ‘e‘, ‘l‘, ‘l‘, ‘o‘, ‘e‘, ‘g‘, ‘o‘, ‘n‘, ‘1‘, ‘2‘, ‘3‘]
print(re.findall(‘\W‘,‘hello egon 123‘)) #[‘ ‘, ‘ ‘]

#\s與\S
print(re.findall(‘\s‘,‘hello  egon  123‘)) #[‘ ‘, ‘ ‘, ‘ ‘, ‘ ‘]
print(re.findall(‘\S‘,‘hello  egon  123‘)) #[‘h‘, ‘e‘, ‘l‘, ‘l‘, ‘o‘, ‘e‘, ‘g‘, ‘o‘, ‘n‘, ‘1‘, ‘2‘, ‘3‘] 


#\n \t都是空,都可以被\s匹配
print(re.findall(‘\s‘,‘hello \n egon \t 123‘)) #[‘ ‘, ‘\n‘, ‘ ‘, ‘ ‘, ‘\t‘, ‘ ‘]

#\n與\t
print(re.findall(r‘\n‘,‘hello egon \n123‘)) #[‘\n‘]
print(re.findall(r‘\t‘,‘hello egon\t123‘)) #[‘\n‘]

#\d與\D
print(re.findall(‘\d‘,‘hello egon 123‘)) #[‘1‘, ‘2‘, ‘3‘]
print(re.findall(‘ 
\D‘,‘hello egon 123‘)) #[‘h‘, ‘e‘, ‘l‘, ‘l‘, ‘o‘, ‘ ‘, ‘e‘, ‘g‘, ‘o‘, ‘n‘, ‘ ‘]

#\A與\Z
print(re.findall(‘\Ahe‘,‘hello egon 123‘)) #[‘he‘],\A==>^
print(re.findall(‘123\Z‘,‘hello egon 123‘)) #[‘he‘],\Z==>$

#^與$
print(re.findall(‘^h‘,‘hello egon 123‘)) #[‘h‘]
print(re.findall(‘3$‘,‘hello egon 123‘)) #[‘3‘]

# 重復匹配：| . | * | ? | .* | .*? | + | {n,m} |
#.
print(re.findall(‘a.b‘,‘a1b‘)) #[‘a1b‘]
print(re.findall(‘a.b‘,‘a1b a*b a b aaab‘)) #[‘a1b‘, ‘a*b‘, ‘a b‘, ‘aab‘]
print(re.findall(‘a.b‘,‘a\nb‘)) #[]
print(re.findall(‘a.b‘,‘a\nb‘,re.S)) #[‘a\nb‘]
print(re.findall(‘a.b‘,‘a\nb‘,re.DOTALL)) #[‘a\nb‘]同上一條意思一樣

#*
print(re.findall(‘ab*‘,‘bbbbbbb‘)) #[]
print(re.findall(‘ab*‘,‘a‘)) #[‘a‘]
print(re.findall(‘ab*‘,‘abbbb‘)) #[‘abbbb‘]

#?
print(re.findall(‘ab?‘,‘a‘)) #[‘a‘]
print(re.findall(‘ab?‘,‘abbb‘)) #[‘ab‘]
#匹配所有包含小數在內的數字
print(re.findall(‘\d+\.?\d*‘,"asdfasdf123as1.13dfa12adsf1asdf3")) #[‘123‘, ‘1.13‘, ‘12‘, ‘1‘, ‘3‘]

#.*默認為貪婪匹配
print(re.findall(‘a.*b‘,‘a1b22222222b‘)) #[‘a1b22222222b‘]

#.*?為非貪婪匹配：推薦使用
print(re.findall(‘a.*?b‘,‘a1b22222222b‘)) #[‘a1b‘]

#+
print(re.findall(‘ab+‘,‘a‘)) #[]
print(re.findall(‘ab+‘,‘abbb‘)) #[‘abbb‘]

#{n,m}
print(re.findall(‘ab{2}‘,‘abbb‘)) #[‘abb‘]
print(re.findall(‘ab{2,4}‘,‘abbb‘)) #[‘abb‘]
print(re.findall(‘ab{1,}‘,‘abbb‘)) #‘ab{1,}‘ ===> ‘ab+‘
print(re.findall(‘ab{0,}‘,‘abbb‘)) #‘ab{0,}‘ ===> ‘ab*‘

#[]
print(re.findall(‘a[1*-]b‘,‘a1b a*b a-b‘)) #[]內的都為普通字符了，且如果-沒有被轉意的話，應該放到[]的開頭或結尾
print(re.findall(‘a[^1*-]b‘,‘a1b a*b a-b a=b‘)) #[]內的^代表的意思是取反，所以結果為[‘a=b‘]
print(re.findall(‘a[0-9]b‘,‘a1b a*b a-b a=b‘)) #[]內的^代表的意思是取反，所以結果為[‘a=b‘]
print(re.findall(‘a[a-z]b‘,‘a1b a*b a-b a=b aeb‘)) #[]內的^代表的意思是取反，所以結果為[‘a=b‘]
print(re.findall(‘a[a-zA-Z]b‘,‘a1b a*b a-b a=b aeb aEb‘)) #[]內的^代表的意思是取反，所以結果為[‘a=b‘]

#\# print(re.findall(‘a\\c‘,‘a\c‘)) #對於正則來說a\\c確實可以匹配到a\c,但是在python解釋器讀取a\\c時，會發生轉義，然後交給re去執行，所以拋出異常
print(re.findall(r‘a\\c‘,‘a\c‘)) #r代表告訴解釋器使用rawstring，即原生字符串，把我們正則內的所有符號都當普通字符處理，不要轉義
print(re.findall(‘a\\\\c‘,‘a\c‘)) #同上面的意思一樣，和上面的結果一樣都是[‘a\\c‘]

#():分組
print(re.findall(‘ab+‘,‘ababab123‘)) #[‘ab‘, ‘ab‘, ‘ab‘]
print(re.findall(‘(ab)+123‘,‘ababab123‘)) #[‘ab‘]，匹配到末尾的ab123中的ab
print(re.findall(‘(?:ab)+123‘,‘ababab123‘)) #findall的結果不是匹配的全部內容，而是組內的內容,?:可以讓結果為匹配的全部內容
print(re.findall(‘href="(.*?)"‘,‘<a href="http://www.baidu.com">點擊</a>‘))#[‘http://www.baidu.com‘]
print(re.findall(‘href="(?:.*?)"‘,‘<a href="http://www.baidu.com">點擊</a>‘))#[‘href="http://www.baidu.com"‘]

#|
print(re.findall(‘compan(?:y|ies)‘,‘Too many companies have gone bankrupt, and the next one is my company‘))

re模塊提供的方法介紹

# ===========================re模塊提供的方法介紹===========================
import re
#1
print(re.findall(‘e‘,‘alex make love‘) )   #[‘e‘, ‘e‘, ‘e‘],返回所有滿足匹配條件的結果,放在列表裏
#2
print(re.search(‘e‘,‘alex make love‘).group()) #e,只到找到第一個匹配然後返回一個包含匹配信息的對象,該對象可以通過調用group()方法得到匹配的字符串,如果字符串沒有匹配，則返回None。

#3
print(re.match(‘e‘,‘alex make love‘))    #None,同search,不過在字符串開始處進行匹配,完全可以用search+^代替match

#4
print(re.split(‘[ab]‘,‘abcd‘))     #[‘‘, ‘‘, ‘cd‘]，先按‘a‘分割得到‘‘和‘bcd‘,再對‘‘和‘bcd‘分別按‘b‘分割

#5
print(‘===>‘,re.sub(‘a‘,‘A‘,‘alex make love‘)) #===> Alex mAke love，不指定n，默認替換所有
print(‘===>‘,re.sub(‘a‘,‘A‘,‘alex make love‘,1)) #===> Alex make love
print(‘===>‘,re.sub(‘a‘,‘A‘,‘alex make love‘,2)) #===> Alex mAke love
print(‘===>‘,re.sub(‘^(\w+)(.*?\s)(\w+)(.*?\s)(\w+)(.*?)$‘,r‘\5\2\3\4\1‘,‘alex make love‘)) #===> love make alex

print(‘===>‘,re.subn(‘a‘,‘A‘,‘alex make love‘)) #===> (‘Alex mAke love‘, 2),結果帶有總共替換的個數


#6
obj=re.compile(‘\d{2}‘)

print(obj.search(‘abc123eeee‘).group()) #12
print(obj.findall(‘abc123eeee‘)) #[‘12‘],重用了obj

二、os模塊

1. os模塊是與操作系統交互的一個接口

os.getcwd() 獲取當前工作目錄，即當前python腳本工作的目錄路徑
os.chdir("dirname")  改變當前腳本工作目錄；相當於shell下cd
os.curdir  返回當前目錄: (‘.‘)
os.pardir  獲取當前目錄的父目錄字符串名：(‘..‘)
os.makedirs(‘dirname1/dirname2‘)    可生成多層遞歸目錄
os.removedirs(‘dirname1‘)    若目錄為空，則刪除，並遞歸到上一級目錄，如若也為空，則刪除，依此類推
os.mkdir(‘dirname‘)    生成單級目錄；相當於shell中mkdir dirname
os.rmdir(‘dirname‘)    刪除單級空目錄，若目錄不為空則無法刪除，報錯；相當於shell中rmdir dirname
os.listdir(‘dirname‘)    列出指定目錄下的所有文件和子目錄，包括隱藏文件，並以列表方式打印
os.remove()  刪除一個文件
os.rename("oldname","newname")  重命名文件/目錄
os.stat(‘path/filename‘)  獲取文件/目錄信息
os.sep    輸出操作系統特定的路徑分隔符，win下為"\\",Linux下為"/"
os.linesep    輸出當前平臺使用的行終止符，win下為"\t\n",Linux下為"\n"
os.pathsep    輸出用於分割文件路徑的字符串 win下為;,Linux下為:
os.name    輸出字符串指示當前使用平臺。win->‘nt‘; Linux->‘posix‘
os.system("bash command")  運行shell命令，直接顯示
os.environ  獲取系統環境變量
os.path.abspath(path)  返回path規範化的絕對路徑
os.path.split(path)  將path分割成目錄和文件名二元組返回
os.path.dirname(path)  返回path的目錄。其實就是os.path.split(path)的第一個元素
os.path.basename(path)  返回path最後的文件名。如何path以／或\結尾，那麽就會返回空值。即os.path.split(path)的第二個元素
os.path.exists(path)  如果path存在，返回True；如果path不存在，返回False
os.path.isabs(path)  如果path是絕對路徑，返回True
os.path.isfile(path)  如果path是一個存在的文件，返回True。否則返回False
os.path.isdir(path)  如果path是一個存在的目錄，則返回True。否則返回False
os.path.join(path1[, path2[, ...]])  將多個路徑組合後返回，第一個絕對路徑之前的參數將被忽略
os.path.getatime(path)  返回path所指向的文件或者目錄的最後存取時間
os.path.getmtime(path)  返回path所指向的文件或者目錄的最後修改時間
os.path.getsize(path) 返回path的大小


2.os模塊處理路徑方法：

方式一：
import os
具體應用
import os,sys
possible_topdir = os.path.normpath(os.path.join(
    os.path.abspath(__file__),
    os.pardir, #上一級
    os.pardir,
    os.pardir
))
sys.path.insert(0,possible_topdir)


方式二：
os.path.dirname(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))

三、suprocess模塊

import subprocess

obj=subprocess.Popen(‘dir‘,
                     shell=True,
                     stdout=subprocess.PIPE,
                     stderr=subprocess.PIPE
                     )

# print(obj)

res1=obj.stdout.read()
print(‘正確結果1111: ‘,res1)

res2=obj.stdout.read()
print(‘正確結果2222: ‘,res2) #只能取一次，取走了就沒有了

# res2=obj.stderr.read()
# print(‘錯誤結果：‘,res2.decode(‘gbk‘)

re模塊、os模塊、subprocess模塊

環境變量 posix python解釋器 ins 調用與操作結果註冊非貪婪一、re模塊 1、什麽是正則正則就是用一系列具有特殊含義的字符組成一套規則，該規則用來描述具有某一特征的字符串，正則就是用來去一個大的字符串中匹配出符合規則的子字符串2、為

Python基礎（11）_python模塊之time模塊、rando模塊、hashlib、os模塊

路徑固定 val 登錄密碼 rand getcwd ges ble sun 一、模塊 1、什麽是模塊：一個模塊就是一個包含了python定義和聲明的文件，文件名就是模塊名字加上.py的後綴　　模塊的本質：模塊的本質是一個py文件 2、模塊分為三類：1）內置模塊；2）第三

Python--模塊之time、random、os、hashlib

常用 alex hex imp 分割 isa port 計算機存在一、 time模塊表示時間我們通常用三種形式：時間戳(timestamp)：通常來說，時間戳表示的是從1970年1月1日00:00:00開始按秒計算的偏移量。我們運行“type(time.time(

python全棧開發【第十篇】Python常用模塊二（時間、random、os、sys和序列化）

utc時間用戶這也文件名 password 如何 json字符串並且持久一、time模塊表示時間的三種方式：　　時間戳：數字（計算機能認識的）　　時間字符串：t=‘2012-12-12‘ 　　結構化時間：time.struct_time(tm_year=2

python之文件操作、OS模塊、面向對象

文件系統、OS、面向對象一文件操作 1 文件系統和文件在磁盤上讀寫文件的功能都是由操作系統提供的，現代操作系統不允許普通的程序直接操作磁盤，所以，讀寫文件就是請求操作系統打開一個文件對象（通常稱為文件描述符），然後，通過操作系統提供的接口從這個文件對象中讀取數據（讀文件），或者把數據寫入這個文件對象（寫文

python-time模塊、sys模塊、os模塊以及大量實例

def 令行對象格式 back 修改時間 dir %s 相關 python 模塊通俗的說模塊就把一個已經寫好的帶有可使用的函數的文件，通過文件名進行導入，然後調用裏面的函數等來完成所需功能，模塊封裝了你需要實現功能的代碼，使用者只需調用即可，簡化代碼量，縮短編程

python—— 文件的打開模式和文件對象方法 & os、os.path 模塊中關於文件、目錄常用的函數使用方法

fis fish forum mod 工作 tps 使用方法 tid 常用　　引用自“魚c工作室” 文件的打開模式和文件對象方法：　　https://fishc.com.cn/forum.php?mod=viewthread&tid=45279&am

python-時間模塊,random、os、sys、shutil、json和pickle模塊

第一個 class 發生 float trac 模擬總結 shuffle 刪除一、time與datetime模塊 time模塊: 　　時間戳:表示的是從1970年1月1日00:00:00開始按秒計算的偏移量,返回類型為float類型　　格式化時間字符串(Form

進擊的Python【第九章】：paramiko模塊、線程與進程、各種線程鎖、queue隊列、生產者消費者模型

password locking form maxsize 廁所 sorted [0 hostname nbsp 一、paramiko模塊他是什麽東西？　　paramiko模塊是用python語言寫的一個模塊，遵循SSH2協議，支持以加密和認證的方式，進行遠程服務器的連

Day26：configparser、subprocess模塊

host wait方法 add 流控 with 操作 rem 復雜 python 一、configparser模塊該模塊適用於配置文件的格式與windows ini文件類似，可以包含一個或多個節（section），每個節可以有多個參數（鍵=值）。 1、創建文件一般軟件的

NGINX 添加MP4、FLV視頻支持模塊

figure ror rar acc 之前外掛播放升級 logs 由於公司網站需要放置視頻，但是默認的服務器環境是沒有編譯這個支持的模塊，視頻文件只能緩沖完了在播放，非常麻煩。之前呢也安裝了一個nginx_mod_h264_streaming來支持，效果很不

處理xml模塊、configparser模塊、hashlib模塊、subprocess模塊

direction comm pop item 報錯 ria 三種方式文檔三種 xml模塊新建a.xml內容為： <data> <country name="Liechtenstein"> <rank updat

Flask10 登錄模塊、表單框架、表單渲染、表單驗證、bookie、請求之前鉤子、g對象、編寫裝飾器

data 函數實現 https tid 路徑錯誤 post請求字符 als from flask import Flask from flask import request from flask import render_template from flask_

android仿微信紅包動畫、Kotlin綜合應用、Xposed模塊、炫酷下拉視覺、UC瀏覽器滑動動畫等源碼

架構分析 body oot googl short html 博文 urn 管理 Android精選源碼仿微信打開紅包旋轉動畫使用Kotlin編寫的Android應用，內容你想象不到 Android手機上的免Root Android系統日誌Viewer 一個能讓微

LAMP(7限定某個目錄禁止解析php、限制user_agent、 PHP相關配置、PHP擴展模塊

PHP相關配置限定某個目錄禁止解析php防止黑客上傳一個目錄文件php，網站會從而解析php,對我們的網站有很大的危險。因此，我們需要在能上傳文件的目錄直接禁止解析PHP代碼禁止步驟1.編輯虛擬主機配置文件：增添內容核心配置文件內容 <Directory /data

shutil模塊——高級的文件、文件夾、壓縮包處理模塊

body group tree post ger 移動 stat for rac 將文件內容拷貝到另一個文件 shutil.copyfileobj(‘fsrc‘, ‘fdst‘, ‘length‘) 　　方法源碼： def copyfileobj(fsrc,

python---基礎知識回顧（四）（模塊sys,os,random,hashlib,re,json，xml，shutil，configparser，logging，datetime，time，集合，堆，雙端隊列，其他）

ID 正常空值字符預測 platform OS normal 生成前提：dir,__all__,help,__doc__,__file__ dir:可以用來查看模塊中的所有特性（函數，類，變量等） >>> import copy >>

模塊使用（md5加密、StringIO、JSON)

模塊使用md5加密在python3的標準庫中，已經移除了md5，而關於hash加密算法都放在hashlib這個標準庫中，如SHA1、SHA224、SHA256、SHA384、SHA512和MD5算法等在英語中hex有十六進制的意思，hexdigest()因此該方法是將hash中的數據轉換成

4月16日 python學習總結 DBUtils模塊、orm 和 cookie、session、token

用戶名可用繼續打開基於動態編號身份認證 The 一、DBUtils模塊介紹 The DBUtils suite is realized as a Python package containing two subsets of modules, one fo

第二模塊·函數編程-第1章函數、裝飾器、叠代器、內置方法

原子留學 rmp 調用方法優化文件操作使用場景書籍推薦 default 01-雞湯之人醜就要多讀書 02-三元運算 03-文件處理 04-文件處理-二進制模式 05-文件處理-智能檢測編碼的工具 06-文件處理-寫模式操作文件 07-文件處理-追加模式操作文件

re模塊、os模塊、subprocess模塊

相關推薦