Python - 模塊(二)

阿新 • • 發佈：2019-02-04

enc shel roc 返回特殊 mkdir 調用 fmt bin

Python - 模塊(二)
- re
  - re下面的方法
- logging
- os

Python - 模塊(二)

re

re模塊提供了正則表達式的相關操作

主要字符介紹:

. 通配符,除了換行符之外的任意字符

^ 匹配字符串的開始

$ 匹配字符串的結尾

關於次數的:

* 按緊挨著的字符重復無數次, 重復零次或更多次

+ 1到無窮次, 重復一次或更多次

? (0,1) 重復零次或一次

{n} 重復n次
{n,} 重復n次或更多次

{n,m} 重復n到m次

其他的:
[] 字符集
| 或
() 分組
\ 轉義

\A 只在字符串開始進行匹配

\Z 只在字符串結尾進行匹配

\b 匹配一個特殊字符邊界, 如空格$

\B 匹配不位於開始或結尾的空字符串

\d 相當於[0-9]

\D 相當於[^0-9]

\s 匹配任意空字符串:[\t\n\r\v]

\S 匹配任意非空白字符:[^\t\n\r\v]

\w 匹配任意數字和字母: [a-zA-Z0-9]

\W 匹配任意非數字和字母: [^a-zA-Z0-9]

. ^ $ * + ? {} 一些用法
import re
print(re.findall("a..x","helloalex"))#['alex']  點匹配任意一個，但是只能匹配一個
 
print(re.findall("^a..x","alexhelloworld"))#['alex'] ^ 匹配以什麽開始
 
print(re.findall("a..x$","helloalex"))#['alex'] $ 匹配以什麽結尾
 
print(re.findall("alex*","helloalexxxxx"))#['alexxxxx'] * 貪婪匹配 *表示匹配0次或更多次
 
print(re.findall("alex+","helloalexxx"))#['alexxx'] +表示匹配1次或更多次
 
print(re.findall("alex?","helloalexxxx"))#['alex'] ? 表示匹配0到1次
 
print(re.findall("alex{1,2}","alexxxx"))#['alexx']

註意：前面的*,+,?等都是貪婪匹配，也就是盡可能匹配，後面加?號使其變成惰性匹配

元字符之字符集［］

存在或的關系    至少匹配一個   在字符集中含有特殊意義的只有三個 ^(非) \(轉義) -(範圍)
 
print(re.findall('a[bc]d','acd'))#['acd']  []字符集中有或的概念
 
print(re.findall('[a-z]','acd'))#['a', 'c', 'd'] #範圍a—z 都可以匹配到
 
print(re.findall('[.*+]','a.cd+'))# ['.', '+']
 
print(re.findall('[1-9]','45dha3'))# ['4', '5', '3']
 
print(re.findall('[^ab]','45bdha3'))# ['4', '5', 'd', 'h', '3']   ^ 代表非的概念
 
print(re.findall('[\d]','45bdha3'))# ['4', '5', '3']  \d 表示0到9的數字

關於轉義的實例
import re
ret=re.findall(‘c\l‘,‘abc\le‘)
print(ret) # 報錯
ret=re.findall(‘c\l‘,‘abc\le‘)
print(ret) # 報錯
ret=re.findall(‘c\\l‘,‘abc\le‘)
print(ret) #[‘c\l‘]
ret=re.findall(r‘c\l‘,‘abc\le‘)
print(ret)#[‘c\l‘] # 一張圖解釋為什麽要用到這麽多 ?的原因

分組() 的用法

print(re.findall(r'(ad)+', 'addad')) # ['ad', 'ad']
 
ret=re.search('(?P<id>\d{2})/(?P<name>\w{3})','23/com')
print(ret.group())#23/com
print(ret.group('id'))#23

| 或

ret=re.search('(ab)|\d','rabhdg8sd')
print(ret.group())#ab    先匹配到哪個取哪個  group表示取值

re下面的方法

comoile

obj=re.compile('\d{5}')       # compile是編譯的意思，編譯好一個規則，再進行調用它
ret=obj.search('abc12345ee')
print(ret.group())#12345

serch

print(re.search('al','alvin yuan').group()) # al
 
# 函數會在字符串內查找模式匹配,只到找到第一個匹配然後返回一個包含匹配信息的對象,該對象可以
# 通過調用group()方法得到匹配的字符串,如果字符串沒有匹配，則返回None。

findall

print(re.findall('a','alvin yuan'))# ['a', 'a']
 
# 返回所有滿足匹配條件的結果,放在列表裏

match

ret = re.match('a','abc').group() # match只是從開始匹配，匹配成功則返回對象
print(ret)

split

ret=re.split('[ab]','abcd')     # 先按'a'分割得到''和'bcd',在對''和'bcd'分別按'b'分割
print(ret)#['', '', 'cd']       # 結果放在列表中

sub(subn)

ret=re.sub('\d','abc','alvin5yuan6',1)   # sub裏面至少有個三個參數 依次是 匹配規則 替換內容 源數據     也可以有四個，最後一個參數是匹配次數
print(ret)#alvinabcyuan6
ret=re.subn('\d','abc','alvin5yuan6')    # 顯示匹配了多少次，替換
print(ret)#('alvinabcyuanabc', 2)

finditer

ret=re.finditer('\d','ds3sy4784a')
print(ret)        #<callable_iterator object at 0x10195f940>
print(next(ret).group())
print(next(ret).group())
 
# 結合叠代器規則，返回的是一個叠代器對象，應用於處理很多的數據，用next的可以逐一取

?: 是取消優先級 ?P的含義

print(re.search("(?P<name>[a-z]+)(?P<age>\d+)","alex36wusir27").group("name"))
# alex 註釋 ?P是定義死的 <定義分組名>                                 後面可根據分組名取值

print(re.findall("www\.(baidu|taobao)\.com","sdaswww.baidu.comsdf"))
# ['baidu'] 優先給分組的內容，其實已經匹配到了
print(re.findall("www\.(?:baidu|taobao)\.com","sdaswww.baidu.comsdf"))
# ['www.baidu.com']    ?: 表示去掉括號內的優先級

logging

用於便捷記錄日誌且線程安全的模塊

日誌級別大小關系為：CRITICAL ERROR WARNING INFO DEBUG NOTSET，當然也可以自己定義日誌級別。

level=logging.DEBUG 設置日誌級別

import logging
 
logging.basicConfig(filename='log.log',
                    format='%(asctime)s - %(name)s - %(levelname)s -%(module)s:  %(message)s',
                    datefmt='%Y-%m-%d %H:%M:%S %p',
                    level=logging.DEBUG)
 
logging.debug('debug')            # 分五個等級
logging.info('info')
logging.warning('warning')
logging.error('error')
logging.critical('critical')
logging.log(10,'log')

文件輸出如下:
技術分享圖片

format 設置輸出格式

 %(levelno)s: 打印日誌級別的數值
 %(levelname)s: 打印日誌級別名稱
 %(pathname)s: 打印當前執行程序的路徑，其實就是sys.argv[0]
 %(filename)s: 打印當前執行程序名
 %(funcName)s: 打印日誌的當前函數
 %(lineno)d: 打印日誌的當前行號
 %(asctime)s: 打印日誌的時間
 %(thread)d: 打印線程ID
 %(threadName)s: 打印線程名稱
 %(process)d: 打印進程ID
 %(message)s: 打印日誌信息

datefmt 設置日期格式，同 time.strftime()

  %Y 年 %m 月  %D日  %H時  %M分  %S 秒

filename 設置文件路徑

filemode 設置文件打開模式

註：沒有filename和filemode直接輸出

os

用於提供系統級別的操作

os.getcwd()                 獲取當前工作目錄，即當前python腳本工作的目錄路徑
os.chdir("dirname")         改變當前腳本工作目錄；相當於shell下cd
os.curdir                   返回當前目錄: ('.')
os.pardir                   獲取當前目錄的父目錄字符串名：('..')
os.makedirs('dir1/dir2')    可生成多層遞歸目錄
os.removedirs('dirname1')   若目錄為空，則刪除，並遞歸到上一級目錄，如若也為空，則刪除，依此類推
os.mkdir('dirname')         生成單級目錄；相當於shell中mkdir dirname
os.rmdir('dirname')         刪除單級空目錄，若目錄不為空則無法刪除，報錯；相當於shell中rmdir dirname
os.listdir('dirname')       列出指定目錄下的所有文件和子目錄，包括隱藏文件，並以列表方式打印 ***
os.remove()                 刪除一個文件
os.rename("oldname","new")  重命名文件/目錄 ***
os.stat('path/filename')    獲取文件/目錄信息，相關信息的介紹 size 文件大小 atime 上次訪問時間 mtime 上次修改時間 ctime 查看創建時間
os.sep                      操作系統特定的路徑分隔符，win下為"\\",Linux下為"/"
os.linesep                  當前平臺使用的行終止符，win下為"\t\n",Linux下為"\n"
os.pathsep                  用於分割文件路徑的字符串
os.name                     字符串指示當前使用平臺。win->'nt'; Linux->'posix'
os.system("bash command")   運行shell命令，直接顯示
os.environ                  獲取系統環境變量
os.path.abspath(path)       返回path規範化的絕對路徑
os.path.split(path)         將path分割成目錄和文件名二元組返回
os.path.dirname(path)       返回path的目錄。其實就是os.path.split(path)的第一個元素
os.path.basename(path)      返回path最後的文件名。如何path以／或\結尾，那麽就會返回空值。即os.path.split(path)的第二個元素
os.path.exists(path)        如果path存在，返回True；如果path不存在，返回False
os.path.isabs(path)         如果path是絕對路徑，返回True
os.path.isfile(path)        如果path是一個存在的文件，返回True。否則返回False
os.path.isdir(path)         如果path是一個存在的目錄，則返回True。否則返回False
os.path.join(path1[, path2[, ...]])  將多個路徑組合後返回，第一個絕對路徑之前的參數將被忽略，涉及文件路徑拼接就用它
os.path.getatime(path)      返回path所指向的文件或者目錄的最後存取時間
os.path.getmtime(path)      返回path所指向的文件或者目錄的最後修改時間

技術分享圖片

上圖所示, 是得到:

os.path.dirname是返回上一級目錄

獲取文件大小的三種方式

import os

res = os.path.getsize(os.path.join("F:\python\PycharmProjects\date2017.1.8","path_search.py"))
print(res)

ret  = os.stat(os.path.join("F:\python\PycharmProjects\date2017.1.8","path_search.py")).st_size
print(ret)

f = open(os.path.join("F:\python\PycharmProjects\date2017.1.8","path_search.py"),"rb")
print(len(f.read()))

輸出結果相同

os模塊的補充

os.walk(top, topdown=True, onerror=None, followlinks=False) 
可以得到一個三元tupple(dirpath, dirnames, filenames), 
第一個為起始路徑，第二個為起始路徑下的文件夾，第三個是起始路徑下的文件。
dirpath 是一個string，代表目錄的路徑，
dirnames 是一個list，包含了dirpath下所有子目錄的名字。
filenames 是一個list，包含了非目錄文件的名字。
這些名字不包含路徑信息，如果需要得到全路徑，需要使用os.path.join(dirpath, name).
通過for循環自動完成遞歸枚舉

# 做個簡單的例子，輸出crm目錄的下所有文件的路徑信息
for a,b,c in os.walk(str(PATH) + os.sep + "crm" ):
    for item in c:
        # print(item)
        print(os.path.join(a,item))

輸出
F:\python\crm\.idea\.name
F:\python\crm\.idea\crm.iml
F:\python\crm\.idea\encodings.xml
F:\python\crm\.idea\misc.xml
F:\python\crm\.idea\modules.xml
F:\python\crm\.idea\workspace.xml
F:\python\crm\bin\bin.py
F:\python\crm\bin\__init__.py
F:\python\crm\bin\__pycache__\bin.cpython-35.pyc
F:\python\crm\core\admin.py
F:\python\crm\core\coures.py
F:\python\crm\core\grade.py
F:\python\crm\core\school.py
F:\python\crm\core\student.py
F:\python\crm\core\teacher.py
F:\python\crm\core\__init__.py
F:\python\crm\core\__pycache__\admin.cpython-35.pyc
F:\python\crm\core\__pycache__\coures.cpython-35.pyc
F:\python\crm\core\__pycache__\grade.cpython-35.pyc
F:\python\crm\core\__pycache__\school.cpython-35.pyc
F:\python\crm\core\__pycache__\student.cpython-35.pyc
F:\python\crm\core\__pycache__\teacher.cpython-35.pyc
F:\python\crm\core\__pycache__\__init__.cpython-35.pyc
F:\python\crm\db\admin\alex
F:\python\crm\db\coures\23eeeb4347bdd26bfc6b7ee9a3b755dd
F:\python\crm\db\coures\34d1f91fb2e514b8576fab1a75a89a6b
F:\python\crm\db\coures\c71e8d17d41c21de0d260881d69662ff
F:\python\crm\db\coures\df5fb5e33c5585bb0c48107c57cece9b
F:\python\crm\db\coures\e206a54e97690cce50cc872dd70ee896
F:\python\crm\db\grade\270c42ba7614f1a475f61dfcb397a621
F:\python\crm\db\grade\817ee0b8010393ff3b4483e703663551
F:\python\crm\db\school\17811d3caeff9648f48b5a553c806c63
F:\python\crm\db\school\b035c88ee6f5270ccff67a591d0e21ec
F:\python\crm\db\school\bb0ac3d8eb8f2c2f6fe336c5e9957392
F:\python\crm\db\school\e523d5f211747bdfc742f50463577f74
F:\python\crm\db\student\6e7e12c264fb3e1f456b0782f47e4af6
F:\python\crm\db\student\a0b5e2d3a97d7a19ec6d2da830f609b2
F:\python\crm\db\student\a995b03ed63f8c7128a83c984b89aa50
F:\python\crm\db\student\fe01b2ba5ec0146e5d4b0885822556ef
F:\python\crm\db\student\ff4916088e836d268a9d72f8929bac06
F:\python\crm\db\teacher\08319d4fed47c8ed828ebabd5a91563b
F:\python\crm\db\teacher\0d1d5cd3623144f692fb771580b92288
F:\python\crm\db\teacher\5d00d0762936aedda519d63c2e4a2a40
F:\python\crm\db\teacher\6a7ece82e4ed94a475dab275891d5036
F:\python\crm\lib\ceshi.py
F:\python\crm\lib\readme
F:\python\crm\lib\readwrite.py
F:\python\crm\lib\__init__.py
F:\python\crm\lib\__pycache__\readwrite.cpython-35.pyc
F:\python\crm\lib\__pycache__\__init__.cpython-35.pyc

Python - 模塊(二)

enc shel roc 返回特殊 mkdir 調用 fmt bin 目錄 Python - 模塊(二) re re下面的方法 logging

Python之模塊二

ces 指示包含 bits 調用 pickle tar mod 系統環境 10》常用模塊：　　 1>os模塊：　　　　os.getcwd():獲取當前工作目錄，即當前python腳本工作的目錄路徑；

Python模塊-logging模塊(二)

文件 lte ctime 自動 ignore ror 小時屏幕 mes logging模塊記錄日誌有四個主要類：logger，handler，formatter，filter logger提供了應用程序可以直接使用的接口，每個程序在輸出信息之前都要獲得一個Logger h

如何用C++ 寫Python模塊擴展（二）

unsigned 結構 num ins head stl methods 兩個 spec Python模塊包含的類創建（下）類的方法表創建直接上代碼 static PyMethodDef VCam_MethodMembers[] = //類的所有成員函數

python全棧開發【第十篇】Python常用模塊二（時間、random、os、sys和序列化）

utc時間用戶這也文件名 password 如何 json字符串並且持久一、time模塊表示時間的三種方式：　　時間戳：數字（計算機能認識的）　　時間字符串：t=‘2012-12-12‘ 　　結構化時間：time.struct_time(tm_year=2

進階第十二課 Python模塊之sys

read OS python模塊 leg gac pack uil file pos sys是與Python解釋器交互的工具。先看下dir(sys) >>> import sys >>> dir(sys) [‘__displayhoo

【python標準庫模塊二】random模塊學習

orm dom random模塊 () import randint pre and imp random模塊是用來生成隨機數的模塊導入random模塊 import random 生成一個0~1的隨機數，浮點數 #隨機生成一個0~1的隨

Python Day 22（常用模塊二 hashlib configparser logging）

HA 常用 nbsp AS name -a align 常用模塊 ext Python Day 22（常用模塊二 hashlib configparser logging） hashlib configparser loggingPython Day 22（常用模塊二

python 生涯之常用模塊 (二)

inter faq lin syn bsp output decimal 多行 compress json & pickle 模塊用於序列化的兩個模塊 json，用於字符串和 python數據類型間進行轉換 pickle，用於python特有的類型和 pyt

OpenCV和Zbar兩個Python模塊實現二維碼和條形碼識別

組成 cimage 老師 font key ans 部分平時 ubuntu 在我們的日常生活中，處處可見條形碼和二維碼。在以前，我們去逛書店時，或者你現在隨手拿起你身邊的一本書，你肯定能看到書本的封頁後面印有一排黑色線條組成的標簽，也就是條形碼；你去你們學校的自助機上借

python常用模塊二

else none 使用復制代碼模塊拼接 elephant com 獲取 namedtuple 命名元組 ->類似創建了一個類 from collections import namedtuple p = namedtuple("point", ["x","y

022day--python 模塊介紹和time模塊

字符串命令行 strong __main__ rand time 5-0 可維護 .com 一、模塊的含義　　在計算機程序的開發過程中，隨著程序代碼越寫越多，在一個文件裏代碼就會越來越長，越來越不容易維護。　　為了編寫可維護的代碼，我們把很多函數分組，分別放到不同的文

python--模塊--10

沒有名稱 sys pytho ref 刪除一個 platform std 原創博文，轉載請標明出處--周學偉http://www.cnblogs.com/zxouxuewei/ Python 模塊　　Python 模塊(Module)，是一個 Python 文件，

python模塊-getpass

clas blog pri logs code 顯示 pan imp bsp getpass模塊：不顯示輸入密碼用法： 1 #!/usr/bin/python 2 #2017-05-13 3 #_*_coding:utf-8_*_ 4 5 import ge

Python-模塊：OS，目錄及文件的簡單操作

-1 close pytho print nbsp nco 刪除目錄 os.path window 1.目錄操作 #encoding=UTF-8import unittest,osfrom time import sleep print dir(os)#獲取文件路徑‘‘‘獲

python 模塊包裹

default 密碼 python [email protected]/* */:~$ su root 密碼： [email protected]/* */:/home/arlenmbx# pythonPython 2.7.10 (default, Oct 14 2015

python模塊整理

pre 函數 rom 單位一個 cnblogs 地址 ont 閉包一、time模塊：import time 　　1、time.sleep(3) #單位為妙二、urllib 　　1、傳遞一個url地址得到其html內容：from urllib.request

python模塊之xml.etree.ElementTree

pat symbol fun import 數據 pyhton hat print off Python有三種方法解析XML，SAX，DOM，以及ElementTree###1.SAX (simple API for XML ) pyhton 標準庫包含SAX解

python——模塊

影響步驟 env lpad 函數 project sin rec 系統命令一、導入模塊 Python之所以應用越來越廣泛，在一定程度上也依賴於其為程序員提供了大量的模塊以供使用，如果想要使用模塊，則需要導入。導入模塊有一下幾種方法： 1 import module 2

Python模塊常用的幾種安裝方式

author 位置 def 位操作依賴關系依賴模塊 sys.path 此外 Python模塊安裝一、單文件模塊直接把文件拷貝到 $python_dir/Lib 二、多文件模塊，帶setup.pypython setup.py install 三、 egg文件1)

Python - 模塊(二)

Python - 模塊(二)

re

re下面的方法

logging

os

相關推薦