鐵樂學python27_模塊學習2
大部份內容摘自博客http://www.cnblogs.com/Eva-J/
collections模塊
在內置數據類型(dict、list、set、tuple)的基礎上,
collections模塊還提供了幾個額外的數據類型:Counter、deque、defaultdict、namedtuple和OrderedDict等。
1.namedtuple:
生成可以使用名字來訪問元素內容的tuple;
2.deque:
雙端隊列,可以快速的從另外一側追加和推出對象;
3.Counter: 計數器,主要用來計數;
4.OrderedDict: 有序字典;
5.defaultdict: 帶有默認值的字典。
namedtuple
我們知道tuple可以表示不變集合,例如,一個點的二維坐標就可以表示成:
>>> p = (1, 2)
但是,看到(1, 2),很難看出這個tuple是用來表示一個坐標的。
這時,namedtuple就派上了用場:
from collections import namedtuple
Point = namedtuple(‘Point‘, [‘x‘, ‘y‘])
p = Point(1, 2)
print(p.x) # 1
print(p.y) # 2
print(p) # Point(x=1, y=2)
類似的,如果要用坐標和半徑表示一個圓,也可以用namedtuple定義:
#namedtuple(‘名稱‘, [屬性list]):
Circle = namedtuple(‘Circle‘, [‘x‘, ‘y‘, ‘r‘])
deque
使用list存儲數據時,按索引訪問元素很快,但是插入和刪除元素就很慢了,
因為list是線性存儲,數據量大的時候,插入和刪除效率很低。
deque是為了高效實現插入和刪除操作的雙向列表,適合用於隊列和棧:
>>> from collections import deque
>>> q = deque([‘a‘, ‘b‘, ‘c‘])
>>> q.append(‘x‘)
>>> q.appendleft(‘y‘)
>>> q
deque([‘y‘, ‘a‘, ‘b‘, ‘c‘, ‘x‘])
deque除了實現list的append()和pop()外,還支持appendleft()和popleft(),這樣就可以非常高效地往頭部添加或刪除元素。
OrderedDict
使用dict時,Key是無序的。在對dict做叠代時,我們無法確定Key的順序。
如果要保持Key的順序,可以用OrderedDict:
>>> from collections import OrderedDict
>>> d = dict([(‘a‘, 1), (‘b‘, 2), (‘c‘, 3)])
>>> d # dict的Key是無序的
{‘a‘: 1, ‘c‘: 3, ‘b‘: 2}
>>> od = OrderedDict([(‘a‘, 1), (‘b‘, 2), (‘c‘, 3)])
>>> od # OrderedDict的Key是有序的
OrderedDict([(‘a‘, 1), (‘b‘, 2), (‘c‘, 3)])
註意,OrderedDict的Key會按照插入的順序排列,不是Key本身排序:
>>> od = OrderedDict()
>>> od[‘z‘] = 1
>>> od[‘y‘] = 2
>>> od[‘x‘] = 3
>>> od.keys() # 按照插入的Key的順序返回
[‘z‘, ‘y‘, ‘x‘]
defaultdict
有如下值集合 [11,22,33,44,55,66,77,88,99,90...],將所有大於 66 的值保存至字典的第一個key中,
將小於 66 的值保存至第二個key的值中。
即: {‘k1‘: 大於66 , ‘k2‘: 小於66}
使用defaultdict可以節省些代碼:
from collections import defaultdict
values = [11, 22, 33, 44, 55, 66, 77, 88, 99]
my_dict = defaultdict(list)
for value in values:
if value>66:
my_dict[‘k1‘].append(value)
else:
my_dict[‘k2‘].append(value)
print(my_dict)
#defaultdict(<class ‘list‘>, {‘k2‘: [11, 22, 33, 44, 55, 66], ‘k1‘: [77, 88, 99]})
使用dict時,如果引用的Key不存在,就會拋出KeyError。
默認字典最大的好處就是永遠不會在你使用key獲取值的時候報錯;
默認字典是給字典中的value設置默認值。
如果希望key不存在時,返回一個默認值,就可以用defaultdict:
from collections import defaultdict
dd = defaultdict(lambda: ‘N/A‘)
dd[‘key1‘] = ‘abc‘
print(dd[‘key1‘]) # key1存在,返回‘abc‘
print(dd[‘key2‘]) # key2不存在,返回默認值‘N/A‘
Counter
Counter類的目的是用來跟蹤值出現的次數。
它是一個無序的容器類型,以字典的鍵值對形式存儲,其中元素作為key,其計數作為value。
計數值可以是任意的Interger(包括0和負數)。
Counter類和其他語言的bags或multisets很相似。
from collections import Counter
c = Counter(‘abcdeabcdabcaba‘)
print(c)
輸出:Counter({‘a‘: 5, ‘b‘: 4, ‘c‘: 3, ‘d‘: 2, ‘e‘: 1})
Counter類常用操作
sum(c.values()) # 所有計數的總數
c.clear() # 重置Counter對象,註意不是刪除
list(c) # 將c中的鍵轉為列表
set(c) # 將c中的鍵轉為set
dict(c) # 將c中的鍵值對轉為字典
c.items() # 轉為(elem, cnt)格式的列表
Counter(dict(list_of_pairs)) # 從(elem, cnt)格式的列表轉換為Counter類對象
c.most_common()[:-n:-1] # 取出計數最少的n個元素
c += Counter() # 移除0和負值
時間模塊
常用方法
1.time.sleep(secs)
(線程)推遲指定的時間運行。單位為秒。
2.time.time()
獲取當前時間戳
表示時間的三種方式
在Python中,通常有這三種方式來表示時間:時間戳、元組(struct_time)、格式化的時間字符串:
(1)時間戳(timestamp) :通常來說,時間戳表示的是從1970年1月1日00:00:00開始按秒計算的偏移量。
運行“type(time.time())”,返回的是float類型。
(2)格式化的時間字符串(Format String): ‘1999-12-06’
python中時間日期格式化符號:
%y 兩位數的年份表示(00-99)
%Y 四位數的年份表示(000-9999)
%m 月份(01-12)
%d 月內中的一天(0-31)
%H 24小時制小時數(0-23)
%I 12小時制小時數(01-12)
%M 分鐘數(00=59)
%S 秒(00-59)
%a 本地簡化星期名稱
%A 本地完整星期名稱
%b 本地簡化的月份名稱
%B 本地完整的月份名稱
%c 本地相應的日期表示和時間表示
%j 年內的一天(001-366)
%p 本地A.M.或P.M.的等價符
%U 一年中的星期數(00-53)星期天為星期的開始
%w 星期(0-6),星期天為星期的開始
%W 一年中的星期數(00-53)星期一為星期的開始
%x 本地相應的日期表示
%X 本地相應的時間表示
%Z 當前時區的名稱
%% %號本身
(3)元組(struct_time) :struct_time元組共有9個元素共九個元素:(年,月,日,時,分,秒,一年中第幾周,一年中第幾天等)
索引(Index)
屬性(Attribute)
值(Values)
0
tm_year(年)
比如2011
1
tm_mon(月)
1 - 12
2
tm_mday(日)
1 - 31
3
tm_hour(時)
0 - 23
4
tm_min(分)
0 - 59
5
tm_sec(秒)
0 - 60
6
tm_wday(weekday)
0 - 6(0表示周一)
7
tm_yday(一年中的第幾天)
1 - 366
8
tm_isdst(是否是夏令時)
默認為0
# 導入時間模塊
import time
# 時間戳
print(time.time())
# 1524576003.2530968
#時間字符串
print(time.strftime("%Y-%m-%d %X"))
# 2018-04-24 21:20:03
print(time.strftime("%Y-%m-%d %H-%M-%S"))
# 2018-04-24 21-20-03
#時間元組:localtime將一個時間戳轉換為當前時區的struct_time
print(time.localtime())
# time.struct_time(tm_year=2018, tm_mon=4, tm_mday=24, tm_hour=21, tm_min=20, tm_sec=3, tm_wday=1, tm_yday=114, tm_isdst=0)
小結:
時間戳是計算機能夠識別的時間;
時間字符串是人能夠看懂的時間;
元組則是用來操作時間的。
幾種格式之間的轉換
時間戳-->結構化時間
time.gmtime(時間戳) #UTC時間,與英國倫敦當地時間一致
time.localtime(時間戳) #當地時間。
例如我們現在在北京執行這個方法:與UTC時間相差8小時,UTC時間+8小時 = 北京時間
結構化時間-->時間戳
time.mktime(結構化時間)
結構化時間-->字符串時間
time.strftime("格式定義","結構化時間") 結構化時間參數若不傳,則現實當前時間。
字符串時間-->結構化時間
time.strptime(時間字符串,字符串對應格式)
結構化時間 --> %a %b %d %H:%M:%S %Y串
time.asctime(結構化時間) 如果不傳參數,直接返回當前時間的格式化串
時間戳 --> %a %d %d %H:%M:%S %Y串
time.ctime(時間戳) 如果不傳參數,直接返回當前時間的格式化串
os模塊
os模塊是與操作系統交互的一個接口。
os.getcwd() 獲取當前工作目錄,即當前python腳本工作的目錄路徑
os.chdir("dirname") 改變當前腳本工作目錄;相當於shell下cd
os.curdir 返回當前目錄: (‘.‘)
os.pardir 獲取當前目錄的父目錄字符串名:(‘..‘)
os.makedirs(‘dirname1/dirname2‘) 可生成多層遞歸目錄
os.removedirs(‘dirname1‘) 若目錄為空,則刪除,並遞歸到上一級目錄,如若也為空,則刪除,依此類推
os.mkdir(‘dirname‘) 生成單級目錄;相當於shell中mkdir dirname
os.rmdir(‘dirname‘) 刪除單級空目錄,若目錄不為空則無法刪除,報錯;相當於shell中rmdir dirname
os.listdir(‘dirname‘) 列出指定目錄下的所有文件和子目錄,包括隱藏文件,並以列表方式打印
os.remove() 刪除一個文件
os.rename("oldname","newname") 重命名文件/目錄
os.stat(‘path/filename‘) 獲取文件/目錄信息
os.sep 輸出操作系統特定的路徑分隔符,win下為"\\",Linux下為"/"
os.linesep 輸出當前平臺使用的行終止符,win下為"\t\n",Linux下為"\n"
os.pathsep 輸出用於分割文件路徑的字符串 win下為;,Linux下為:
os.name 輸出字符串指示當前使用平臺。win->‘nt‘; Linux->‘posix‘
os.system("bash command") 運行shell命令,直接顯示
os.popen("bash command).read() 運行shell命令,獲取執行結果
os.environ 獲取系統環境變量
os.path os.path.abspath(path) 返回path規範化的絕對路徑 os.path.split(path) 將path分割成目錄和文件名二元組返回 os.path.dirname(path) 返回path的目錄。其實就是os.path.split(path)的第一個元素。
os.path.basename(path) 返回path最後的文件名。如果path以/或\結尾,那麽就會返回空值。即os.path.split(path)的第二個元素
os.path.exists(path) 如果path存在,返回True;如果path不存在,返回False
os.path.isabs(path) 如果path是絕對路徑,返回True
os.path.isfile(path) 如果path是一個存在的文件,返回True。否則返回False
os.path.isdir(path) 如果path是一個存在的目錄,則返回True。否則返回False
os.path.join(path1[, path2[, ...]]) 將多個路徑組合後返回,第一個絕對路徑之前的參數將被忽略
os.path.getatime(path) 返回path所指向的文件或者目錄的最後訪問時間
os.path.getmtime(path) 返回path所指向的文件或者目錄的最後修改時間
os.path.getsize(path) 返回path的大小
註意:os.stat(‘path/filename‘) 獲取文件/目錄信息 的結構說明
stat 結構:
st_mode: inode 保護模式
st_ino: inode 節點號。
st_dev: inode 駐留的設備。
st_nlink: inode 的鏈接數。
st_uid: 所有者的用戶ID。
st_gid: 所有者的組ID。
st_size: 普通文件以字節為單位的大小;包含等待某些特殊文件的數據。
st_atime: 上次訪問的時間。
st_mtime: 最後一次修改的時間。
st_ctime: 由操作系統報告的"ctime"。在某些系統上(如Unix)是最新的元數據更改的時間,在其它系統上(如Windows)是創建時間(詳細信息參見平臺的文檔)。
sys模塊
sys模塊是與python解釋器交互的一個接口
sys.argv 命令行參數List,第一個元素是程序本身路徑
sys.exit(n) 退出程序,正常退出時exit(0),錯誤退出sys.exit(1)
sys.version 獲取Python解釋程序的版本信息
sys.path 返回模塊的搜索路徑,初始化時使用PYTHONPATH環境變量的值
sys.platform 返回操作系統平臺名稱
sys.argv巧用,用在真實生產環境,比如直接在linux的系統上運行,可以在運行py文件的同時加上參數運行。
類似redis加參數運行等。
註:下面兩例都需要在linux命令行或windows的cmd窗口中模擬輸入: python py文件 參數 運行才看得出效果。
例:
import sys
print(sys.argv) # 列表 列表的第一項是當前文件所在的路徑
if sys.argv[1] == ‘alex‘ and sys.argv[2] == ‘3714‘:
print(‘登陸成功‘)
else:
sys.exit()
user = input(‘>>>‘)
pwd = input(‘>>>‘)
if user == ‘alex‘ and pwd == ‘3714‘:
print(‘登陸成功‘)
else:
sys.exit()
print(‘我能完成的功能‘)
例2:debug 執行一個程序可直接執行不顯示debug信息,也可後面跟參數DEBUG運行,會顯示debug的信息。
import sys
import logging
inp = sys.argv[1] if len(sys.argv)>1 else ‘WARNING‘
logging.basicConfig(level=getattr(logging, inp)) # DEBUG
num = int(input(‘>>>‘))
logging.debug(num)
a = num * 100
logging.debug(a)
b = a - 10
logging.debug(b)
c = b + 5
print(c)
end
2018-4-24
鐵樂學python27_模塊學習2