Python高級特性
切片
取一個list或tuple的部分元素是非常常見的操作。比如,一個list如下:
>>> L = [‘Michael‘, ‘Sarah‘, ‘Tracy‘, ‘Bob‘, ‘Jack‘]
取前3個元素,應該怎麽做?Python提供了切片(Slice)操作符,能大大簡化這種操作。
>>> L[0:3] [‘Michael‘, ‘Sarah‘, ‘Tracy‘]
L[0:3]
表示,從索引0
開始取,直到索引3
為止,但不包括索引3
。即索引0
,1
,2
,正好是3個元素。
如果第一個索引是0
,還可以省略:
>>> L[:3] [‘Michael‘, ‘Sarah‘, ‘Tracy‘]
支持倒數切片:(倒數第一個元素的索引是-1
)
>>> L[-2:] [‘Bob‘, ‘Jack‘] >>> L[-2:-1] [‘Bob‘]
切片操作十分有用。我們先創建一個0-99的數列:
>>> L = list(range(100)) >>> L [0, 1, 2, 3, ..., 99]
前10個數:
>>> L[:10]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
後10個數:
>>> L[-10:]
[90, 91, 92, 93, 94, 95, 96, 97, 98, 99]
前11-20個數:
>>> L[10:20]
[10, 11, 12, 13, 14, 15, 16, 17, 18, 19]
前10個數,每兩個取一個:
>>> L[:10:2]
[0, 2, 4, 6, 8]
所有數,每5個取一個:
>>> L[::5]
[0, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95]
什麽都不寫,只寫[:]
就可以原樣復制一個list:
>>> L[:]
[0, 1, 2, 3, ..., 99]
tuple也是一種list,唯一區別是tuple不可變。因此,tuple也可以用切片操作,只是操作的結果仍是tuple:
>>> (0, 1, 2, 3, 4, 5)[:3]
(0, 1, 2)
字符串‘xxx‘
也可以看成是一種list,每個元素就是一個字符。因此,字符串也可以用切片操作,只是操作結果仍是字符串:
>>> ‘ABCDEFG‘[:3] ‘ABC‘ >>> ‘ABCDEFG‘[::2] ‘ACEG‘
Python沒有針對字符串的截取函數,只需要切片一個操作就可以完成,非常簡單。
叠代
如果給定一個list或tuple,我們可以通過for
循環來遍歷這個list或tuple,這種遍歷我們稱為叠代(Iteration)。在Python中,叠代是通過for ... in
來完成的。
Python的for
循環不僅可以用在list或tuple上,還可以作用在其他可叠代對象上。
list這種數據類型雖然有下標,但很多其他數據類型是沒有下標的,但是,只要是可叠代對象,無論有無下標,都可以叠代,比如dict就可以叠代:
>>> d = {‘a‘: 1, ‘b‘: 2, ‘c‘: 3} >>> for key in d: ... print(key) ... a c b
默認情況下,dict叠代的是key。如果要叠代value,可以用 for value in d.values()
,如果要同時叠代key和value,可以用 for k, v in d.items()
。
由於字符串也是可叠代對象,因此,也可以作用於for
循環:
>>> for ch in ‘ABC‘: ... print(ch) ... A B C
所以,當我們使用for
循環時,只要作用於一個可叠代對象,for
循環就可以正常運行,而我們不太關心該對象究竟是list還是其他數據類型。
那麽,如何判斷一個對象是可叠代對象呢?方法是通過collections模塊的Iterable類型判斷:
>>> from collections import Iterable >>> isinstance(‘abc‘, Iterable) # str是否可叠代 True >>> isinstance([1,2,3], Iterable) # list是否可叠代 True >>> isinstance(123, Iterable) # 整數是否可叠代 False
for
循環裏,同時引用了兩個變量,在Python裏是很常見的:
>>> for x, y in [(1, 1), (2, 4), (3, 9)]: ... print(x, y) ... 1 1 2 4 3 9
列表生成式
如果要生成 [1x1, 2x2, 3x3, ..., 10x10]
怎麽做?方法一是循環:
>>> L = [] >>> for x in range(1, 11): ... L.append(x * x) ... >>> L [1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
但是循環太繁瑣,而列表生成式則可以用一行語句代替循環生成上面的list:
>>> [x * x for x in range(1, 11)] [1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
寫列表生成式時,把要生成的元素x * x
放到前面,後面跟for
循環,就可以把list創建出來,十分有用,多寫幾次,很快就可以熟悉這種語法。
for循環後面還可以加上if判斷,這樣我們就可以篩選出僅偶數的平方:
>>> [x * x for x in range(1, 11) if x % 2 == 0] [4, 16, 36, 64, 100]
還可以使用兩層循環,可以生成全排列:
>>> [m + n for m in ‘ABC‘ for n in ‘XYZ‘] [‘AX‘, ‘AY‘, ‘AZ‘, ‘BX‘, ‘BY‘, ‘BZ‘, ‘CX‘, ‘CY‘, ‘CZ‘]
列出當前目錄下的所有文件和目錄名,可以通過一行代碼實現:
>>> import os # 導入os模塊,模塊的概念後面講到 >>> [d for d in os.listdir(‘.‘)] # os.listdir可以列出文件和目錄 [‘.emacs.d‘, ‘.ssh‘, ‘.Trash‘, ‘Adlm‘, ‘Applications‘, ‘Desktop‘, ‘Documents‘, ‘Downloads‘, ‘Library‘, ‘Movies‘, ‘Music‘, ‘Pictures‘, ‘Public‘, ‘VirtualBox VMs‘, ‘Workspace‘, ‘XCode‘]
for
循環其實可以同時使用兩個甚至多個變量,比如dict
的items()
可以同時叠代key和value:
>>> d = {‘x‘: ‘A‘, ‘y‘: ‘B‘, ‘z‘: ‘C‘ } >>> for k, v in d.items(): ... print(k, ‘=‘, v) ... y = B x = A z = C
因此,列表生成式也可以使用兩個變量來生成list:
>>> d = {‘x‘: ‘A‘, ‘y‘: ‘B‘, ‘z‘: ‘C‘ } >>> [k + ‘=‘ + v for k, v in d.items()] [‘y=B‘, ‘x=A‘, ‘z=C‘]
把一個list中所有的字符串變成小寫:
>>> L = [‘Hello‘, ‘World‘, ‘IBM‘, ‘Apple‘] >>> [s.lower() for s in L] [‘hello‘, ‘world‘, ‘ibm‘, ‘apple‘]
Python高級特性