1. 程式人生 > >python-切片&叠代

python-切片&叠代

方法 isa 操作符 一行 mage fab afa image rate

python-切片&叠代

取一個list的部分元素是非常常見的操作。比如,一個list如下:

L = [‘Adam‘, ‘Lisa‘, ‘Bart‘, ‘Paul‘]

取前3個元素,應該怎麽做?

笨方法:

>> [L[0], L[1], L[2]]
[‘Adam‘, ‘Lisa‘, ‘Bart‘]

之所以是笨辦法是因為擴展一下,取前N個元素就沒轍了。

取前N個元素,也就是索引為0-(N-1)的元素,可以用循環:

技術分享圖片

對這種經常取指定索引範圍的操作,用循環十分繁瑣,因此,Python提供了切片(Slice)操作符,能大大簡化這種操作。

對應上面的問題,取前3個元素,用一行代碼就可以完成切片:

技術分享圖片

L[0:3]表示,從索引0開始取,直到索引3為止,但不包括索引3。即索引0,1,2,正好是3個元素。

如果第一個索引是0,還可以省略:

技術分享圖片

也可以從索引1開始,取出2個元素出來:

技術分享圖片

只用一個 : ,表示從頭到尾:

技術分享圖片

因此,L[:]實際上復制出了一個新list。

切片操作還可以指定第三個參數:

>>> L[::2]
[‘Adam‘, ‘Bart‘]

第三個參數表示每N個取一個,上面的 L[::2] 會每兩個元素取出一個來,也就是隔一個取一個。

把list換成tuple,切片操作完全相同,只是切片的結果也變成了tuple。

技術分享圖片

倒序切片

對於list,既然Python支持L[-1]取倒數第一個元素,那麽它同樣支持倒數切片,試試:

技術分享圖片

記住倒數第一個元素的索引是-1。倒序切片包含起始索引,不包含結束索引

對字符串切片

字符串 ‘xxx‘和 Unicode字符串 u‘xxx‘也可以看成是一種list,每個元素就是一個字符。因此,字符串也可以用切片操作,只是操作結果仍是字符串:

技術分享圖片

在很多編程語言中,針對字符串提供了很多各種截取函數,其實目的就是對字符串切片。Python沒有針對字符串的截取函數,只需要切片一個操作就可以完成,非常簡單。

一個函數,它接受一個字符串,然後返回一個僅首字母變成大寫的字符串。利用切片操作簡化字符串操作:

技術分享圖片

什麽是叠代

在Python中,如果給定一個list或tuple,我們可以通過for循環來遍歷這個list或tuple,這種遍歷我們成為叠代(Iteration)。

在Python中,叠代是通過 for ... in 來完成的.

Python 的 for循環不僅可以用在list或tuple上,還可以作用在其他任何可叠代對象上。

因此,叠代操作就是對於一個集合,無論該集合是有序還是無序,我們用 for 循環總是可以依次取出集合的每一個元素。

註意: 集合是指包含一組元素的數據結構:

  1. 有序集合:list,tuple,str和unicode;
  2. 無序集合:set
  3. 無序集合並且具有 key-value 對:dict

叠代是一個動詞,它指的是一種操作,在Python中,就是 for 循環。

索引叠代

Python中,叠代永遠是取出元素本身,而非元素的索引。

對於有序集合,元素確實是有索引的。有的時候,我們確實想在 for 循環中拿到索引,怎麽辦?

方法是使用 enumerate() 函數

技術分享圖片

使用 enumerate() 函數,我們可以在for循環中同時綁定索引index和元素name。但是,這不是 enumerate() 的特殊語法。實際上,enumerate() 函數把:

[‘Adam‘, ‘Lisa‘, ‘Bart‘, ‘Paul‘]

變成了類似:

[(0, ‘Adam‘), (1, ‘Lisa‘), (2, ‘Bart‘), (3, ‘Paul‘)]

因此,叠代的每一個元素實際上是一個tuple:

技術分享圖片

如果我們知道每個tuple元素都包含兩個元素,for循環又可以進一步簡寫為:

技術分享圖片

這樣不但代碼更簡單,而且還少了兩條賦值語句。

可見,索引叠代也不是真的按索引訪問,而是由 enumerate() 函數自動把每個元素變成 (index, element) 這樣的tuple,再叠代,就同時獲得了索引和元素本身。

叠代dict的value

dict對象本身就是可叠代對象,用 for 循環直接叠代 dict,可以每次拿到dict的一個key。

如果我們希望叠代 dict 對象的value,應該怎麽做?

dict 對象有一個 values() 方法,這個方法把dict轉換成一個包含所有value的list,這樣,我們叠代的就是 dict的每一個 value:

技術分享圖片

仔細閱讀Python的文檔,還可以發現,dict除了values()方法外,還有一個 itervalues() 方法,用 itervalues() 方法替代 values() 方法,叠代效果完全一樣:

技術分享圖片

那這兩個方法有何不同之處呢?

  1. values() 方法實際上把一個 dict 轉換成了包含 value 的list。

  2. 但是 itervalues() 方法不會轉換,它會在叠代過程中依次從 dict 中取出 value,所以 itervalues() 方法比 values() 方法節省了生成 list 所需的內存。

  3. 打印 itervalues() 發現它返回一個 <dictionary-valueiterator> 對象,這說明在Python中,for 循環可作用的叠代對象遠不止 list,tuple,str,unicode,dict等,任何可叠代對象都可以作用於for循環,而內部如何叠代我們通常並不用關心。

如果一個對象說自己可叠代,那我們就直接用 for 循環去叠代它,可見,叠代是一種抽象的數據操作,它不對叠代對象內部的數據有任何要求


給定一個dict:

d = { ‘Adam‘: 95, ‘Lisa‘: 85, ‘Bart‘: 59, ‘Paul‘: 74 }

請計算所有同學的平均分。

> 技術分享圖片


叠代dict的key和value

我們了解了如何叠代 dict 的key和value,那麽,在一個 for 循環中,能否同時叠代 key和value?答案是肯定的。

首先,我們看看 dict 對象的items() 方法返回的值:

技術分享圖片

可以看到,items() 方法把dict對象轉換成了包含tuple的list,我們對這個list進行叠代,可以同時獲得key和value:

技術分享圖片

和 values() 有一個 itervalues() 類似, items() 也有一個對應的 iteritems(),iteritems() 不把dict轉換成list,而是在叠代過程中不斷給出 tuple,所以, iteritems() 不占用額外的內存。

python-切片&叠代