1. 程式人生 > >for循環是怎麽工作的

for循環是怎麽工作的

on() iterable span lis 自己的 循環 道理 拋出異常 spa

for...in 是Python程序員使用最多的語句,for 循環用於叠代容器對象中的元素,這些對象可以是列表、元組、字典、集合、文件,甚至可以是自定義類或者函數,例如:

作用於列表

>>> for elem in [1,2,3]:
... print(elem)
...
1
2
3

作用於元組

>>> for i in ("zhang", "san", 30):
... print(i)
...
zhang
san
30

作用於字符串

>>> for c in "abc":
...     print(c)
...
a
b
c

作用於集合

>>> for i in {"a","b","c"}:
... print(i)
...
b
a
c

作用於字典

>>> for k in {"age":10, "name":"wang"}:
... print(k)
...
age
name

作用於文件

>>> for line in open("requirement.txt"):
... print(line, end="")
...
Fabric==1.12.0
Markdown==2.6.7

可能有人不經要問,為什麽這麽多不同類型對象都支持 for 語句,還有哪些類型的對象可以作用在 for 語句中呢?回答這個問題之前,我們先要了解 for 循環背後的執行原理。

for 循環是對容器進行叠代的過程,什麽是叠代?叠代就是從某個容器對象中逐個地讀取元素,直到容器中沒有更多元素為止。

那麽,哪些對象支持叠代操作?任何對象都可以嗎?先隨便自定義一個類試試,看行不行:

>>> class MyRange:
... def __init__(self, num):
... self.num = num
...
>>> for i in MyRange(10):
... print(i)
...
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: ‘MyRange‘ object is not iterable

錯誤堆棧日誌非常清楚地告訴我們,MyRange 不是一個可叠代對象,所以它不能用於叠代,到底什麽樣的對象才稱得上是可叠代對象(iterable)呢?

可叠代對象需要實現__iter__方法,並返回一個叠代器,叠代器(Iterator)只需要實現 __next__方法。現在我們就來驗證一下列表為什麽支持叠代:

>>> x = [1,2,3]
>>> its = x.__iter__() # x有此方法,說明列表是可叠代對象
>>> its
<list_iterator object at 0x100f32198>

>>> its.__next__() # its有此方法,說明its是叠代器
1
>>> its.__next__()
2
>>> its.__next__()
3
>>> its.__next__()
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
StopIteration

從試驗結果來看,列表是一個可叠代對象,因為它實現了 __iter__方法,並且返回了一個叠代器對象(list_iterator)因為它實現了 __next__方法我們看到它不斷地調用__next__方法,其實就是不斷地叠代獲取容器中的元素,直到容器中沒有更多元素拋出 StopIteration 異常為止。

那麽 for 語句又是如何循環的呢?到這裏,恐怕你也猜到了,它的步驟是:

  1. 先判斷對象是否為可叠代對象,不是的話直接報錯,拋出TypeError異常,是的話,調用 __iter__方法,返回一個叠代器

  2. 不斷地調用叠代器的__next__方法,每次按序返回叠代器中的一個值

  3. 叠代到最後,沒有更多元素了,就拋出異常 StopIteration,這個異常 python 自己會處理,不會暴露給開發者

技術分享圖片

對於元組,字典,字符串也是同樣的道理,弄明白了 for 的執行原理之後,我們就可以實現自己的叠代器用在 for 循環中。

前面的 MyRange 報錯是因為它沒有實現叠代器協議裏面的這兩個方法,現在繼續改進:

class MyRange:
def __init__(self, num):
self.i = 0
self.num = num

def __iter__(self):
return self

def __next__(self):
if self.i < self.num:
i = self.i
self.i += 1
return i
else:
# 達到某個條件時必須拋出此異常,否則會無止境地叠代下去
raise StopIteration()

因為它實現了__next__方法,所以 MyRange 本身已經是一個叠代器了,所以 __iter__返回的就是對象本身 self。現在用在 for 循環中試試:

for i in MyRange(3):
print(i)
# 輸出
1
2
3

你會發現 MyRange 功能和內建函數 range很相似。for 循環本質是不斷地調用叠代器的__next__方法,直到出現 StopIteration 異常退出循環。所以任何可叠代對象都可以作用在for循環中。

for循環是怎麽工作的