【python】迭代器與生成器到底是什麼?看完你就知道
阿新 • • 發佈:2020-09-06
迭代器跟生成器,與上篇文章講的裝飾器一樣,都是屬於我的一個老大難問題。
通常就是遇到的時候就去搜一下,結果在一大坨各種介紹部落格中看了看,回頭又忘記了。
你是不是也是這樣呢?
俗話說:好記性不如爛筆頭,雖然現在基本不咋用筆寫字了,但是還是要好好整理下,起碼以後我就不用搜了。
如果現在給你一個列表`list_a = [1, 2, 3, 4]`,讓你去迭代它,相信大家都很熟悉,直接用for迴圈就完事兒,
```
list_a = [1, 2, 3, 4]
for i in list_a:
print(i)
```
執行
```
1
2
3
4
[Finished in 0.1s]
```
可以看到,for迴圈迭代了列表中的每一個元素,列印了出來。
那麼for迴圈背後都做了什麼事情呢?
### 一、 容器、可迭代物件、迭代器
聽起來陌生,但是你絕對熟悉的詞兒。
在python中,一切都是物件,物件的抽象是類,而物件的集合就是容器。
使用python中常見的容器有很多,比如:`列表list:[0, 1, 2]`,`集合set:([0, 1, 2])`,`字典dict:{0:0, 1:1, 2:2}`以及`元組tuple(0, 1, 2)`。
這些都是多個元素集中在一起的單元,區別的是內部資料結構的實現方法。
所有的容器都是可以迭代的,你可以用for迴圈去迭代上述的容器試試。
那把一個個元素找出來,用到的就是迭代器。用iter()可以建立一個迭代器。
迭代器提供一個``next()``方法,這個方法你每次呼叫的時候會給你返回下一個物件,或者``StopIteration``,也就是沒有物件可以給你了。
```
list_a = [1, 2, 3, 4]
it = iter(list_a) # 建立迭代器
print(next(it)) #呼叫next()
print(next(it))
print(next(it))
print(next(it))
print(next(it))
```
執行結果,前4個print可以正常返回,第5個時候就出現`StopIteration`錯誤了,因為列表中4個元素已經返回完了。
```
1
2
3
4
Traceback (most recent call last):
File "D:\練習\demo_iterator.py", line 9, in
print(next(it))
StopIteration
[Finished in 0.1s with exit code 1]
```
### 二、生成器
什麼是生成器?簡單粗暴一點:生成器就是懶人版的迭代器。
在上述的建立迭代器操作中,我們顯然是做了一次性生成的操作,`list_a = [1, 2, 3, 4]`,這4個元素一次性生成好,以供`next()`呼叫。
但是生成出的這些元素都是會儲存到記憶體中去,這只是4個元素,如果有上千萬、上億元素呢?
我並不是第一時間要用到所有的元素,我只要在我呼叫`next()`的時候產生一個返回給我就好,那麼這樣一次性生成就會白白佔用了大量的記憶體。
生成器應運而生,當呼叫`next()`的時候,才會生成下一個變數。
生成器的寫法很簡單,用小括號,比如把一個列表生成式括起來:`(i for i in range(10000))`,這樣就初始化了一個生成器。
```
print([i for i in range(10)])
print(i for i in range(10))
```
上面的時列表,下面的就是一個生成器了,區別就是``[]``和``()``。
執行結果:
```
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
at 0x033383A8>
[Finished in 0.1s]
```
#### yield關鍵字
此外,函式也可以成為生成器,祕密就是``yield``關鍵字,比如:
```
def gen():
a = 0
while a < 100:
yield a
a += 1
test = gen()
print(next(test))
print(next(test))
print(next(test))
print(next(test))
```
執行結果:
```
0
1
2
3
[Finished in 0.1s]
```
``yield``關鍵字,可以這樣理解:當函式執行到這一行的時候,程式會從這裡暫停,``yield``相當於``return``會返回,
當下次迭代時候,則會從``yield``的下一行程式碼開始執行。
所以,我呼叫了4次print,可以從0開始依次輸出。
從我工作中的使用場景出發的話,我在做一些自動化測試的時候,有些變數引數是不可以重複的,用迭代器來定義變數的生成規則,每次
呼叫都會產生一個新的,就不會重