1. 程式人生 > >5.迭代器和生成器

5.迭代器和生成器

1.1.概念

 迭代器協議

  • 迭代器協議:物件需要提供next方法,它要麼返回迭代中的下一項,要麼引起一個StopIteration異常,以終止迭代
  • 可迭代物件:實現了迭代器協議的物件

 迭代器

  • 迭代器是訪問集合內元素的一種方式,一般用來遍歷資料
  • 迭代器和以下標的訪問方式不一樣,迭代器是不能返回的(比如下標方式 list[2],之後可以訪問list[0],list[1],只能__next__),迭代器提供了一種惰性方式獲取資料(就是隻有在訪問資料的時候才去計算或者說才去獲取資料)

生成器

  • python使用生成器對延遲操作提供了支援,所謂延遲操作,是指在需要的時候才產生結果,而不是立即產生結果。這也是生成器的主要好處

生成器函式

  • 與常規函式不同的是:使用yield語句而不是return語句返回結果。yield語句一次返回一個結果,在每個結果中間,掛起函式,下次執行的時候,從上一次掛起地方開始。

生成器表示式

  • 返回的是一個生成器物件,這個物件只有在需要的時候才產生結果

1.2. 迭代器必須實現iter()方法

Python中 list,truple,str,dict這些都可以被迭代,但他們並不是迭代器。為什麼?

因為和迭代器相比有一個很大的不同,list/truple/map/dict這些資料的大小是確定的,也就是說有多少事可知的。但迭代器不是,迭代器不知道要執行多少次,所以可以理解為不知道有多少個元素,每呼叫一次next(),就會往下走一步,是惰性的。

  • Iterable:判斷是不是可以迭代
  • Iterator:判斷是不是迭代器
from collections.abc import Iterable,Iterator

a = [1,2,]

print(isinstance(a,Iterable))    #True    list是可迭代的
print(isinstance(a,Iterator))    #False   list不是迭代器 

 通過iter()方法,獲取iterator物件

from collections.abc import Iterable,Iterator

a = [1,2,]

iter_rator 
= iter(a) print(isinstance(a,Iterable)) #True 可迭代的 print(isinstance(iter_rator,Iterator)) # True 迭代器 print(isinstance((x for x in range(10)),Iterator)) #True
# 總結 # 凡是可以for迴圈的,都是Iterable # 凡是可以next()的,都是Iterator # list,truple,dict,str,都是Itrable不是Iterator,但可以通過iter()函式獲得一個Iterator物件
class Iterable(metaclass=ABCMeta):

    __slots__ = ()

    @abstractmethod
    def __iter__(self):
        while False:
            yield None

    @classmethod
    def __subclasshook__(cls, C):
        if cls is Iterable:
            return _check_methods(C, "__iter__")
        return NotImplemented
Iterable原始碼

1.3.自定義迭代器

通過自定義一個迭代器,進一步說明什麼是迭代器,什麼是可迭代物件

from collections.abc import Iterator

class Company(object):
    def __init__(self, employee_list):
        self.employee = employee_list

    def __iter__(self):
        return MyIterator(self.employee)

#自定義迭代器
class MyIterator(Iterator):         #如果不繼承Iterator,則必須實現__iter__方法
    def __init__(self, employee_list):
        self.iter_list = employee_list
        self.index = 0   #初始化索引位置

    def __next__(self):
        #真正返回迭代值的邏輯
        try:
            word = self.iter_list[self.index]
        except IndexError:
            raise StopIteration
        self.index += 1
        return word

if __name__ == "__main__":
    company = Company(["derek1", "derek2", "derek3"])
    my_itor = iter(company)
    
    print(next(my_itor))     #derek1
    print(next(my_itor))     #derek2
    print(next(my_itor))     #derek3
    
    for item in company:
        print (item)         #derek1  derek2  derek3

 1.4.生成器函式的使用

 (1)生成器函式和普通函式的區別

#函式裡只要有yield關鍵字,就是生成器函式
def gen_func():
    yield 1

def func():
    return 1


if __name__ == '__main__':
    
    gen = gen_func()   
    print(type(gen))     #<class 'generator'>   返回的是一個生成器物件
    
    res = func()
    print(type(res))     #<class 'int'>    返回1
    pass

 (2)取出生成器裡面的值

#函式裡只要有yield關鍵字,就是生成器函式
def gen_func():
    yield 1
    yield 2
    yield 3


if __name__ == '__main__':

    gen = gen_func()
    print(type(gen))     #<class 'generator'>   返回的是一個生成器物件

    for value in gen:
        print(value)     # 1,2,3

 (3)斐波那契的例子

def fib(index):
    re_list = []
    n,a,b = 0,0,1
    while n < index:
        re_list.append(b)
        a,b = b, a+b
        n += 1
    return re_list

print(fib(10))    #[1, 1, 2, 3, 5, 8, 13, 21, 34, 55]

 假如當資料量非常大的時候,這樣全部列印會消耗非常大的記憶體,下面使用yield,雖然同樣是獲取資料,但是它實際上是不消耗記憶體的

def gen_fib(index):
    n,a,b = 0,0,1
    while n < index:
        yield b       
        a,b = b, a+b
        n += 1

for data in gen_fib(10):
    print(data)   # 1, 1, 2, 3, 5, 8, 13, 21, 34, 55