Python協程與非同步asyncio總結

阿新 • • 發佈：2021-11-04

非同步IO：就是發起一個IO操作（如：網路請求，檔案讀寫等），這些操作一般是比較耗時的，不用等待它結束，可以繼續做其他事情，結束時會發來通知。
協程：又稱為微執行緒，在一個執行緒中執行，執行函式時可以隨時中斷，由程式（使用者）自身控制，執行效率極高，與多執行緒比較，沒有切換執行緒的開銷和多執行緒鎖機制。

Python中非同步IO操作是通過asyncio來實現的。



非同步IO（asyncio）
非同步IO的asyncio庫使用事件迴圈驅動的協程實現併發。使用者可主動控制程式，在認為耗時IO處新增await（yield from）。在asyncio庫中，協程使用@asyncio.coroutine裝飾，使用yield from來驅動，在python3.5中作了如下更改：

@asyncio.coroutine  
-> async

yield from -> await

Python3.8之後 @asyncio.coroutine 裝飾器就會被移除，推薦使用async & await 關鍵字實現協程程式碼。

asyncio中幾個重要概念
1.事件迴圈

管理所有的事件，在整個程式執行過程中不斷迴圈執行並追蹤事件發生的順序將它們放在佇列中，空閒時呼叫相應的事件處理者來處理這些事件。

2.Future

Future物件表示尚未完成的計算，還未完成的結果

3.Task

是Future的子類，作用是在執行某個任務的同時可以併發的執行多個任務。

asyncio.Task用於實現協作式多工的庫，且Task物件不能使用者手動例項化，通過下面2個函式建立：

asyncio.async()

loop.create_task() 或 asyncio.ensure_future()

最簡單的非同步IO示例
run_until_complete():

阻塞呼叫，直到協程執行結束才返回。引數是future，傳入協程物件時內部會自動變為future

asyncio.sleep():

模擬IO操作，這樣的休眠不會阻塞事件迴圈，前面加上await後會把控制權交給主事件迴圈，在休眠（IO操作）結束後恢復這個協程。

提示：

若在協程中需要有延時操作，應該使用 await asyncio.sleep()，而不是使用time.sleep()，因為使用time.sleep()後會釋放GIL，阻塞整個主執行緒，從而阻塞整個事件迴圈。

 
import asyncio
 
async def coroutine_example():
    await asyncio.sleep(1)
    print('zhihu ID: Zarten')
 
coro = coroutine_example()
 
loop = asyncio.get_event_loop()
loop.run_until_complete(coro)
loop.close()
上面輸出：會暫停1秒，等待 asyncio.sleep(1) 返回後列印

建立Task
loop.create_task():

接收一個協程，返回一個asyncio.Task的例項，也是asyncio.Future的例項，畢竟Task是Future的子類。返回值可直接傳入run_until_complete()

返回的Task物件可以看到協程的執行情況

 
import asyncio
 
async def coroutine_example():
    await asyncio.sleep(1)
    print('zhihu ID: Zarten')
 
coro = coroutine_example()
 
loop = asyncio.get_event_loop()
task = loop.create_task(coro)
print('執行情況：', task)
 
loop.run_until_complete(task)
print('再看下執行情況：', task)
loop.close()
輸出結果：

從下圖可看到，當task為finished狀態時，有個result()的方法，我們可以通過這個方法來獲取協程的返回值


獲取協程返回值
有2種方案可以獲取返回值。

第1種方案：通過task.result()

可通過呼叫 task.result() 方法來獲取協程的返回值，但是隻有執行完畢後才能獲取，若沒有執行完畢，result()方法不會阻塞去等待結果，而是丟擲 asyncio.InvalidStateError 錯誤

import asyncio
 
async def coroutine_example():
    await asyncio.sleep(1)
    return 'zhihu ID: Zarten'
 
coro = coroutine_example()
 
loop = asyncio.get_event_loop()
task = loop.create_task(coro)
print('執行情況：', task)
try:
    print('返回值：', task.result())
except asyncio.InvalidStateError:
    print('task狀態未完成，捕獲了 InvalidStateError 異常')
 
loop.run_until_complete(task)
print('再看下執行情況：', task)
print('返回值：', task.result())
loop.close()
執行結果可以看到：只有task狀態執行完成時才能捕獲返回值


第2種方案：通過add_done_callback()回撥

import asyncio
 
def my_callback(future):
    print('返回值：', future.result())
 
async def coroutine_example():
    await asyncio.sleep(1)
    return 'zhihu ID: Zarten'
 
coro = coroutine_example()
 
loop = asyncio.get_event_loop()
 
task = loop.create_task(coro)
task.add_done_callback(my_callback)
 
loop.run_until_complete(task)
loop.close()


控制任務
通過asyncio.wait()可以控制多工

asyncio.wait()是一個協程，不會阻塞，立即返回，返回的是協程物件。傳入的引數是future或協程構成的可迭代物件。最後將返回值傳給run_until_complete()加入事件迴圈

最簡單控制多工

下面程式碼asyncio.wait()中，引數傳入的是由協程構成的可迭代物件

import asyncio
 
async def coroutine_example(name):
    print('正在執行name:', name)
    await asyncio.sleep(1)
    print('執行完畢name:', name)
 
loop = asyncio.get_event_loop()
 
tasks = [coroutine_example('Zarten_' + str(i)) for i in range(3)]
wait_coro = asyncio.wait(tasks)
loop.run_until_complete(wait_coro)
loop.close()
輸出結果：


多工中獲取返回值

方案1：需要通過loop.create_task()建立task物件，以便後面來獲取返回值

下面程式碼asyncio.wait()中，引數傳入的是由future（task）物件構成的可迭代物件

import asyncio
 
async def coroutine_example(name):
    print('正在執行name:', name)
    await asyncio.sleep(1)
    print('執行完畢name:', name)
    return '返回值：' + name
 
loop = asyncio.get_event_loop()
 
tasks = [loop.create_task(coroutine_example('Zarten_' + str(i))) for i in range(3)]
wait_coro = asyncio.wait(tasks)
loop.run_until_complete(wait_coro)
 
for task in tasks:
    print(task.result())
 
loop.close()
方案2：通過回撥add_done_callback()來獲取返回值

import asyncio
 
def my_callback(future):
    print('返回值：', future.result())
 
async def coroutine_example(name):
    print('正在執行name:', name)
    await asyncio.sleep(1)
    print('執行完畢name:', name)
    return '返回值：' + name
 
loop = asyncio.get_event_loop()
 
tasks = []
for i in range(3):
    task = loop.create_task(coroutine_example('Zarten_' + str(i)))
    task.add_done_callback(my_callback)
    tasks.append(task)
 
wait_coro = asyncio.wait(tasks)
loop.run_until_complete(wait_coro)
 
loop.close()
輸出結果：


動態新增協程
方案是建立一個執行緒，使事件迴圈線上程內永久執行

相關函式介紹：

loop.call_soon_threadsafe() ：與 call_soon()類似，等待此函式返回後馬上呼叫回撥函式，返回值是一個 asyncio.Handle 物件，此物件內只有一個方法為 cancel()方法，用來取消回撥函式。

loop.call_soon() ： 與call_soon_threadsafe()類似，call_soon_threadsafe() 是執行緒安全的

loop.call_later()：延遲多少秒後執行回撥函式

loop.call_at()：在指定時間執行回撥函式，這裡的時間統一使用 loop.time() 來替代 time.sleep()

asyncio.run_coroutine_threadsafe()： 動態的加入協程，引數為一個回撥函式和一個loop物件，返回值為future物件，通過future.result()獲取回撥函式返回值

動態新增協程同步方式

通過呼叫 call_soon_threadsafe()函式，傳入一個回撥函式callback和一個位置引數

注意：同步方式，回撥函式 thread_example()為普通函式

import asyncio
from threading import Thread
 
def start_thread_loop(loop):
    asyncio.set_event_loop(loop)
    loop.run_forever()
 
def thread_example(name):
    print('正在執行name:', name)
    return '返回結果：' + name
 
 
new_loop = asyncio.new_event_loop()
t = Thread(target= start_thread_loop, args=(new_loop,))
t.start()
 
handle = new_loop.call_soon_threadsafe(thread_example, 'Zarten1')
handle.cancel()
 
new_loop.call_soon_threadsafe(thread_example, 'Zarten2')
 
print('主執行緒不會阻塞')
 
new_loop.call_soon_threadsafe(thread_example, 'Zarten3')
 
print('繼續執行中...')
輸出結果：


動態新增協程非同步方式

通過呼叫 asyncio.run_coroutine_threadsafe()函式，傳入一個回撥函式callback和一個loop物件

注意：非同步方式，回撥函式 thread_example()為協程

import asyncio
from threading import Thread
 
def start_thread_loop(loop):
    asyncio.set_event_loop(loop)
    loop.run_forever()
 
async def thread_example(name):
    print('正在執行name:', name)
    await asyncio.sleep(1)
    return '返回結果：' + name
 
 
new_loop = asyncio.new_event_loop()
t = Thread(target= start_thread_loop, args=(new_loop,))
t.start()
 
future = asyncio.run_coroutine_threadsafe(thread_example('Zarten1'), new_loop)
print(future.result())
 
asyncio.run_coroutine_threadsafe(thread_example('Zarten2'), new_loop)
 
print('主執行緒不會阻塞')
 
asyncio.run_coroutine_threadsafe(thread_example('Zarten3'), new_loop)
 
print('繼續執行中...')
輸出結果：



從上面2個例子中，當主執行緒執行完成後，由於子執行緒還沒有退出，故主執行緒還沒退出，等待子執行緒退出中。若要主執行緒退出時子執行緒也退出，可以設定子執行緒為守護執行緒 t.setDaemon(True)

協程中生產-消費模型設計
通過上面的動態新增協程的思想，我們可以設計一個生產-消費的模型，至於中介軟體（管道）是什麼無所謂，下面以內建佇列和redis佇列來舉例說明。

提示：若想主執行緒退出時，子執行緒也隨之退出，需要將子執行緒設定為守護執行緒，函式 setDaemon(True)

內建雙向佇列模型
使用內建雙向佇列deque

import asyncio
from threading import Thread
from collections import deque
import random
import time
 
def start_thread_loop(loop):
    asyncio.set_event_loop(loop)
    loop.run_forever()
 
def consumer():
    while True:
        if dq:
            msg = dq.pop()
            if msg:
                asyncio.run_coroutine_threadsafe(thread_example('Zarten'+ msg), new_loop)
 
 
async def thread_example(name):
    print('正在執行name:', name)
    await asyncio.sleep(2)
    return '返回結果：' + name
 
 
 
dq = deque()
 
new_loop = asyncio.new_event_loop()
loop_thread = Thread(target= start_thread_loop, args=(new_loop,))
loop_thread.setDaemon(True)
loop_thread.start()
 
consumer_thread = Thread(target= consumer)
consumer_thread.setDaemon(True)
consumer_thread.start()
 
while True:
    i = random.randint(1, 10)
    dq.appendleft(str(i))
    time.sleep(2)
輸出結果：



redis佇列模型
下面程式碼的主執行緒和雙向佇列的主執行緒有些不同，只是換了一種寫法而已，程式碼如下

生產者程式碼：

import redis
 
conn_pool = redis.ConnectionPool(host='127.0.0.1')
redis_conn = redis.Redis(connection_pool=conn_pool)
 
redis_conn.lpush('coro_test', '1')
redis_conn.lpush('coro_test', '2')
redis_conn.lpush('coro_test', '3')
redis_conn.lpush('coro_test', '4')
消費者程式碼：

import asyncio
from threading import Thread
import redis
 
def get_redis():
    conn_pool = redis.ConnectionPool(host= '127.0.0.1')
    return redis.Redis(connection_pool= conn_pool)
 
def start_thread_loop(loop):
    asyncio.set_event_loop(loop)
    loop.run_forever()
 
async def thread_example(name):
    print('正在執行name:', name)
    await asyncio.sleep(2)
    return '返回結果：' + name
 
 
redis_conn = get_redis()
 
new_loop = asyncio.new_event_loop()
loop_thread = Thread(target= start_thread_loop, args=(new_loop,))
loop_thread.setDaemon(True)
loop_thread.start()
 
#迴圈接收redis訊息並動態加入協程
while True:
    msg = redis_conn.rpop('coro_test')
    if msg:
        asyncio.run_coroutine_threadsafe(thread_example('Zarten' + bytes.decode(msg, 'utf-8')), new_loop)
輸出結果：


asyncio在aiohttp中的應用
aiohttp是一個非同步庫，分為客戶端和服務端，下面只是簡單對客戶端做個介紹以及一個經常遇到的異常情況。aiohttp客戶端為非同步網路請求庫

aiohttp客戶端最簡單的例子
import asyncio
import aiohttp
 
count = 0
 
async def get_http(url):
    async with aiohttp.ClientSession() as session:
        async with session.get(url) as res:
            global count
            count += 1
            print(count, res.status)
 
def main():
    loop = asyncio.get_event_loop()
    url = 'https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&ch=&tn=baiduerr&bar=&wd={0}'
    tasks = [get_http(url.format(i)) for i in range(10)]
    loop.run_until_complete(asyncio.wait(tasks))
    loop.close()
if __name__ == '__main__':
    main()
aiohttp併發量太大的異常解決方案
在使用aiohttp客戶端進行大量併發請求時，程式會丟擲 ValueError: too many file descriptors in select() 的錯誤。

異常程式碼示例

說明：測試機器為windows系統

import asyncio
import aiohttp
 
count = 0
 
async def get_http(url):
    async with aiohttp.ClientSession() as session:
        async with session.get(url) as res:
            global count
            count += 1
            print(count, res.status)
 
def main():
    loop = asyncio.get_event_loop()
    url = 'https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&ch=&tn=baiduerr&bar=&wd={0}'
    tasks = [get_http(url.format(i)) for i in range(600)]
    loop.run_until_complete(asyncio.wait(tasks))
    loop.close()
if __name__ == '__main__':
    main()


原因分析：使用aiohttp時，python內部會使用select()，作業系統對檔案描述符最大數量有限制，linux為1024個，windows為509個。

解決方案：

最常見的解決方案是：限制併發數量（一般500），若併發的量不大可不作限制。其他方案這裡不做介紹，如windows下使用loop = asyncio.ProactorEventLoop() 以及使用回撥方式等

限制併發數量方法
提示：此方法也可用來作為非同步爬蟲的限速方法（反反爬）

使用semaphore = asyncio.Semaphore(500) 以及在協程中使用 async with semaphore: 操作

具體程式碼如下：

import asyncio
import aiohttp
 
 
async def get_http(url):
    async with semaphore:
        async with aiohttp.ClientSession() as session:
            async with session.get(url) as res:
                global count
                count += 1
                print(count, res.status)
 
if __name__ == '__main__':
    count = 0
 
    semaphore = asyncio.Semaphore(500)
    loop = asyncio.get_event_loop()
    url = 'https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&ch=&tn=baiduerr&bar=&wd={0}'
    tasks = [get_http(url.format(i)) for i in range(600)]
    loop.run_until_complete(asyncio.wait(tasks))
    loop.close()

原文地址，原作Zarten。

https://zhuanlan.zhihu.com/p/59621713

Python協程與非同步asyncio總結

非同步IO：就是發起一個IO操作（如：網路請求，檔案讀寫等），這些操作一般是比較耗時的，不用等待它結束，可以繼續做其他事情，結束時會發來通知。

Python協程與非同步IO

協程的概念什麼是協程？協程，又稱微執行緒、纖程。英文名為Coroutine，是一種使用者態的輕量級執行緒。

Python協程 & 非同步程式設計(asyncio) 入門介紹

本文首發於：行者AI 在近期的編碼工作過程中遇到了async和await裝飾的函式，查詢資料後瞭解到這種函式是基於協程的非同步函式。這類程式設計方式稱為非同步程式設計，常用在IO較頻繁的系統中，如：Tornado web框架

http - 協程與非同步 - Python

===協程是啥=== 簡單來說，協程是一種基於執行緒之上，但又比執行緒更加輕量級的存在。對於系統核心來說，協程具有不可見的特性，所以這種由程式設計師自己寫程式來管理的輕量級執行緒又常被稱作 \"使用者空間執行緒

python 協程與go協程的區別

https://www.cnblogs.com/lgjbky/p/10838035.html 程序、執行緒和協程程序的定義：程序，是計算機中已執行程式的實體。程式本身只是指令、資料及其組織形式的描述，程序才是程式的真正執行例項。

Tornado 應用筆記03 協程與非同步示例

目錄非阻塞 sleep用執行緒池處理阻塞操作單任務, 無回撥, 需要用到阻塞操作結果單任務, 帶回調, 需要用到阻塞操作結果,原始實現多工, 帶回調, 需要用到阻塞操作結果非同步HTTP請求IOLoop事件(定時, 回撥)長連線輸出(

python中的asyncio模組協程實現非同步IO

在python3.4中，引入了asyncio模組，在3.5的版本中引入了asynic await 關鍵字。這是asyncio的基礎使用：

python協程系列（五）——asyncio的核心概念與基本架構

　　參考：https://blog.csdn.net/qq_27825451/article/details/86218230 　　宣告：本文針對的是python3.4以後的版本的，因為從3.4開始才引入asyncio，後面的3.5 3.6 3.7版本是向前相容的，只不過語法上面有稍微的

基於swoole與php協程實現非同步非阻塞IO

本文協程排程的實現參考了有讚的zanphp實現：zanphp.io/ 自己寫了一個簡單的swoole+php協程的框架：github.com/neuSnail/Pc…

Python協程 yield與協程greenlet簡單用法示例

本文例項講述了Python協程 yield與協程greenlet簡單用法。分享給大家供大家參考，具體如下：

python 協程 gevent原理與用法分析

本文例項講述了python 協程 gevent原理與用法。分享給大家供大家參考，具體如下：

第十一章：Python高階程式設計-協程和非同步IO

第十一章：Python高階程式設計-協程和非同步IO Python3高階核心技術97講筆記目錄

Python協程(三) Asyncio執行

一、執行Asyncio程式 asyncio.run(coro, *, debug=False) 執行coroutinecoro並返回結果。此函式執行傳入的協程，負責管理 Asyncio 事件迴圈並完結非同步生成器。

python協程系列（七）——asyncio結合多執行緒解決阻塞問題以及timer模擬

　　檢視：https://blog.csdn.net/qq_27825451/article/details/86483493 　　宣告：python協程系列文章的上一篇，即第六篇，詳細介紹了asyncio的幾個底層API概念，asyncio的事件迴圈EventLoop，Future類的詳細使用

Swoole協程與Go協程的區別，很詳細，很牛逼

程式是什麼？程式就是應用程式的啟動例項。例如：開啟一個軟體，就是開啟了一個程式。程式擁有程式碼和開啟的檔案資源，資料資源，獨立的記憶體空間。

Python協程詳解

簡介通常我們認為執行緒是輕量級的程式，因此我們也把協程理解為輕量級的執行緒即微執行緒。

python 高階程式設計與非同步IO併發程式設計(一)python中一切皆物件

python中一切皆物件動態語言和靜態語言：1.python中面對物件更徹底，在python中class，魔法函式，包括程式碼和模組都可以是物件，讓動態語言的特性得到充分的體現

python 協程中的迭代器，生成器原理及應用例項詳解

本文例項講述了python 協程中的迭代器，生成器原理及應用。分享給大家供大家參考，具體如下：

Python協程操作之gevent(yield阻塞，greenlet)，協程實現多工(有規律的交替協作執行)用法詳解

本文例項講述了Python 協程操作之gevent(yield阻塞，greenlet)，協程實現多工(有規律的交替協作執行)用法。分享給大家供大家參考，具體如下：

簡單瞭解python協程的相關知識

什麼是協程協程是python種一種實現多工的方式，他是一種比執行緒更加小的單元，佔用更小的執行單元（資源），為啥說他是一個執行單元，因為他自帶CPU上下文，這樣在合適gr的時機,可以把一個協程切換到另一個協程，

Python協程與非同步asyncio總結

相關推薦