python--線程池(concurrent.futures)

阿新 • • 發佈：2018-06-24

time pass ever 表示 iterator may 檢測列表多參數

 1 #!/usr/bin/env python
 2 # -*- coding:utf-8 -*- 
 3 # author:love_cat
 4 
 5 # 為什麽需要線程池
 6 # 1.主線程中可以獲取某一個線程的狀態或者某一個任務的狀態，以及返回值
 7 # 2.當一個線程完成時，主線程能夠立即知道
 8 # 3.futures可以讓多線程和多進程編碼接口一致
 9 
10 # 導入相應的模塊
11 from concurrent.futures import ThreadPoolExecutor
12 import time
13 
14 
15 def get_sleep(name, t):
 
16     time.sleep(t)
17     print(f"{name}睡了{t}秒")
18 
19 
20 # 創建一個一定容量的線程池
21 # max_workers=3表示池子裏最多可以容納三個線程
22 executor = ThreadPoolExecutor(max_workers=3)
23 
24 # 往池子裏添加任務
25 # 第一個是函數名，註意不要加括號，否則變成調用了
26 # 然後依次寫參數
27 executor.submit(get_sleep, "satori", 4)
28 executor.submit(get_sleep, "mashiro" 
, 3)
29 executor.submit(get_sleep, "miku", 2)
30 
31 # 註意：submit不會阻塞，submit相當於開啟了一個線程
32 # 然後主線程會立即往下執行
33 print("i love satori")  # 因此這句話會最先被打印出來
34 
35 
36 # 程序運行結果
37 ‘‘‘
38 i love satori
39 miku睡了2秒
40 mashiro睡了3秒
41 satori睡了4秒
42 ‘‘‘

 1 #!/usr/bin/env python
 2 # -*- coding:utf-8 -*- 
 3 # author:love_cat 

 4 
 5 from concurrent.futures import ThreadPoolExecutor
 6 import time
 7 
 8 
 9 def get_sleep(name, t):
10     time.sleep(t)
11     print(f"{name}睡了{t}秒")
12     return f"{name}--{t}秒"
13 
14 
15 executor = ThreadPoolExecutor(max_workers=3)
16 
17 # 我們submit函數是具有返回值的，比方說我們賦值為task
18 # 那麽task1，task2，task3可以獲取對應線程的執行狀態
19 task1 = executor.submit(get_sleep, "satori", 4)
20 task2 = executor.submit(get_sleep, "mashiro", 3)
21 task3 = executor.submit(get_sleep, "miku", 2)
22 
23 
24 # task.done()表示任務是否完成
25 print(task1.done())
26 print(task2.done())
27 print(task3.done())
28 
29 # 我們等五秒，因此上面的任務肯定已經全部執行完畢
30 # 再打印狀態
31 print("-------等待五秒鐘-------")
32 time.sleep(5)
33 print(task1.done())
34 print(task2.done())
35 print(task3.done())
36 
37 # 當然我們也可以獲取任務的返回值
38 print(task1.result())
39 print(task2.result())
40 print(task3.result())
41 
42 # 程序運行結果
43 ‘‘‘
44 False
45 False
46 False
47 -------等待五秒鐘-------
48 miku睡了2秒
49 mashiro睡了3秒
50 satori睡了4秒
51 True
52 True
53 True
54 satori--4秒
55 mashiro--3秒
56 miku--2秒
57 ‘‘‘
58 # 首先主線程在添加完任務之後，會立刻執行task.done()，此時三個任務還沒有執行完畢，因此打印三個False
59 # 打印等待五秒鐘
60 # 主線程等待五秒鐘之後，三個任務已經執行完畢，並且會打印各自的內容。
61 # 執行task.done()，由於此時三個任務執行完畢，因此打印三個True
62 # 然後通過task.result()會得到任務的返回值

 1 #!/usr/bin/env python
 2 # -*- coding:utf-8 -*- 
 3 # author:love_cat
 4 
 5 # 關於task.result()方法，這個方法是阻塞的
 6 # 只有在獲取到函數的返回值之後才會執行，那麽此時任務也已經執行完畢
 7 
 8 from concurrent.futures import ThreadPoolExecutor
 9 import time
10 
11 
12 def get_sleep(t):
13     print(f"{t}")
14     time.sleep(t)
15     return f"我睡了{t}秒"
16 
17 
18 executor = ThreadPoolExecutor(max_workers=3)
19 
20 task1 = executor.submit(get_sleep, 3)
21 task2 = executor.submit(get_sleep, 4)
22 task3 = executor.submit(get_sleep, 1)
23 
24 task2.result()
25 print("主線程執行完畢··········")
26 
27 ‘‘‘
28 3
29 4
30 1
31 主線程執行完畢··········
32 ‘‘‘
33 # 可以看到先打印3,4,1，然後等待大概四秒鐘，打印"主線程執行完畢··········"
34 # task.result()方法是會阻塞的，其實也很好理解，task.result()是為了獲取任務的返回值，如果任務都還沒有執行完，那麽當然會卡住

#!/usr/bin/env python
# -*- coding:utf-8 -*- 
# author:love_cat

# 一般我們要確保所有的任務都執行完畢，才選擇讓主線程往下走
from concurrent.futures import ThreadPoolExecutor
import time


def get_sleep(t):
    print(f"{t}")
    time.sleep(t)
    return f"我睡了{t}秒"


executor = ThreadPoolExecutor(max_workers=3)

task1 = executor.submit(get_sleep, 3)
task2 = executor.submit(get_sleep, 4)
task3 = executor.submit(get_sleep, 1)

# 將所有的task添加到一個列表中
all_task = [task1, task2, task3]

for task in all_task:
    print(task.result())

print("主線程執行完畢···")

‘‘‘
3
4
1
我睡了3秒
我睡了4秒
我睡了1秒
主線程執行完畢···
‘‘‘

# 首先打印3,4,1很好理解，但是為什麽先是"我睡了3秒"，難道不應該是"我睡了1秒"嗎？
# 關於task.result()的返回順序問題，是按照添加任務的順序返回的
# 先執行的是task1.result()，所以必須要先等待三秒
# 再執行task2.result()，由於已經過了三秒，因此再等待一秒
# 最後執行task3.result(),此時task3早已經執行完畢，然後直接打印"我睡了1秒"
# 因此task.result()的返回順序，是由任務的添加順序決定的

# 比如，我換一種方式添加

all_task = [task3, task2, task1]
for task in all_task:
    print(task.result())

‘‘‘
我睡了1秒
我睡了4秒
我睡了3秒
‘‘‘
# 返回結果也驗證了我們上述的判斷

#!/usr/bin/env python
# -*- coding:utf-8 -*- 
# author:love_cat

# 如何取消一個任務，註意任務一旦開始執行那麽便不能被取消了

from concurrent.futures import ThreadPoolExecutor
import time


def get_sleep(t):
    print(f"{t}")
    time.sleep(t)
    return f"我睡了{t}秒"


executor = ThreadPoolExecutor(max_workers=3)

task1 = executor.submit(get_sleep, 3)
task2 = executor.submit(get_sleep, 4)
task3 = executor.submit(get_sleep, 1)

# task.cancel()表示取消一個函數，返回值是一個布爾類型。
# 通過True或者False，來判斷是否取消成功
print(task3.cancel())
‘‘‘
3
4
1
False
‘‘‘
# 可以看到返回結果為False，因為程序已經執行了

#!/usr/bin/env python
# -*- coding:utf-8 -*- 
# author:love_cat

# 取消任務，只有任務在還沒有執行的時候

from concurrent.futures import ThreadPoolExecutor
import time


def get_sleep(t):
    print(f"{t}")
    time.sleep(t)
    return f"我睡了{t}秒"


# 這次我們只添加兩個任務，首先task3肯定被添加到了任務隊列裏
# 但由於最大工作數是2，因此暫時是不會執行的，只有當某個其他的任務執行完畢，才會被執行
# 那麽此時就可以取消了，因為task3還沒有被執行
executor = ThreadPoolExecutor(max_workers=2)

task1 = executor.submit(get_sleep, 3)
task2 = executor.submit(get_sleep, 4)
task3 = executor.submit(get_sleep, 1)

print(task3.cancel())
‘‘‘
3
4
True
‘‘‘
# 可以看到返回結果True，說明取消成功了，而且task3的任務也沒有執行

#!/usr/bin/env python
# -*- coding:utf-8 -*- 
# author:love_cat

# 如何獲取已完成的任務的返回值
# 這裏使用as_complete函數
from concurrent.futures import ThreadPoolExecutor, as_completed
import time


def get_sleep(name, t):
    time.sleep(t)
    return f"{name}睡了{t}秒"


executor = ThreadPoolExecutor(max_workers=3)

task1 = executor.submit(get_sleep, "mashiro", 3)
task2 = executor.submit(get_sleep, "satori", 4)
task3 = executor.submit(get_sleep, "miku", 1)
all_task = [task1, task2, task3]

# 會異步檢測有哪些任務完成
# 既然這樣的話，那麽我們可以推測，返回值應該和添加順序無關，哪個先完成，哪個就先被返回
for task in as_completed(all_task):
    print(task.result())

‘‘‘
miku睡了1秒
mashiro睡了3秒
satori睡了4秒
‘‘‘

# 因此我們分析的是正確的，as_complete函數會不斷地檢測有哪些任務完成
# 那麽as_complete是如何做到這一點的呢？
# 我們可以看一下源碼

# as_complete源碼
‘‘‘
def as_completed(fs, timeout=None):
    """An iterator over the given futures that yields each as it completes.

    Args:
        fs: The sequence of Futures (possibly created by different Executors) to
            iterate over.
        timeout: The maximum number of seconds to wait. If None, then there
            is no limit on the wait time.

    Returns:
        An iterator that yields the given Futures as they complete (finished or
        cancelled). If any given Futures are duplicated, they will be returned
        once.

    Raises:
        TimeoutError: If the entire result iterator could not be generated
            before the given timeout.
    """
    if timeout is not None:
        end_time = timeout + time.time()

    fs = set(fs)
    total_futures = len(fs)
    with _AcquireFutures(fs):
        finished = set(
                f for f in fs
                if f._state in [CANCELLED_AND_NOTIFIED, FINISHED])
        pending = fs - finished
        waiter = _create_and_install_waiters(fs, _AS_COMPLETED)
    finished = list(finished)
    try:
        yield from _yield_finished_futures(finished, waiter,
                                           ref_collect=(fs,))

        while pending:
            if timeout is None:
                wait_timeout = None
            else:
                wait_timeout = end_time - time.time()
                if wait_timeout < 0:
                    raise TimeoutError(
                            ‘%d (of %d) futures unfinished‘ % (
                            len(pending), total_futures))

            waiter.event.wait(wait_timeout)

            with waiter.lock:
                finished = waiter.finished_futures
                waiter.finished_futures = []
                waiter.event.clear()

            # reverse to keep finishing order
            finished.reverse()
            yield from _yield_finished_futures(finished, waiter,
                                               ref_collect=(fs, pending))

    finally:
        # Remove waiter from unfinished futures
        for f in fs:
            with f._condition:
                f._waiters.remove(waiter)
‘‘‘

# 可以看到函數當中出現了yield from,說明這個as_complete是一個生成器
# yield from 出現了兩次
# 第一次：有可能主線程當中遇到了阻塞，在執行到as_complete函數的時候，已經有一部分任務執行完畢，所以第一個yield from將那些已經結束的任務yield出去
# 第二次：然後對於那些沒有完成的任務，就不斷地循環檢測它們的狀態，如果有完成的任務，那麽繼續yield出去

# 因此異步的特點就在於此，當任務完成之後，我們主線程會立刻感受到，從而獲取已經完成的任務的返回值

#!/usr/bin/env python
# -*- coding:utf-8 -*- 
# author:love_cat

# 我們也可以通過executor獲取返回結果
# 可以用到executor下的map方法

from concurrent.futures import ThreadPoolExecutor
import time


def get_sleep(t):
    time.sleep(t)
    return f"睡了{t}秒"


executor = ThreadPoolExecutor(max_workers=3)

# 首先這裏的map和python內置的map是比較類似的
# map裏面傳入函數，後面是任務的參數，作為一個可叠代對象
# 這樣就可以自動執行了，不需要submit，map函數是位於executor下的一個方法

for data in executor.map(get_sleep, [3, 4, 1]):
    print(data)

# 程序運行結果
‘‘‘
mashiro睡了3秒
satori睡了4秒
miku睡了1秒
‘‘‘
# 可以看到返回值的順序和你添加任務的順序保持一致
# map函數不像as_complete一樣，具有異步檢測機制，可以先返回已經完成的任務

# 並且也不用再使用result()方法了，返回的直接就是任務的返回值
# 至於原因我們也可以看一下源碼
‘‘‘
    def map(self, fn, *iterables, timeout=None, chunksize=1):
        """Returns an iterator equivalent to map(fn, iter).

        Args:
            fn: A callable that will take as many arguments as there are
                passed iterables.
            timeout: The maximum number of seconds to wait. If None, then there
                is no limit on the wait time.
            chunksize: The size of the chunks the iterable will be broken into
                before being passed to a child process. This argument is only
                used by ProcessPoolExecutor; it is ignored by
                ThreadPoolExecutor.

        Returns:
            An iterator equivalent to: map(func, *iterables) but the calls may
            be evaluated out-of-order.

        Raises:
            TimeoutError: If the entire result iterator could not be generated
                before the given timeout.
            Exception: If fn(*args) raises for any values.
        """
        if timeout is not None:
            end_time = timeout + time.time()

        fs = [self.submit(fn, *args) for args in zip(*iterables)]

        # Yield must be hidden in closure so that the futures are submitted
        # before the first iterator value is required.
        def result_iterator():
            try:
                # reverse to keep finishing order
                fs.reverse()
                while fs:
                    # Careful not to keep a reference to the popped future
                    if timeout is None:
                        yield fs.pop().result()
                    else:
                        yield fs.pop().result(end_time - time.time())
            finally:
                for future in fs:
                    future.cancel()
        return result_iterator()
‘‘‘
# 可以到在yield的時候，並沒有yield出來task，而是直接將task.result()給yield出來了
# 因此循環得到的就是task的返回值

‘‘‘
fs = [self.submit(fn, *args) for args in zip(*iterables)]
‘‘‘
# 而且從這句源碼我們也可以看到，當調用map的時候，本質上調用的還是executor.submit,因為self就相當於我們這裏的executor

#!/usr/bin/env python
# -*- coding:utf-8 -*- 
# author:love_cat

# 關於map方法，再補充一點
# 有個地方，個人覺得非常惡心(只是本人這樣覺得)

from concurrent.futures import ThreadPoolExecutor
import time


# 之前的例子是一個參數，那麽如果改成兩個，map函數那裏如何傳參呢？
def get_sleep(name, t):
    time.sleep(t)
    return f"{name}睡了{t}秒"


executor = ThreadPoolExecutor(max_workers=3)

‘‘‘
def map(self, fn, *iterables, timeout=None, chunksize=1):
‘‘‘
# 通過源碼，得到map函數定義如下。可以看到接收很多參數，但參數都是可叠代的類型
# 於是我們想到了 executor.map(get_sleep,["mashiro",3],["satori",4],["miku",1])
# 但是這樣的話就完了。我們可以看看源碼對我們傳入的參數是怎麽處理的
‘‘‘
fs = [self.submit(fn, *args) for args in zip(*iterables)]
‘‘‘
# 可以看到源碼幹了這麽一件事
# 如果我們像之前那樣傳參的話,舉個栗子
‘‘‘
def mmp(*iterable):
    for args in zip(*iterable):
        print(*args)

mmp(["mashiro", 3], ["satori", 4], ["miku", 1])

    
‘mashiro‘, ‘satori‘, ‘miku‘
3, 4, 1    
‘‘‘
# 那麽此時self.submit(fn,*args) ===>self.submit(fn, "mashiro", "satori", "miku")
# 這與我們傳參完全搞反了
# 因此，當我們要傳入多個參數的是，應該這樣傳,executor.map(get_sleep,["mashiro","satori","miku"],[3,4,1])

for data in executor.map(get_sleep, ["mashiro", "satori", "miku"], [3, 4, 1]):
    print(data)
# 程序運行結果
‘‘‘
mashiro睡了3秒
satori睡了4秒
miku睡了1秒
‘‘‘
# 這樣程序便可正確執行

# 關於傳參的方式，我個人的話可能會這麽設計
‘‘‘
def mmp(*iterable):
    for args in iterable:
        print(*args)

mmp(["mashiro", 3], ["satori", 4], ["miku", 1])
輸出結果：
    mashiro 3
    satori 4
    miku 1
‘‘‘

#!/usr/bin/env python
# -*- coding:utf-8 -*- 
# author:love_cat

# 讓主線程等待
# 可以使用wait方法

from concurrent.futures import ThreadPoolExecutor, wait
import time


def get_sleep(name, t):
    print(f"{name}睡完{t}秒了，主線程你走了嗎？")
    time.sleep(t)
    return f"{name}睡了{t}秒"


executor = ThreadPoolExecutor(max_workers=3)

task1 = executor.submit(get_sleep, "mashiro", 3)
task2 = executor.submit(get_sleep, "satori", 4)
task3 = executor.submit(get_sleep, "miku", 1)
all_task = [task1, task2, task3]

# wait(all_task)，會使主線程卡在這裏，只有等待所有任務完成才會往下走
wait(all_task)   # 裏面有個return_when參數，默認是ALL_COMPLETE,會等待所有任務完成。也可以指定FIRST_COMPLETE,等待第一個任務完成就往下走
print("你們都睡完了，我才能往下走···")
# 程序運行結果
‘‘‘
mashiro睡完3秒了，主線程你走了嗎？
satori睡完4秒了，主線程你走了嗎？
miku睡完1秒了，主線程你走了嗎？
你們都睡完了，我才能往下走···
‘‘‘

python--線程池(concurrent.futures)

time pass ever 表示 iterator may 檢測列表多參數 1 #!/usr/bin/env python 2 # -*- coding:utf-8 -*- 3 # author:love_cat 4 5 # 為什麽需要線程池 6 #

進程池和線程池 concurrent.futures import ProcessPoolExecutor,ThreadPoolExecutor

nbsp thread 線程池 map append __name__ executor shu def import time#線程池可以用shutdown submit from threading import current_thread from concurre

Python並發編程之線程池/進程池--concurrent.futures模塊

when nod 模式進程 d參數 executor 其他 done 對比 h2 { color: #fff; background-color: #f7af0d; padding: 3px; margin: 10px 0px } 一、關於concurrent.futur

多進程 multiprocessing 多線程Threading 線程池和進程池concurrent.futures

不用文件進程池 lba ren 行操作接收參數出現 ali multiprocessing.procsess 定義一個函數 def func():pass 在if __name__=="__main__":中實例化 p = process(target=子進程要執

小白成長之路：初識python(六) --python線程池

def utf == list exc free odin threading .get #!/usr/bin/env python# -*- coding:utf-8 -*-import threadingimport queueimport time"""對照著武老師的

python 線程池使用

ext 運行時間 now() star HA mail sta 策略 lxml 傳統多線程方案會使用“即時創建，即時銷毀”的策略。盡管與創建進程相比，創建線程的時間已經大大的縮短，但是如果提交給線程的任務是執行時間較短，而且執行次數極其頻繁，那麽服務器將處於不停的創建線程

python-線程池

chang executor pre mes -- raise chunk over 基本 ********線程池******** Python標準模塊--Concurrent.futures 1.介紹 Concurrent.futures模塊提供了高度封裝的異步

python線程池

parse == for lee tails aid net bsp text https://blog.csdn.net/qq_33961117/article/details/82587873#!/usr/bin/python # -*- coding: utf-8

python線程池（threadpool）模塊使用筆記

dict str wait req star ret image code 調用一、安裝與簡介 pip install threadpool pool = ThreadPool(poolsize) requests = makeRequests(som

Python3【模塊】concurrent.futures模塊，線程池進程池

tro containe them executor 進程池自己的 from port clas 　　Python標準庫為我們提供了threading和multiprocessing模塊編寫相應的多線程/多進程代碼，但是當項目達到一定的規模，頻繁創建/銷毀進程或者線程是非

Python--線程隊列(queue)、multiprocessing模塊（進程對列Queue、管道(pipe)、進程池）、協程

有一種啟動進程 fin 機制內部優先級隊列 queue類解決 producing 隊列(queue) 隊列只在多線程裏有意義，是一種線程安全的數據結構。 get與put方法 ‘‘‘ 創建一個“隊列”對象 import queue q = queue.Que

python爬蟲之線程池和進程池

偏見通信內存空間正常 io操作爬取網站總結性能一、需求　　最近準備爬取某電商網站的數據，先不考慮代理、分布式，先說效率問題（當然你要是請求的太快就會被封掉，親測，400個請求過去，服務器直接拒絕連接，心碎），步入正題。一般情況下小白的我們第一個想到的是fo

python---基礎知識回顧（十）進程和線程（自定義線程池，上下文管理器和協程的使用）

elf () self. 數據類型大小 get 基礎數據類型 __init__ 進行前戲：在進行自定義線程池前，先了解下Queue隊列隊列中可以存放基礎數據類型，也可以存放類，對象等特殊數據類型 from queue import Queue class T:

python 之進程池與線程池

add __main__ .get 異步範圍功能能力並發 cut 1.什麽時候用池？池的功能是限制啟動的進程數或線程數。什麽時候應該限制？當並發的任務數遠遠超過了計算機的承受能力時，即無法一次性開啟過多的進程數或線程數時就應該用池的概念將

python 線程(隊列,線程池),協程(理論greenlet,gevent模塊,)

重要 .get 取代線程 accept 明顯 prior 方式介紹線程的隊列: queue隊列,使用import queue,用法與進程Queue一樣 queue is especially useful in threaded programming when in

線程池原理及python實現

source 實例以及代碼 let range python實現 queue 上界 https://www.cnblogs.com/goodhacker/p/3359985.html 為什麽需要線程池　　目前的大多數網絡服務器，包括Web服務器、Email服務器以

Python入門學習-DAY37-進程池與線程池、協程、gevent模塊

在線 ces pro alt 18C name bcb 所有 __name__ 一、進程池與線程池基本使用: 　　進程池和線程池操作一樣提交任務的兩種方式: 同步調用:提交完一個任務之後,就在原地等待,等待任務完完整整地運行完畢拿到結果後,再執行下一行代碼,會導致任務是

python全棧脫產第37天------進程池與線程池、協程、gevent模塊、單線程下實現並發的套接字通信

rt thread adp targe rec 並發 urn pat return nco 一、進程池與線程池　　調用concurrent.futures下的ThreadPoolExecutor,ProcessPoolExecutor來實現　　提交任務有兩種方式：同步調

Python 37 進程池與線程池、協程

程序圖片 image 完整 strong 自動兩種 src pan 一：進程池與線程池提交任務的兩種方式： 1、同步調用：提交完一個任務之後，就在原地等待，等任務完完整整地運行完畢拿到結果後，再執行下一行代碼，會導致任務是串行執行 2、異步調用：提交完一個任務之後

python-進程池與線程池，協程

接收另一個 cep 用戶大於 some don 多個接口一、進程池與線程池實現並發的手段有兩種，多線程和多進程。註：並發是指多個任務看起來是同時運行的。主要是切換+保存狀態。當我們需要執行的並發任務大於cpu的核數時，我們需要知道一個操作系統不能無限的開啟進

python--線程池(concurrent.futures)

相關推薦