concurrent.futures- 啟動並行任務

阿新 • • 發佈：2018-11-10

python因為其全域性直譯器鎖GIL而無法通過執行緒實現真正的平行計算。這個論斷我們不展開，但是有個概念我們要說明，IO密集型 vs. 計算密集型。

IO密集型：讀取檔案，讀取網路套接字頻繁。

計算密集型：大量消耗CPU的數學與邏輯運算，也就是我們這裡說的平行計算。

而concurrent.futures模組，可以利用multiprocessing實現真正的平行計算。

核心原理是：concurrent.futures會以子程序的形式，平行的執行多個python直譯器，從而令python程式可以利用多核CPU來提升執行速度。由於子程序與主直譯器相分離，所以他們的全域性直譯器鎖也是相互獨立的。每個子程序都能夠完整的使用一個CPU核心。

一、初體驗

Future總結

1. python3自帶，python2需要安裝
2. Executer物件
    它是一個抽象類，它提供了非同步執行的方法，他不能直接使用，但可以通過它的子類
    ThreadPoolExecuter和ProcessPoolExecuter
2.1 Executer.submit(fn,*args,**kwargs)
    fn:需要非同步執行的函式
    *args,**kwargs  fn接受的引數
    該方法的作用就是提交一個可執行的回撥task，它返回一個Future物件
2.2 map(fn,*iterables, timeout=None, chunksize=1)
    map(task,URLS)  
# 返回一個map()迭代器，這個迭代器中的回撥執行返回的結果是有序的



3. Future物件相關
    future可以理解為一個在未來完成的操作，這是非同步程式設計的基礎
    通常情況下我們在遇到IO操作的時候，將會發生阻塞，cpu不能做其他事情
    而future的引入幫助我們在這段等待時間可以完成其他的操作
3.1 done():
    如果當前執行緒已取消/已成功，返回True。
3.2 cance():
    如果當前執行緒正在執行，並且不能取消呼叫，返回Flase。否則呼叫取消，返回True

3.3 running():
    如果當前的執行緒正在執行，則返回True
 
3.4 result():
    返回呼叫返回的值，如果呼叫尚未完成，則此方法等待
    如果等待超時，會丟擲concurrent.futures.TimeoutError
    如果沒有指定超時時間，則等待無時間限制
    如果在完成之前，取消了Future，則會引發CancelledError

4. as_completed():
    在多個Future例項上的迭代器將會被返回
    這些Future例項由fs完成時產生。
    由fs返回的任何重複的Future，都會被返回一次。
    裡面儲存的都是已經執行完成的Future物件

5. wait():
    返回一個元祖，元祖包含兩個元素
        1. 已完成的future集合
        2. 未完成的future集合

初體驗

# coding=utf-8
from concurrent import futures
from concurrent.futures import Future
import time

def return_future(msg):
    time.sleep(3)
    return msg


pool = futures.ThreadPoolExecutor(max_workers=2)

t1 = pool.submit(return_future,'hello')
t2 = pool.submit(return_future,'world')

time.sleep(3)
print(t1.done())  # 如果順利完成，則返回True
time.sleep(3)
print(t2.done())

print(t1.result()) # 獲取future的返回值
time.sleep(3)
print(t2.result())

print("主執行緒")

map（func，* iterables，timeout = None，chunksize = 1 ）

# coding=utf-8

import time
from concurrent.futures import Future,as_completed
from concurrent.futures import ThreadPoolExecutor as Pool
import requests
import time

URLS = ['http://www.baidu.com', 'http://qq.com', 'http://sina.com']

def task(url,timeout=10):
    return requests.get(url=url,timeout=timeout)


pool = Pool()
result = pool.map(task,URLS)

start_time = time.time()
# 按照URLS的順序返回
for res in result:
    print("{} {}".format(res.url,len(res.content)))

# 無序的
with Pool(max_workers=3) as executer:
    future_task = [executer.submit(task,url) for url in URLS]

    for f in as_completed(future_task):
        if f.done():
            f_ret = f.result() # f.result()得到task的返回值，requests物件
            print('%s, done, result: %s, %s' % (str(f), f_ret.url, len(f_ret.content)))

print("耗時",time.time() - start_time)
print("主執行緒")

二、Future物件

Future可以理解為一個未來完成的操作
當我們執行io操作的時候，在等待返回結果之前會產生阻塞
cpu不能做其他事情，而Future的引入幫助我們在等待的這段時間可以完成其他操作

from concurrent.futures import ThreadPoolExecutor as Pool
from concurrent.futures import as_completed
import requests
import time

URLS = ['http://www.baidu.com', 'http://qq.com', 'http://sina.com']

def task(url,timeout=10):
    return requests.get(url=url,timeout=timeout)

# start_time = time.time()
# for url in URLS:
#     ret = task(url)
#     print("{} {}".format(ret.url,len(ret.content)))
# print("耗時",time.time() - start_time)
with Pool(max_workers=3) as executor:
    # 建立future任務
    future_task = [executor.submit(task,url) for url in URLS]

    for f in future_task:
        if f.running():
            print("%s is running"%str(f))

    for f in as_completed(future_task):
        try:
            ret = f.done()
            if ret:
                f_ret = f.result()
                print('%s, done, result: %s, %s' % (str(f), f_ret.url, len(f_ret.content)))
        except Exception as e:
            f.cance()
            print(e)
    
"""
url不是按照順序返回的，說明併發時，當訪問某一個url時，如果沒有得到返回結果，不會發生阻塞
<Future at 0x1c63990e6d8 state=running> is running
<Future at 0x1c639922780 state=running> is running
<Future at 0x1c639922d30 state=running> is running
<Future at 0x1c63990e6d8 state=finished returned Response>, done, result: http://www.baidu.com/, 2381
<Future at 0x1c639922780 state=finished returned Response>, done, result: https://www.qq.com?fromdefault, 243101
<Future at 0x1c639922d30 state=finished returned Response>, done, result: http://sina.com/, 23103
"""

三、模組方法

`concurrent.futures.wait`(fs, timeout=None, return_when=ALL_COMPLETED)

wait()會返回一個tuple，
tuple會包含兩個集合
    1. 已完成的集合
    2. 未完成的集合
使用wait()會獲得更大的自由度，他接受三個引數
FIRST_COMPLETED, FIRST_EXCEPTION和ALL_COMPLETE
預設為ALL_COMPLETE

from concurrent.futures import Future
from concurrent.futures import ThreadPoolExecutor as Pool
from concurrent.futures import as_completed,wait
import requests


URLS = ['http://www.baidu.com', 'http://qq.com', 'http://sina.com']

def task(url,timeout=10):
    return requests.get(url=url,timeout=timeout)

with Pool(max_workers=3) as execute :
    fulture_task = [execute.submit(task,url) for url in URLS]

    for f in fulture_task:
        if f.running():
            print("%s"%(str(f)))

    """
    並且wait還有timeout和return_when兩個引數
    return_when有三個常量
    FIRST_COMPLETED 任何一個future_task執行完成時/取消時，改函式返回
    FIRST_EXCEPTION 任何一個future_task發生異常時，該函式返回，如果沒有異常發生，等同於ALL_COMPLETED    
    ALL_COMPLETED 當所有的future_task執行完畢返回
    """
    results = wait(fulture_task,return_when="FIRST_COMPLETED")#
    done = results[0]
    for d in done:
        print(d)

`concurrent.futures.as_completed`(fs, timeout=None)

在多個Future例項上的迭代器將會被返回
這些Future例項由fs完成時產生。
由fs返回的任何重複的Future，都會被返回一次。
裡面儲存的都是已經執行完成的Future物件

from concurrent.futures import ThreadPoolExecutor as Pool
from concurrent.futures import as_completed
import requests
import time

URLS = ['http://www.baidu.com', 'http://qq.com', 'http://sina.com']

def task(url,timeout=10):
    return requests.get(url=url,timeout=timeout)

with Pool(max_workers=3) as executor:
    # 建立future任務
    future_task = [executor.submit(task,url) for url in URLS]

    for f in future_task:
        if f.running():
            print("%s is running"%str(f))
    
    for f in as_completed(future_task):
        try:
            ret = f.done()
            if ret:
                f_ret = f.result()
                print('%s, done, result: %s, %s' % (str(f), f_ret.url, len(f_ret.content)))
        except Exception as e:
            f.cance()
            print(e)

concurrent.futures- 啟動並行任務

python因為其全域性直譯器鎖GIL而無法通過執行緒實現真正的平行計算。這個論斷我們不展開，但是有個概念我們要說明，IO密集型 vs. 計算密集型。 IO密集型：讀取檔案，讀取網路套接字頻繁。計算密集型：大量消耗CPU的數學與邏輯運算，也就是我們這裡說的平行計算。而concurrent.futur

Python並發編程之線程池/進程池--concurrent.futures模塊

when nod 模式進程 d參數 executor 其他 done 對比 h2 { color: #fff; background-color: #f7af0d; padding: 3px; margin: 10px 0px } 一、關於concurrent.futur

35、concurrent.futures模塊與協程

否則 ssp org 之間內存 pat sta page hide concurrent.futures —Launching parallel tasks concurrent.futures模塊同時提供了進程池和線程池，它是將來的使用趨勢，同樣我們之前學習的進

流程控制：分布式並行任務流程控制

time aid ges stat rdquo net 不同的分布式部署 red 背景：目前工作中遇到一個比較急，又有點費事的工作任務： 1）目前系統中已經已經包含了一些比較完善的部分模塊，但是模塊之間沒有一個控制流程來管理，就造成程序沒有辦法自動化； 2

python並發性能concurrent.futures

-1 兩個 size logs ssp int ces 底層套接字 concurrent.futures模塊，可以利用multiprocessing實現真正的平行計算。核心原理是：concurrent.futures會以子進程的形式，平行的運行多個python解釋器，從而

Python3【模塊】concurrent.futures模塊，線程池進程池

tro containe them executor 進程池自己的 from port clas 　　Python標準庫為我們提供了threading和multiprocessing模塊編寫相應的多線程/多進程代碼，但是當項目達到一定的規模，頻繁創建/銷毀進程或者線程是非

Python Day37 python多線程標準模塊concurrent.futures

ont imp syn multi true 提交使用 bmi define 1 介紹 concurrent.futures模塊提供了高度封裝的異步調用接口 ThreadPoolExecutor：線程池，提供異步調用 ProcessPoolExecutor: 進程池，提供

python全棧開發基礎【第二十六篇】（concurrent.futures模塊、協程、Greenlet、Gevent）

會有什麽 www 上一個 join 開發 tps 初始化 brush 註意 1.不能無限的開進程，不能無限的開線程最常用的就是開進程池，開線程池。其中回調函數非常重要回調函數其實可以作為一種編程思想，誰好了誰就去掉2.只要你用並發，就會有鎖的問題，但是你不能一直去自己加鎖

python--線程池(concurrent.futures)

time pass ever 表示 iterator may 檢測列表多參數 1 #!/usr/bin/env python 2 # -*- coding:utf-8 -*- 3 # author:love_cat 4 5 # 為什麽需要線程池 6 #

多進程 multiprocessing 多線程Threading 線程池和進程池concurrent.futures

不用文件進程池 lba ren 行操作接收參數出現 ali multiprocessing.procsess 定義一個函數 def func():pass 在if __name__=="__main__":中實例化 p = process(target=子進程要執

ubuntu使用crontab啟動定時任務

ron 完整 min blog xxx tar net 範圍 -a Ubuntu cron 定時執行任務 https://blog.csdn.net/qq_38228830/article/details/80545004 參考以上兩篇博客，經過實踐完成自己的定時任務 cr

spring boot啟動定時任務

spring logs 例如 info 一次 work frame mage http 1、定時任務在Spring Boot中的集成在啟動類中加入開啟定時任務的註解：在SpringBoot中使用定時任務相當的簡單。首先，我們在啟動類中加入@EnableScheduli

python | concurrent.futures模塊提升數據處理速度

希望數據預處理 exec resize 參考 margin 情況 neu folder p.p1 { margin: 0.0px 0.0px 0.0px 0.0px; font: 12.0px ".PingFang SC"; color: #454545 } p.p2 {

concurrent.futures模塊

繼續循環方法 nbsp call col 並不會 clas adp 1.concurrent.futures模塊介紹 2.ThreadPoolExecutor線程池使用 3.ProcessPoolExecutor進程池使用 1.concurrent.future

concurrent.futures效能

python因為其全域性直譯器鎖GIL而無法通過執行緒實現真正的平行計算。這個論斷我們不展開，但是有個概念我們要說明，IO密集型 vs. 計算密集型。 IO密集型：讀取檔案，讀取網路套接字頻繁。計算密集型：大量消耗CPU的數學與邏輯運算，也就是我們這裡說的平行計算。而concurre

google chrome瀏覽器程序無法啟動並行配置不正確

進入文件 ica 修改 csdn tps src 沒有 tails 啟動電腦後打開chrome彈出如下信息：系統：win7 進入chrome的安裝路徑 C:\Program Files (x86)\Google\Chrome\Application 兩個版本文件夾，一

在Java應用中通過SparkLauncher啟動Spark任務

本部落格內容基於Spark2.2版本，在閱讀文章並想實際操作前，請確保你有：一臺配置好Spark和yarn的伺服器支援正常spark-submit --master yarn xxxx的任務提交老版本老版本任務提交是基於啟動本地程序，執行指令碼spark-submit xxx **

Python標準模組--concurrent.futures模組（ThreadPoolExecutor：執行緒池，提供非同步呼叫、ProcessPoolExecutor: 程序池，提供非同步呼叫）

目錄 ProcessPoolExecutor: 程序池 ThreadPoolExecutor：執行緒池 map的用法回撥函式 https://docs.python.org/dev/library/concurrent.futures.html

第二天 -- Spark叢集啟動流程 -- 任務提交流程 -- RDD依賴關係 -- RDD快取 -- 兩個案例

第二天 – Spark叢集啟動流程 – 任務提交流程 – RDD依賴關係 – RDD快取 – 兩個案例文章目錄第二天 -- Spark叢集啟動流程 -- 任務提交流程 -- RDD依賴關係 -- RDD快取 -- 兩個案例一、Spa

python 每天如何定時啟動爬蟲任務

想要每天定時啟動，最好是把程式放在linux伺服器上執行，畢竟linux可以不用關機，即定時任務一直存活； #coding:utf8 import datetime import time def doSth(): # 把爬蟲程式放在這個類裡 print(u'這個程式

concurrent.futures- 啟動並行任務

一、初體驗

初體驗

二、Future物件

三、模組方法

concurrent.futures.wait(fs, timeout=None, return_when=ALL_COMPLETED)

concurrent.futures.as_completed(fs, timeout=None)

相關推薦

`concurrent.futures.wait`(fs, timeout=None, return_when=ALL_COMPLETED)

`concurrent.futures.as_completed`(fs, timeout=None)