多執行緒、程序池、協程

阿新 • • 發佈：2019-02-19

程序池

#!/usr/bin/env python
# -*- coding:utf-8 -*-

from lxml import etree
#import threading

# multiprocessing.dummy 是多程序類庫裡裡的一個多執行緒模組，有一個類Pool，表示執行緒池
from multiprocessing.dummy import Pool
import requests
import Queue
import time

class Douban(object):
    def __init__(self):
        self.base_url = "https://movie.douban.com/top250?start="
        self.url_list = [self.base_url + str(page) for page in range(0, 225 + 1, 25)]
        self.headers = {"User-Agent" : "Mozilla/5.0 (Windows NT 10.0; WOW64; Trident/7.0; rv:11.0) like Gecko"}

        # 建立佇列儲存資料
        self.data_queue = Queue.Queue()
        self.count = 0

    def send_request(self, url):
        print url
        html = requests.get(url, headers = self.headers).content
        time.sleep(1)
        self.parse_page(html)


    def parse_page(self, html):
        html_obj = etree.HTML(html)
        node_list = html_obj.xpath("//div[@class='info']")

        for node in node_list:
            # 獲取電影標題
            title = node.xpath("./div[@class='hd']/a/span/text()")[0]
            # 獲取電影評分
            score = node.xpath("./div[@class='bd']//span[@class='rating_num']/text()")[0]

            # 將資料儲存到佇列裡
            self.data_queue.put(score + "\t" + title)
            #print score, title

    def start_work(self):
        #for url in self.url_list:
            # 傳送請求
        #    html = self.send_request(url)
            # 解析響應

        # 建立執行緒池
        pool = Pool(len(self.url_list))
        pool.map(self.send_request, self.url_list)
        pool.close()
        # 主執行緒等待所有子執行緒執行結束，主執行緒再執行後面的程式碼
        pool.join()

        while not self.data_queue.empty():
            print self.data_queue.get()
            self.count += 1

        print "\n%d" % self.count


if __name__ == "__main__":
    douban = Douban()
    start = time.time()
    douban.start_work()

    print "[INFO]: Useing %f secend" % (time.time() - start)

多執行緒

#!/usr/bin/env python
# -*- coding:utf-8 -*-

from lxml import etree
import requests
import threading
import Queue
import time

class Douban(object):
    def __init__(self):
        self.base_url = "https://movie.douban.com/top250?start="
        self.url_list = [self.base_url + str(page) for page in range(0, 225 + 1, 25)]
        self.headers = {"User-Agent" : "Mozilla/5.0 (Windows NT 10.0; WOW64; Trident/7.0; rv:11.0) like Gecko"}

        # 建立佇列儲存資料
        self.data_queue = Queue.Queue()
        self.count = 0

    def send_request(self, url):
        print url
        html = requests.get(url, headers = self.headers).content
        time.sleep(1)
        self.parse_page(html)


    def parse_page(self, html):
        html_obj = etree.HTML(html)
        node_list = html_obj.xpath("//div[@class='info']")

        for node in node_list:
            # 獲取電影標題
            title = node.xpath("./div[@class='hd']/a/span/text()")[0]
            # 獲取電影評分
            score = node.xpath("./div[@class='bd']//span[@class='rating_num']/text()")[0]

            # 將資料儲存到佇列裡
            self.data_queue.put(score + "\t" + title)
            #print score, title

    def start_work(self):
        thread_list = []
        for url in self.url_list:
            # 傳送請求
            #html = self.send_request(url)
            thread = threading.Thread(target = self.send_request, args = [url])
            thread.start()
            thread_list.append(thread)


        # 讓主執行緒等待，等待所有子執行緒執行結束，再向下執行程式碼
        for thread in thread_list:
            thread.join()

        while not self.data_queue.empty():
            print self.data_queue.get()
            self.count += 1

        print "\n%d" % self.count


if __name__ == "__main__":
    douban = Douban()
    start = time.time()
    douban.start_work()

    print "[INFO]: Useing %f secend" % (time.time() - start)

協程

#!/usr/bin/env python
# -*- coding:utf-8 -*-

from lxml import etree
import requests
import Queue
import time

import gevent
from gevent import monkey
monkey.patch_all()
# gevent 可以用同步的語法寫非同步的程式。
# monkey.patch_all() 在Python程式執行的時候，會動態的將網路庫(socket, select)打個補丁，變為非同步的庫。
# 讓程式在進行網路操作的時候，都變為非同步的方式去執行。

class Douban(object):
    def __init__(self):
        self.base_url = "https://movie.douban.com/top250?start="
        self.url_list = [self.base_url + str(page) for page in range(0, 225 + 1, 25)]
        self.headers = {"User-Agent" : "Mozilla/5.0 (Windows NT 10.0; WOW64; Trident/7.0; rv:11.0) like Gecko"}

        # 建立佇列儲存資料
        self.data_queue = Queue.Queue()
        self.count = 0

    def send_request(self, url):
        print url
        html = requests.get(url, headers = self.headers).content
        time.sleep(1)
        self.parse_page(html)


    def parse_page(self, html):
        html_obj = etree.HTML(html)
        node_list = html_obj.xpath("//div[@class='info']")

        for node in node_list:
            # 獲取電影標題
            title = node.xpath("./div[@class='hd']/a/span/text()")[0]
            # 獲取電影評分
            score = node.xpath("./div[@class='bd']//span[@class='rating_num']/text()")[0]

            # 將資料儲存到佇列裡
            self.data_queue.put(score + "\t" + title)
            #print score, title

    def start_work(self):
        #for url in self.url_list:
            # 傳送請求
        #    html = self.send_request(url)
            # 解析響應

        # 建立任務列表，儲存所有的協程任務
        job_list = []
        for url in self.url_list:
            # 建立一個協程任務
            job = gevent.spawn(self.send_request, url)
            # 將任務新增到列表裡
            job_list.append(job)
        # 將所有的協程任務新增到任務佇列裡執行
        gevent.joinall(job_list)


        #gevent.joinall([gevent.spawn(self.send_request, url) for url in self.url_list])
        #job_list = [gevent.spawn(self.send_request, url) for url in self.url_list]
        #gevent.joinall(job_list)

        while not self.data_queue.empty():
            print self.data_queue.get()
            self.count += 1

        print "\n%d" % self.count


if __name__ == "__main__":
    douban = Douban()
    start = time.time()
    douban.start_work()

    print "[INFO]: Useing %f secend" % (time.time() - start)

多執行緒、程序池、協程

程序池 #!/usr/bin/env python # -*- coding:utf-8 -*- from lxml import etree #import threading # multiprocessing.dummy 是多程序類庫裡裡的一個多執行緒模組，有一

java：記憶體池、程序池、執行緒池

記憶體池：自定義記憶體池的思想通過這個"池"字表露無疑，應用程式可以通過系統的記憶體分配呼叫預先一次性申請適當大小的記憶體作為一個記憶體池，之後應用程式自己對記憶體的分配和釋放則可以通過這個記憶體池來完成。只有當記憶體池大小需要動態擴充套件時，才需要再呼叫系統的記憶體分配函式，其他時間對

關於“池”機制的思考（執行緒池、程序池、連線池等）

“池”機制的兩大核心重用緩衝統一管理“池”裡的物件（這個不能作為核心）。。。。。【1】“池”機制有個定長的容器。【2】初始化時容器中儲存有定量的“池”物件（在此用“池”物件統稱“池”中的執行緒、程序或者連結等，下文同）。【3

MFC筆記（四）——多執行緒程式設計1:模組、程序、執行緒間的基本概念

一、模組、程序、執行緒 1.1 模組一段可執行的程式（包括EXE和DLL），其程式程式碼、資料、資源被載入到記憶體中，由系統建立一個數據結構來管理它。這段程式就是一個模組。這裡所說

（2.1.2.4）Java多執行緒（四）、執行緒池

系統啟動一個新執行緒的成本是比較高的，因為它涉及到與作業系統的互動。在這種情況下，使用執行緒池可以很好的提供效能，尤其是當程式中需要建立大量生存期很短暫的執行緒時，更應該考慮使用執行緒池。與資料庫連線池類似的是，執行緒池在系統啟動時即建立大量空閒的執行緒，程

【鐵匠Smith先生的專欄】關注Linux系統軟體開發、多媒體圖形技術、Linux OS技術、多程序多執行緒併發網路程式設計、架構模式研究與實踐、AI等新技術動向、C/C++最新程式設計技術、開原始碼整合與應用等

關注Linux系統軟體開發、多媒體圖形技術、Linux OS技術、多程序多執行緒併發網路程式設計、架構模式研究與實踐、AI等新技術動向、C/C++最新程式設計技術、開原始碼整合與應用等...

Java多執行緒（四）、執行緒池

系統啟動一個新執行緒的成本是比較高的，因為它涉及到與作業系統的互動。在這種情況下，使用執行緒池可以很好的提供效能，尤其是當程式中需要建立大量生存期很短暫的執行緒時，更應該考慮使用執行緒池。與資料庫連線池類似的是，執行緒池在系統啟動時即建立大量空閒的執行緒，程式將一個Runnable物件傳給

java封裝FFmpeg命令，支援原生ffmpeg全部命令，實現FFmpeg多程序處理與多執行緒輸出控制(開啟、關閉、查詢)，rtsp/rtmp推流、拉流

前言：之前已經對FFmpeg命令進行了封裝http://blog.csdn.net/eguid_1/article/details/51787646，但是當時沒有考慮到擴充套件性，所以總體設計不是太好，需要改動的地方也比較多，也不支援原生ffmpeg命令，所以本次版本推翻

Java多執行緒01(Thread類、執行緒建立、執行緒池)

Java多執行緒(Thread類、執行緒建立、執行緒池) 第一章多執行緒 1.1 多執行緒介紹 1.1.1 基本概念程序：程序指正在執行的程式。確切的來說，當一個程式進入記憶體執行，即變成一個程序，程序是處於執行過程中的程式，並且具有一定獨立功能。執行緒：執行緒是程序中的一個執行單元，

Java 程序與執行緒及多執行緒實現（Thread、Runnable、Callable）

程序與執行緒的概念程序：作業系統中一個程式的執行週期稱為一個程序。（是程式的一次動態執行，它對應著從程式碼載入，執行至執行完畢的一個完整的過程，是一個動態的實體） windows是一個多程序的作業系統。執行緒：：一個程式同時執行多個任務。通常，每一個任務就稱為一個執行緒。與程序相

多執行緒(九)： HashTable、HashMap和ConcurrentHashMap

public class HashTest { static Map<String, Integer> map = new HashMap<String, Integer>(); // static Map<String, Integer&g

C#非同步多執行緒總結（delegate、Thread、Task、ThreadPool、Parallel、async、cancel）

同步與非同步多執行緒的區別： 1、同步方法卡介面（UI執行緒忙於計算）；非同步多執行緒不卡介面（主執行緒閒置，子執行緒在計算） 2、同步方法慢（CPU利用率低、資源耗費少）；非同步多執行緒快（CPU利用率高、資源耗費多） 3、同步方法是有序的；非同步方法是無序的（啟動無序、執行時間不確定、結

SpringBoot系統列 3 - 多執行緒資料處理(ThreadPoolTaskExecutor、DruidDataSource)

在上篇文章的基礎上進行改造： package com.hello.util; import org.slf4j.Logger; import org.slf4j.LoggerFactory; import org.springframework.beans.factory.annotation.Au

多執行緒學習-day-07CountDownLatch、CyclicBarrier

執行緒基礎、執行緒之間的共享和協作（目前會將一些概念簡單描述，一些重點的點會詳細描述）學習目標：多執行緒的併發工具類（3） CountDownLatch、CyclicBarrier 一、CountDownLatch 官方介紹： CountDownLatch是在java

Java併發（十八）：阻塞佇列BlockingQueue BlockingQueue（阻塞佇列）詳解二叉堆(一)之圖文解析和 C語言的實現多執行緒程式設計：阻塞、併發佇列的使用總結 Java併發程式設計：阻塞佇列 java阻塞佇列 BlockingQueue（阻塞佇列）詳解

阻塞佇列（BlockingQueue）是一個支援兩個附加操作的佇列。這兩個附加的操作是：在佇列為空時，獲取元素的執行緒會等待佇列變為非空。當佇列滿時，儲存元素的執行緒會等待佇列可用。阻塞佇列常用於生產者和消費者的場景，生產者是往佇列裡新增元素的執行緒，消費者是從佇列裡拿元素的執行緒。阻塞佇列就是生產者

#Java多執行緒知識點總結wait、notify、notifyAll

Java多執行緒設計一個典型的場景，來闡述wait()、notify()、notifyAll()，生產消費者。有生產者、消費者、緩衝佇列（size=10）。生產者不停地向緩衝佇列裡放資料，一旦佇列滿了，則wait()，並notify()消費者進行處理。消費者不停地從緩衝佇列裡

Java多執行緒學習之wait、notify/notifyAll 詳解

轉載 https://www.cnblogs.com/moongeek/p/7631447.html 1、wait()、notify/notifyAll() 方法是Object的本地final方法，無法被重寫。 2、wait()使當前執行緒阻塞，前提是必須先獲

VS中的多執行緒（/MT）、多執行緒除錯（/MTd）、多執行緒DLL（/MD）、多執行緒除錯DLL（/MDd）的區別

一種語言的開發環境往往會附帶有語言庫，這些庫就是對作業系統的API的包裝，我們也稱這些語言庫為執行庫對於MSVC的執行庫（CRT），按照靜態/動態連結，可以分為靜態版和動態版；按照除錯/釋出，可以分為除錯版本和釋出版本；按照單執行緒/多執行緒，可以分為單執行緒版本和多執行

多執行緒中的方法、兩種實現方式、匿名內部類建立多執行緒，執行緒安全問題的解決、

多執行緒兩種實現方式：方式一：繼承Thread類的方式方式二：實現Runnable介面的方式。方式一：步驟： // 1. 定義一個類，然後繼承Thread //

-1-5 java 多執行緒概念程序執行緒區別聯絡 java建立執行緒方式執行緒組執行緒池概念執行緒安全同步同步程式碼塊 Lock鎖 sleep()和wait()方法的區別為什麼wait(),notify(),notifyAll()等方法都定義在O

本文關鍵詞: java 多執行緒概念程序執行緒區別聯絡 java建立執行緒方式執行緒組執行緒池概念執行緒安全同步同步程式碼塊 Lock鎖 sleep()和wait()方法的區別為什麼wait(),notify(),notifyAll()等方法都定義在Object類中多執行緒

多執行緒、程序池、協程

程序池

多執行緒

協程

相關推薦