非同步爬蟲之多執行緒與執行緒池的區別

阿新 • • 發佈：2021-01-23

技術標籤：爬蟲筆記 python 多執行緒

非同步爬蟲的方式：

- [1] 多執行緒、多程序

優點：可以為相關的阻塞單獨開啟，然後就可以非同步執行
缺點：無法無限制的開啟

- [2] 執行緒池、程序池

優點：降低他的消失頻率
缺點：池中的程序有上限

那麼我的建議就是使用第二種方式，很方便也很好理解。

下面有兩個例子供欣賞：
第一個就是使用的是單執行緒方式：

#匯入模組，需要記錄時間問題
import time
#定義一個函式
def get_page(str):
    print("正在下載：",str)
    time.sleep(1)
    print("下載成功:" 
,str)
#下載的內容
name_list = ['王水','文胸','江毛','半斤']
#記錄當前時間
start_time = time.time()
#對列表裡面的內容進行遍歷
for i in range(len(name_list)):
    #匯入到函式去
    get_page(name_list[i])
#記錄當前時間
end_time = time.time()
#看看耗時多長
print('%d second'% (end_time-start_time))
#使用的是單執行緒方式

結果如下圖所示，由於我設定了時間上面的對比，需要4s

第二個就是程序池了，很快的只需要1s

#使用執行緒池來測試
#匯入模組，需要記錄時間問題
import time
from multiprocessing.dummy import Pool
#記錄當前時間
start_time = time.time()
#定義一個函式
def get_page(str):
    print('正在下載:',str)
    time.sleep(1)
    print('下載成功:',str)
#下載的內容
name_list = ['王水','文胸','江毛','半斤']
#初始化一個執行緒池物件，為什麼是4呢，裡面有四個執行緒呀
pool = Pool(4)
#將列表裡面的內容傳遞引數給函式，沒有返回值 

pool.map(get_page,name_list)
end_time = time.time()
#看看耗時多長
print('%d second'% (end_time-start_time))

結果如下圖所示，註釋也在程式碼上面寫清楚了，一起下載，堵塞情況下，很適合。

歐克，點個贊在離開

非同步爬蟲之多執行緒與執行緒池的區別

技術標籤：爬蟲筆記python多執行緒非同步爬蟲的方式： - [1] 多執行緒、多程序

python爬蟲之多執行緒、多程序+程式碼示例

python爬蟲之多執行緒、多程序使用多程序、多執行緒編寫爬蟲的程式碼能有效的提高爬蟲爬取目標網站的效率。

Windows多執行緒與執行緒繫結CPU核心

一、Windows建立多執行緒的方法有CreadThread()和_beginthreadex()函式，Win32 提供了一系列的API函式來完成執行緒的建立、掛起、恢復、終結以及通訊等工作，標頭檔案在

C/C++ 實現多執行緒與執行緒同步

多執行緒中的執行緒同步可以使用，CreateThread，CreateMutex 互斥鎖實現執行緒同步，通過臨界區實現執行緒同步，Semaphore 基於訊號實現執行緒同步，CreateEvent 事件物件的同步，以及執行緒函式傳遞單一引數與多個

Qt中的多執行緒與執行緒池淺析+例項

1. Qt中的多執行緒與執行緒池今天學習了Qt中的多執行緒和執行緒池，特寫這篇部落格來記錄一下

執行緒與執行緒池的那些事之執行緒池篇（萬字長文）

本文關鍵字：執行緒，執行緒池，單執行緒，多執行緒，執行緒池的好處，執行緒回收，建立方式，核心引數，底層機制，拒絕策略,引數設定,動態監控，執行緒隔離

Java多執行緒與執行緒池

多執行緒及其問題，執行緒池及使用。搞懂執行緒生命週期、建立等只是第一步，AQS的設計精髓還需要取理解。

C#中的多執行緒與執行緒死鎖

多執行緒（英語：multithreading），是指從軟體或者硬體上實現多個執行緒併發執行的技術。具有多執行緒能力的計算機因有硬體支援而能夠在同一時間執行多於一個執行緒，進而提升整體處理效能。具有這種能力的系統包括

Java多執行緒與執行緒池技術

一、序言 Java多執行緒程式設計執行緒池被廣泛使用，甚至成為了標配。執行緒池本質是池化技術的應用，和連線池類似，建立連線與關閉連線屬於耗時操作，建立執行緒與銷燬執行緒也屬於重操作，為了提高效率，先提前建

【併發程式設計】3.執行緒與執行緒池

一、執行緒 1.執行緒與程序參考深入理解計算機系統中的概念為了解決CPU與儲存器之間的速度差異，來最大化利用CPU的效能而提出的概念

執行緒與執行緒鎖---python版本（附帶執行緒鎖例項）

程序和執行緒現代的作業系統基本上都是支援多工的作業系統那？什麼叫多工呢，簡單而言，就是作業系統可以同時執行多個任務。

看完這篇還不懂高併發中的執行緒與執行緒池你來打我

從這篇開始將會開啟高效能、高併發系列，本篇是該系列的開篇，主要關注多執行緒以及執行緒池。

Java併發實戰一：執行緒與執行緒安全

從零開始建立一家公司 Java併發程式設計是Java的基礎之一，為了能在實踐中學習併發程式設計，我們跟著建立一家公司的旅途，一起來學習Java併發程式設計。

Java 執行緒與執行緒池進階

1. 執行緒的狀態　　Java程式在執行過程中執行緒可能有6種狀態： New：新建立狀態；

四核8執行緒與八核的區別

四核八執行緒是指使用了超執行緒技術 , 把一個物理核心,模擬成兩個邏輯核心, 理論上要像八顆物理核心一樣在同一時間執行八個執行緒，所以裝置管理器和工作管理員中會顯示出八個核心，但事實上並不是真正的八個核心

Python面向物件之多型原理與用法案例分析

本文例項講述了Python面向物件之多型原理與用法。分享給大家供大家參考，具體如下：

執行上下文與執行上下文棧

執行上下文與執行上下文棧變數提升與函式提升變數提升: 在變數var定義(宣告)語句之前, 就可以訪問到這個變數(undefined)

資料庫實驗之多表查詢與外來鍵

一、需求利用前2次實驗中的【學生表】和【成績表】進行如下操作；【學生表】結構如下：序號，int型別，自增；主鍵；學號，char(10);唯一索引；姓名：varchar(20); 性別：列舉型別，取值為男或女；【學生

執行上下文與執行上下文棧 - js函式高階

程式碼分類全域性程式碼區域性程式碼全域性執行上下文在執行全域性程式碼前將window確定為全域性執行上下文（GO）

MySQL查詢結果集字串操作之多行合併與單行分割

前言我們在做專案寫sql語句的時候，是否會遇到這樣的場景，就是需要把查詢出來的多列，按照字串分割合併成一列顯示，或者把存在資料庫裡面用逗號分隔的一列，查詢分成多列呢，常見場景有，文章標籤，需要吧查詢多個