深入學習python多執行緒與GIL

阿新 • • 發佈：2020-01-09

python 多執行緒效率

在一臺8核的CentOS上，用python 2.7.6程式執行一段CPU密集型的程式。

import time
def fun(n):#CPU密集型的程式
  while(n>0):
    n -= 1

start_time = time.time()
fun(10000000)
print('{} s'.format(time.time() - start_time))#測量程式執行時間

測量三次程式的執行時間，平均時間為0.968370994秒。這就是一個執行緒執行一次fun(10000000)所需要的時間。

下面用兩個執行緒並行來跑這段CPU密集型的程式。

import time
import threading

def fun(n):
  while(n>0):
    n -= 1

start_time = time.time()
t1 = threading.Thread( target=fun,args=(10000000,) )
t1.start()
t2 = threading.Thread( target=fun,) )
t2.start()

t1.join()
t2.join()
print('{} s'.format(time.time() - start_time))

測量三次程式的執行時間，平均時間為2.150056044秒。

為什麼在8核的機器上，多執行緒執行時間並不比順序執行快呢？

再做另一個實驗，用下面的命令，把8核cpu中的7個核禁掉。

[xxx]# echo 0 > /sys/devices/system/cpu/cpu1/online
[xxx]# echo 0 > /sys/devices/system/cpu/cpu2/online
[xxx]# echo 0 > /sys/devices/system/cpu/cpu3/online
[xxx]# echo 0 > /sys/devices/system/cpu/cpu4/online
[xxx]# echo 0 > /sys/devices/system/cpu/cpu5/online
[xxx]# echo 0 > /sys/devices/system/cpu/cpu6/online
[xxx]# echo 0 > /sys/devices/system/cpu/cpu7/online

然後在執行這個多執行緒的程式，三次平均時間為2.533491453秒。為什麼多執行緒程式在多核上跑的時間只比單核快一點點呢？

這就要提到python程式多執行緒的實現機制了。

Python多執行緒實現機制

python的多執行緒機制，就是用C實現的真實系統中的執行緒。執行緒完全被作業系統控制。

python內部建立一個執行緒的步驟是這樣的：

建立一個數據結構PyThreadState，其中含有一些直譯器狀態
呼叫pthread建立執行緒
執行執行緒函式

由於python是解釋形動態語言，所以在實現執行緒時，需要PyThreadState結構來儲存一些資訊：

當前的stack frame (對python程式碼)

當前的遞迴深度
執行緒ID
可選的tracing/profiling/debugging hooks

PyThreadState是C語言實現的一個結構體（摘自[2]）：

typedef struct _ts {
  struct _ts *next; # 連結串列指正
  PyInterpreterState *interp; # 直譯器狀態
  struct _frame *frame; # 當前的stack frame
  int recursion_depth; # 當前的遞迴深度
  int tracing;
  int use_tracing;
  Py_tracefunc c_profilefunc;
  Py_tracefunc c_tracefunc;
  PyObject *c_profileobj;
  PyObject *c_traceobj;
  PyObject *curexc_type;
  PyObject *curexc_value;
  PyObject *curexc_traceback;
  PyObject *exc_type;
  PyObject *exc_value;
  PyObject *exc_traceback;
  PyObject *dict;
  int tick_counter;
  int gilstate_counter;
  PyObject *async_exc;
  long thread_id; # 執行緒ID
} PyThreadState;

從目前最新的python原始碼中來看，這個結構體中的內容已經有所改變，但記錄直譯器狀態的指標PyInterpreterState *interp依然存在。

python直譯器實現時，用了一個全域性變數(_PyThreadState_Current)

[https://github.com/python/cpython/blob/3.1/Python/pystate.c]（python3.1和之前的程式碼中都存在，python3.2就有所不同了）

PyThreadState *_PyThreadState_Current = NULL;

_PyThreadState_Current指向當前執行執行緒的PyThreadState資料結構。直譯器通過這個變數，來獲取當前所執行執行緒的資訊。

python程式中，有一個全域性直譯器鎖GIL來控制執行緒的執行，每一個時刻只允許一個執行緒執行。

GIL的行為

GIL最基本的行為只有下面兩個：

當前執行的執行緒持有GIL
執行緒遇到I/O阻塞時，會釋放GIL。（阻塞等待時，就釋放GIL，給另一個執行緒執行的機會）

那麼，如果遇到CPU密集型的執行緒，一直佔用CPU，不會被I/O阻塞，是不是其它執行緒就沒有機會執行了呢？

非也，為了避免這種情況，直譯器還會週期性的check並執行執行緒排程。

直譯器週期性check行為，做的就是下面這3件事：

復位tick計數器
在主執行緒中，檢查有沒有需要處理的訊號
讓當前執行執行緒釋放(Release)GIL，讓其他執行緒獲取(acquire)GIL並執行（給其他執行緒執行的機會）

而直譯器check的週期，預設是100個tick。直譯器的tick並不是基於時間的，每個tick大致相當於一條彙編指令的執行時間。

從直譯器的check行為中可以看到，只有主執行緒中會處理訊號，子執行緒中都不處理訊號。所以python多執行緒程式，會給人一種無法處理Ctrl+C的假象，因為大部分情況下主執行緒被block住了，無法處理SIGINT訊號。

注意python中並沒有實現執行緒排程，python的多執行緒排程完全依賴於作業系統。所以python多執行緒程式設計中沒有執行緒優先順序等概念。

GIL的實現

python的GIL並不是簡單的用lock實現的，GIL是用signal實現的。

執行緒獲取(acquire)GIL前，先檢查有沒有被free，如果沒有，就sleep等待signal
執行緒釋放GIL時，還要傳送signal

參考

[1] Understanding the Python GIL. http://dabeaz.com/python/UnderstandingGIL.pdf

[2] Inside the Python GIL. http://www.dabeaz.com/python/GIL.pdf

以上就是本文的全部內容，希望對大家的學習有所幫助，也希望大家多多支援我們。

深入學習python多執行緒與GIL

python 多執行緒效率在一臺8核的CentOS上，用python 2.7.6程式執行一段CPU密集型的程式。

python 的多執行緒與 GIL

python 的多執行緒與 GIL python 的多執行緒多少有點違背大家的直覺，由於 GIL 的存在和執行緒上下文的切換，多執行緒並沒有起到加快運算速度，反而更慢。以最常用的 CPython 為例，由於 GIL 的存在，以下 CPU 密集型

python多執行緒與多程序及其區別

個人一直覺得對學習任何知識而言，概念是相當重要的。掌握了概念和原理，細節可以留給實踐去推敲。掌握的關鍵在於理解，通過具體的例項和實際操作來感性的體會概念和原理可以起到很好的效果。本文通過一些具體的例子

Python多執行緒Threading、子執行緒與守護執行緒例項詳解

本文例項講述了Python多執行緒Threading、子執行緒與守護執行緒。分享給大家供大家參考，具體如下：

Python併發程式設計——多執行緒與協程

Pythpn併發程式設計——多執行緒與協程目錄 Pythpn併發程式設計——多執行緒與協程

多執行緒與高併發學習筆記（持續更新中）

一、基礎概念什麼是執行緒什麼是程序？什麼是執行緒？程序是系統中正在執行的一個程式，程式一旦執行就是程序。

Java中多執行緒與併發_volatile關鍵字的深入理解

一、volatile關鍵字 volatile是JVM提供的一種輕量級的同步機制，特性： 1.保證記憶體可見性

C呼叫Python之多執行緒與traceback列印

技術標籤：Python 一、C多執行緒呼叫Python 1、參考如下文章： python中的GIL詳解Python進階：深入GIL(上篇)Python進階：深入GIL(下篇)c程式多次呼叫python指令碼的正確開啟模式C++多執行緒中呼叫python api函式

JAVASE小白學習筆記多執行緒之死鎖問題的概述與使用

技術標籤：JAVASEjava多執行緒多執行緒之死鎖問題的概述與使用 1.產生死鎖的原因2.產生死鎖的四個必要條件3.演示一個死鎖程式碼總結

一篇文章掌握Python生成器與匿名函式，多執行緒與多程序

測試奇譚，BUG不見。講解之前，我先說說我的教程和網上其他教程的區別： 1 我分享的是我在工作中高頻使用的場景，是精華內容；

最適合初學者瞭解的Java多執行緒與併發基礎

前言本文會介紹Java中多執行緒與併發的基礎，適合初學者食用，如果想看關於多執行緒與併發稍微進階一些的內容可以看我的另一篇部落格— 《鎖》

linux 下python多執行緒遞迴複製資料夾及資料夾中的檔案

本文是利用python 複製資料夾剛開始寫了一個普通的遞迴複製資料夾然後想了想覺得對io頻繁的程式 threading 執行緒還比較友好就寫了個多執行緒版本的最噁心人的地方就是路徑其他都還好吧

python多執行緒使用方法例項詳解

本文例項講述了python多執行緒使用方法。分享給大家供大家參考，具體如下：

如何使用Python多執行緒測試併發漏洞

這篇文章主要介紹瞭如何使用Python多執行緒測試併發漏洞,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

python主執行緒與子執行緒的結束順序例項解析

這篇文章主要介紹了python主執行緒與子執行緒的結束順序例項解析,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

淺談PyQt5中非同步重新整理UI和Python多執行緒總結

目前任務需要做一個介面程式，PyQt是非常方便的選擇，QT豐富的控制元件以及python方便的程式設計。近期遇到介面中執行一些後臺任務時介面卡死的情況，解決了在這裡記錄下。

PYQT5開啟多個執行緒和視窗,多執行緒與多視窗的互動例項

每點選一次按鈕,彈出一個對話方塊(子視窗),同時開啟一個子執行緒來執行任務並更新對話方塊內容,關閉對話方塊則關閉對應子執行緒

Python多執行緒模組Threading用法示例小結

本文例項講述了Python多執行緒模組Threading用法。分享給大家供大家參考，具體如下：

python多執行緒高階鎖condition簡單用法示例

本文例項講述了python多執行緒高階鎖condition簡單用法。分享給大家供大家參考，具體如下：

python多執行緒案例之多工copy檔案完整例項

本文例項講述了python多執行緒案例之多工copy檔案。分享給大家供大家參考，具體如下：

深入學習python多執行緒與GIL

相關推薦