一個例子讓你看清執行緒排程的隨機性
執行緒排程的幾個基本知識點
多執行緒併發執行時有很多同學捋不清楚排程的隨機性會導致哪些問題,要知道如果訪問臨界資源不加鎖會導致一些突發情況發生甚至死鎖。
關於執行緒排程,需要深刻了解以下幾個基礎知識點:
- 排程的最小單位是輕量級程序【比如我們編寫的hello world最簡單的C程式,執行時就是一個輕量級程序】或者執行緒;
- 每個執行緒都會分配一個時間片,時間片到了就會執行下一個執行緒;
- 執行緒的排程有一定的隨機性,無法確定什麼時候會排程;
- 在同一個程序內,建立的所有執行緒除了執行緒內部建立的區域性資源,程序建立的其他資源所有執行緒共享;
比如:主執行緒和子執行緒都可以訪問全域性變數,開啟的檔案描述符等。
例項
再多的理論不如一個形象的例子來的直接。
預期程式碼時序
假定我們要實現一個多執行緒的例項,預期程式執行時序如下:
期待的功能時序:
- 主程序建立子執行緒,子執行緒函式function();
- 主執行緒count自加,並分別賦值給value1,value2;
- 時間片到了後切換到子執行緒,子執行緒判斷value1、value2值是否相同,如果不同就列印資訊value1,value2,count的值,但是因為主執行緒將count先後賦值給了value1,value2,所以value1,value2的值應該永遠相同,所以不應該列印任何內容;
- 重複2、3步驟。
程式碼1
好了,現在我們按照這個時序編寫程式碼如下:
1 #include <stdio.h> 2 #include <stdlib.h> 3 #include <string.h> 4 #include <pthread.h> 5 #include <unistd.h> 6 7 unsigned int value1,value2, count=0; 8 void *function(void *arg); 9 int main(int argc, char *argv[]) 10 { 11 pthread_t a_thread; 12 13 if (pthread_create(&a_thread, NULL, function, NULL) < 0) 14 { 15 perror("fail to pthread_create"); 16 exit(-1); 17 } 18 while ( 1 ) 19 { 20 count++; 21 value1 = count; 22 value2 = count; 23 } 24 return 0; 25 } 26 27 void *function(void *arg) 28 { 29 while ( 1 ) 30 { 31 if (value1 != value2) 32 { 33 printf("count=%d , value1=%d, value2=%d\n", count, value1, value2); 34 usleep(100000); 35 } 36 } 37 return NULL; 38 }
乍一看,該程式應該可以滿足我們的需要,並且程式執行的時候不應該列印任何內容,但是實際執行結果出乎我們意料。
編譯執行:
gcc test.c -o run -lpthread
./run
程式碼1執行結果
執行結果:
可以看到子程式會隨機列印一些資訊,為什麼還有這個執行結果呢?
其實原因很簡單,就是我們文章開頭所說的,執行緒排程具有䘺隨機性,我們無法規定讓核心何時排程某個執行緒。
有列印資訊,那麼這說明此時value1和value2的值是不同的,那也說明了排程子執行緒的時候,是在主執行緒向value1和value2之間的位置排程的。
程式碼1執行的實際時序
實際上程式碼的執行時序如下所示:
如上圖,在某一時刻,當程式走到value2 = count;這個位置的時候,核心對執行緒進行了排程,於是子程序在判斷value1和value2的值的時候,發現這兩個變數值不相同,就有了列印資訊。
該程式在下面這兩行程式碼之間排程的機率還是很大的。
value1 = count;
value2 = count;
解決方法
如何來解決併發導致的程式沒有按預期執行的問題呢?
對於執行緒來說,常用的方法有posix訊號量、互斥鎖,條件變數等,下面我們以互斥鎖為例,講解如何避免程式碼1的問題的出現。
互斥鎖的定義和初始化:
pthread_mutex_t mutex;
pthread_mutex_init(&mutex, NULL)
申請釋放鎖:
pthread_mutex_lock(&mutex);
pthread_mutex_unlock(&mutex);
原理:
進入臨界區之前先申請鎖,如果能獲得鎖就繼續往下執行,
如果申請不到,就休眠,直到其他執行緒釋放該鎖為止。
程式碼2
1 #include <stdio.h>
2 #include <stdlib.h>
3 #include <string.h>
4 #include <pthread.h>
5 #include <unistd.h>
6 #define _LOCK_
7 unsigned int value1,value2, count=0;
8 pthread_mutex_t mutex;
9 void *function(void *arg);
10
11 int main(int argc, char *argv[])
12 {
13 pthread_t a_thread;
14
15 if (pthread_mutex_init(&mutex, NULL) < 0)
16 {
17 perror("fail to mutex_init");
18 exit(-1);
19 }
20
21 if (pthread_create(&a_thread, NULL, function, NULL) < 0)
22 {
23 perror("fail to pthread_create");
24 exit(-1);
25 }
26 while ( 1 )
27 {
28 count++;
29 #ifdef _LOCK_
30 pthread_mutex_lock(&mutex);
31 #endif
32 value1 = count;
33 value2 = count;
34 #ifdef _LOCK_
35 pthread_mutex_unlock(&mutex);
36 #endif
37 }
38 return 0;
39 }
40
41 void *function(void *arg)
42 {
43 while ( 1 )
44 {
45 #ifdef _LOCK_
46 pthread_mutex_lock(&mutex);
47 #endif
48
49 if (value1 != value2)
50 {
51 printf("count=%d , value1=%d, value2=%d\n", count, value1, value2);
52 usleep(100000);
53 }
54 #ifdef _LOCK_
55 pthread_mutex_unlock(&mutex);
56 #endif
57 }
58 return NULL;
59 }
如上述程式碼所示:主執行緒和子執行緒要訪問臨界資源value1,value2時,都必須先申請鎖,獲得鎖之後才可以訪問臨界資源,訪問完畢再釋放互斥鎖。
該程式碼執行之後就不會列印任何資訊。
我們來看下,如果程式在下述程式碼之間產生排程時,程式的時序圖。
value1 = count;
value2 = count;
時序圖如下:
如上圖所示:
- 時刻n,主執行緒獲得mutex,從而進入臨界區;
- 時刻n+1,時間片到了,切換到子執行緒;
- n+2時刻子執行緒申請不到鎖mutex,所以放棄cpu,進入休眠;
- n+3時刻,主執行緒釋放mutex,離開臨界區,並喚醒阻塞在mutex的子執行緒,子執行緒申請到mutex,進入臨界區;
- n+4時刻,子執行緒離開臨界區,釋放mutex。
可以看到,加鎖之後,即使主執行緒在value2 =count; 之前產生了排程,子執行緒由於獲取不到mutex,會進入休眠,只有主執行緒出了臨界區,子執行緒才能獲得mutex,訪問value1和value2,就永遠不會列印資訊,就實現了我們預期的程式碼時序。
總結
實際專案中,可能程式的併發的情況可能會更加複雜,比如多個cpu上執行的任務之間,cpu執行的任務和中斷之間,中斷和中斷之間,都有可能併發。
有些排程的概率雖然很小,但是不代表不發生,而且由於資源同步互斥導致的問題,很難復現,縱觀Linux核心程式碼,所有的臨界資源都會對應鎖。
多閱讀Linux核心原始碼,學向大神學習,與大神神交。
正所謂程式碼讀百遍,其義自見!
熟讀程式碼千萬行,不會編寫也會抄!
關於核心和應用程式的同步互斥的知識點,可以檢視一口君的其他文章。
更多Linux乾貨,請關注一口Linux