1. 程式人生 > >作業系統中的fork()函式對應的程序建立過程

作業系統中的fork()函式對應的程序建立過程

一、fork入門知識

     一個程序,包括程式碼、資料和分配給程序的資源。fork()函式通過系統呼叫建立一個與原來程序幾乎完全相同的程序,

也就是兩個程序可以做完全相同的事,但如果初始引數或者傳入的變數不同,兩個程序也可以做不同的事。


    一個程序呼叫fork()函式後,系統先給新的程序分配資源,例如儲存資料和程式碼的空間。然後把原來的程序的所有值都

複製到新的新程序中,只有少數值與原來的程序的值不同。相當於克隆了一個自己。

     我們來看一個例子:

 

[cpp]  view plain copy
  1. /* 
  2.  *  fork_test.c 
  3.  *  version 1 
  4.  *  Created on: 2010-5-29 
  5.  *      Author: wangth 
  6.  */  
  7. #include <unistd.h>  
  8. #include <stdio.h>   
  9. int main ()   
  10. {   
  11.     pid_t fpid; //fpid表示fork函式返回的值  
  12.     int count=0;  
  13.     fpid=fork();   
  14.     if (fpid < 0)   
  15.         printf("error in fork!");   
  16.     else if (fpid == 0) {  
  17.         printf("i am the child process, my process id is %d/n",getpid());   
  18.         printf("我是爹的兒子/n");//對某些人來說中文看著更直白。  
  19.         count++;  
  20.     }  
  21.     else {  
  22.         printf("i am the parent process, my process id is %d/n",getpid());   
  23.         printf("我是孩子他爹/n");  
  24.         count++;  
  25.     }  
  26.     printf("統計結果是: %d/n",count);  
  27.     return 0;  
  28. }  

 

執行結果是:
    i am the child process, my process id is 5574
    我是爹的兒子
    統計結果是: 1
    i am the parent process, my process id is 5573
    我是孩子他爹
    統計結果是: 1


    在語句fpid=fork()之前,只有一個程序在執行這段程式碼,但在這條語句之後,就變成兩個程序在執行了,這兩個程序的幾乎完全相同,

將要執行的下一條語句都是if(fpid<0)……
    為什麼兩個程序的fpid不同呢,這與fork函式的特性有關。

fork呼叫的一個奇妙之處就是它僅僅被呼叫一次,卻能夠返回兩次,它可能有三種不同的返回值:
    1)在父程序中,fork返回新建立子程序的程序ID;
    2)在子程序中,fork返回0;
    3)如果出現錯誤,fork返回一個負值;

    在fork函式執行完畢後,如果建立新程序成功,則出現兩個程序,一個是子程序,一個是父程序。在子程序中,fork函式返回0,在父程序中,

fork返回新建立子程序的程序ID。我們可以通過fork返回的值來判斷當前程序是子程序還是父程序。

    引用一位網友的話來解釋fpid的值為什麼在父子程序中不同。“其實就相當於連結串列,程序形成了連結串列,父程序的fpid(p 意味point)指向子程序的程序id,

因為子程序沒有子程序,所以其fpid為0.


fork出錯可能有兩種原因:
    1)當前的程序數已經達到了系統規定的上限,這時errno的值被設定為EAGAIN。
    2)系統記憶體不足,這時errno的值被設定為ENOMEM。


    建立新程序成功後,系統中出現兩個基本完全相同的程序,這兩個程序執行沒有固定的先後順序,哪個程序先執行要看系統的程序排程策略。
    每個程序都有一個獨特(互不相同)的程序識別符號(process ID),可以通過getpid()函式獲得,還有一個記錄父程序pid的變數,可以通過getppid()函式獲得變數的值。
fork執行完畢後,出現兩個程序,

有人說兩個程序的內容完全一樣啊,怎麼列印的結果不一樣啊,那是因為判斷條件的原因,上面列舉的只是程序的程式碼和指令,還有變數啊。


    執行完fork後,程序1的變數為count=0,fpid!=0(父程序)。程序2的變數為count=0,fpid=0(子程序),這兩個程序的變數都是獨立的,

存在不同的地址中,不是共用的,這點要注意。可以說,我們就是通過fpid來識別和操作父子程序的。


    還有人可能疑惑為什麼不是從#include處開始複製程式碼的,這是因為fork是把程序當前的情況拷貝一份,執行fork時,程序已經執行完了int count=0;

fork只拷貝下一個要執行的程式碼到新的程序。

 

二、fork進階知識

    先看一份程式碼:

 

[cpp]  view plain copy  
  1. /* 
  2.  *  fork_test.c 
  3.  *  version 2 
  4.  *  Created on: 2010-5-29 
  5.  *      Author: wangth 
  6.  */  
  7. #include <unistd.h>  
  8. #include <stdio.h>  
  9. int main(void)  
  10. {  
  11.    int i=0;  
  12.    printf("i son/pa ppid pid  fpid/n");  
  13.    //ppid指當前程序的父程序pid  
  14.    //pid指當前程序的pid,  
  15.    //fpid指fork返回給當前程序的值  
  16.    for(i=0;i<2;i++){  
  17.        pid_t fpid=fork();  
  18.        if(fpid==0)  
  19.            printf("%d child  %4d %4d %4d/n",i,getppid(),getpid(),fpid);  
  20.        else  
  21.            printf("%d parent %4d %4d %4d/n",i,getppid(),getpid(),fpid);  
  22.    }  
  23.    return 0;  
  24. }  

 

    執行結果是:
    i son/pa ppid pid  fpid
    0 parent 2043 3224 3225
    0 child  3224 3225    0
    1 parent 2043 3224 3226
    1 parent 3224 3225 3227
    1 child     1 3227    0
    1 child     1 3226    0 


    這份程式碼比較有意思,我們來認真分析一下:
    第一步:在父程序中,指令執行到for迴圈中,i=0,接著執行fork,fork執行完後,系統中出現兩個程序,分別是p3224和p3225

(後面我都用pxxxx表示程序id為xxxx的程序)。可以看到父程序p3224的父程序是p2043,子程序p3225的父程序正好是p3224。我們用一個連結串列來表示這個關係:
    p2043->p3224->p3225 
    第一次fork後,p3224(父程序)的變數為i=0,fpid=3225(fork函式在父程序中返向子程序id),程式碼內容為:

 

[c-sharp]  view plain copy  
  1. for(i=0;i<2;i++){  
  2.     pid_t fpid=fork();//執行完畢,i=0,fpid=3225  
  3.     if(fpid==0)  
  4.        printf("%d child  %4d %4d %4d/n",i,getppid(),getpid(),fpid);  
  5.     else  
  6.        printf("%d parent %4d %4d %4d/n",i,getppid(),getpid(),fpid);  
  7. }  
  8. return 0;  

 

    p3225(子程序)的變數為i=0,fpid=0(fork函式在子程序中返回0),程式碼內容為:

[c-sharp]  view plain copy  
  1. for(i=0;i<2;i++){  
  2.     pid_t fpid=fork();//執行完畢,i=0,fpid=0  
  3.     if(fpid==0)  
  4.        printf("%d child  %4d %4d %4d/n",i,getppid(),getpid(),fpid);  
  5.     else  
  6.        printf("%d parent %4d %4d %4d/n",i,getppid(),getpid(),fpid);  
  7. }  
  8. return 0;  

 

    所以打印出結果:
    0 parent 2043 3224 3225
    0 child  3224 3225    0
    第二步:假設父程序p3224先執行,當進入下一個迴圈時,i=1,接著執行fork,系統中又新增一個程序p3226,對於此時的父程序,

p2043->p3224(當前程序)->p3226(被建立的子程序)。
    對於子程序p3225,執行完第一次迴圈後,i=1,接著執行fork,系統中新增一個程序p3227,對於此程序,p3224->p3225(當前程序)->p3227(被建立的子程序)。

從輸出可以看到p3225原來是p3224的子程序,現在變成p3227的父程序。父子是相對的,這個大家應該容易理解。只要當前程序執行了fork,該程序就變成了父程序了,就打印出了parent。
  所以打印出結果是:
    1 parent 2043 3224 3226
    1 parent 3224 3225 3227 
    第三步:第二步建立了兩個程序p3226,p3227,這兩個程序執行完printf函式後就結束了,因為這兩個程序無法進入第三次迴圈,無法fork,該執行return 0;了,其他程序也是如此。
    以下是p3226,p3227打印出的結果:
    1 child     1 3227    0
    1 child     1 3226    0 
    細心的讀者可能注意到p3226,p3227的父程序難道不該是p3224和p3225嗎,怎麼會是1呢?這裡得講到程序的建立和死亡的過程,

在p3224和p3225執行完第二個迴圈後,main函式就該退出了,也即程序該死亡了,因為它已經做完所有事情了。p3224和p3225死亡後,

p3226,p3227就沒有父程序了,這在作業系統是不被允許的,所以p3226,p3227的父程序就被置為p1了,p1是永遠不會死亡的,至於為什麼,

這裡先不介紹,留到“三、fork高階知識”講。


    總結一下,這個程式執行的流程如下:

這個程式最終產生了3個子程序,執行過6次printf()函式。