fork函數詳解

阿新 • • 發佈：2018-09-25

內容應用 detail ppi 調度一定的引入會有 erro

一、fork入門知識

一個進程，包括代碼、數據和分配給進程的資源。fork（）函數通過系統調用創建一個與原來進程幾乎完全相同的進程，也就是兩個進程可以做完全相同的事，但如果初始參數或者傳入的變量不同，兩個進程也可以做不同的事。
一個進程調用fork（）函數後，系統先給新的進程分配資源，例如存儲數據和代碼的空間。然後把原來的進程的所有值都復制到新的新進程中，只有少數值與原來的進程的值不同。相當於克隆了一個自己。

我們來看一個例子：

/* 
 *  fork_test.c 
 *  version 1 
 *  Created on: 2010-5-29 
 *      Author: wangth 
  
*/  
#include <unistd.h>  
#include <stdio.h>   
int main ()   
{   
    pid_t fpid; //fpid表示fork函數返回的值  
    int count=0;  
    fpid=fork();   
    if (fpid < 0)   
        printf("error in fork!");   
    else if (fpid == 0) {  
        printf("i am the child process, my process id is %d/n 
",getpid());   
        printf("我是爹的兒子/n");//對某些人來說中文看著更直白。  
        count++;  
    }  
    else {  
        printf("i am the parent process, my process id is %d/n",getpid());   
        printf("我是孩子他爹/n");  
        count++;  
    }  
    printf("統計結果是: %d/n",count);  
    return 0;  
}

運行結果是：
i am the child process, my process id is 5574
我是爹的兒子
統計結果是: 1
i am the parent process, my process id is 5573
我是孩子他爹
統計結果是: 1
在語句fpid=fork()之前，只有一個進程在執行這段代碼，但在這條語句之後，就變成兩個進程在執行了，這兩個進程的幾乎完全相同，將要執行的下一條語句都是if(fpid<0)……
為什麽兩個進程的fpid不同呢，這與fork函數的特性有關。fork調用的一個奇妙之處就是它僅僅被調用一次，卻能夠返回兩次，它可能有三種不同的返回值：
1）在父進程中，fork返回新創建子進程的進程ID；
2）在子進程中，fork返回0；
3）如果出現錯誤，fork返回一個負值；

在fork函數執行完畢後，如果創建新進程成功，則出現兩個進程，一個是子進程，一個是父進程。在子進程中，fork函數返回0，在父進程中，fork返回新創建子進程的進程ID。我們可以通過fork返回的值來判斷當前進程是子進程還是父進程。
fork出錯可能有兩種原因：
1）當前的進程數已經達到了系統規定的上限，這時errno的值被設置為EAGAIN。
2）系統內存不足，這時errno的值被設置為ENOMEM。
創建新進程成功後，系統中出現兩個基本完全相同的進程，這兩個進程執行沒有固定的先後順序，哪個進程先執行要看系統的進程調度策略。
每個進程都有一個獨特（互不相同）的進程標識符（process ID），可以通過getpid（）函數獲得，還有一個記錄父進程pid的變量，可以通過getppid（）函數獲得變量的值。
fork執行完畢後，出現兩個進程，
技術分享圖片

執行完fork後，進程1的變量為count=0，fpid！=0（父進程）。進程2的變量為count=0，fpid=0（子進程），這兩個進程的變量都是獨立的，存在不同的地址中，不是共用的，這點要註意。可以說，我們就是通過fpid來識別和操作父子進程的。
有人可能疑惑為什麽不是從#include處開始復制代碼的，這是因為fork是把進程當前的情況拷貝一份，執行fork時，進程已經執行完了int count=0;fork只拷貝下一個要執行的代碼到新的進程。
二、fork進階知識

1.先看一份代碼：

/* 
 *  fork_test.c 
 *  version 2 
 *  Created on: 2010-5-29 
 *      Author: wangth 
 */  
#include <unistd.h>  
#include <stdio.h>  
int main(void)  
{  
   int i=0;  
   printf("i son/pa ppid pid  fpid/n");  
   //ppid指當前進程的父進程pid  
   //pid指當前進程的pid,  
   //fpid指fork返回給當前進程的值  
   for(i=0;i<2;i++){  
       pid_t fpid=fork();  
       if(fpid==0)  
           printf("%d child  %4d %4d %4d/n",i,getppid(),getpid(),fpid);  
       else  
           printf("%d parent %4d %4d %4d/n",i,getppid(),getpid(),fpid);  
   }  
   return 0;  
}

運行結果是：
i son/pa ppid pid fpid
0 parent 2043 3224 3225
0 child 3224 3225 0
1 parent 2043 3224 3226
1 parent 3224 3225 3227
1 child 1 3227 0
1 child 1 3226 0
這份代碼比較有意思，我們來認真分析一下：
第一步：在父進程中，指令執行到for循環中，i=0，接著執行fork，fork執行完後，系統中出現兩個進程，分別是p3224和p3225（後面我都用pxxxx表示進程id為xxxx的進程）。可以看到父進程p3224的父進程是p2043，子進程p3225的父進程正好是p3224。我們用一個鏈表來表示這個關系：
p2043->p3224->p3225
第一次fork後，p3224（父進程）的變量為i=0，fpid=3225（fork函數在父進程中返向子進程id），代碼內容為：

for(i=0;i<2;i++){  
    pid_t fpid=fork();//執行完畢，i=0，fpid=3225  
    if(fpid==0)  
       printf("%d child  %4d %4d %4d/n",i,getppid(),getpid(),fpid);  
    else  
       printf("%d parent %4d %4d %4d/n",i,getppid(),getpid(),fpid);  
}  
return 0;

p3225（子進程）的變量為i=0，fpid=0（fork函數在子進程中返回0），代碼內容為：

for(i=0;i<2;i++){  
    pid_t fpid=fork();//執行完畢，i=0，fpid=0  
    if(fpid==0)  
       printf("%d child  %4d %4d %4d/n",i,getppid(),getpid(),fpid);  
    else  
       printf("%d parent %4d %4d %4d/n",i,getppid(),getpid(),fpid);  
}  
return 0;

所以打印出結果：
0 parent 2043 3224 3225
0 child 3224 3225 0
第二步：假設父進程p3224先執行，當進入下一個循環時，i=1，接著執行fork，系統中又新增一個進程p3226，對於此時的父進程，p2043->p3224（當前進程）->p3226（被創建的子進程）。
對於子進程p3225，執行完第一次循環後，i=1，接著執行fork，系統中新增一個進程p3227，對於此進程，p3224->p3225（當前進程）->p3227（被創建的子進程）。從輸出可以看到p3225原來是p3224的子進程，現在變成p3227的父進程。父子是相對的，這個大家應該容易理解。只要當前進程執行了fork，該進程就變成了父進程了，就打印出了parent。
所以打印出結果是：
1 parent 2043 3224 3226
1 parent 3224 3225 3227
第三步：第二步創建了兩個進程p3226，p3227，這兩個進程執行完printf函數後就結束了，因為這兩個進程無法進入第三次循環，無法fork，該執行return 0;了，其他進程也是如此。
以下是p3226，p3227打印出的結果：
1 child 1 3227 0
1 child 1 3226 0
細心的讀者可能註意到p3226，p3227的父進程難道不該是p3224和p3225嗎，怎麽會是1呢？這裏得講到進程的創建和死亡的過程，在p3224和p3225執行完第二個循環後，main函數就該退出了，也即進程該死亡了，因為它已經做完所有事情了。p3224和p3225死亡後，p3226，p3227就沒有父進程了，這在操作系統是不被允許的，所以p3226，p3227的父進程就被置為p1了，p1是永遠不會死亡的，至於為什麽，這裏先不介紹，留到“三、fork高階知識”講。
總結一下，這個程序執行的流程如下：
技術分享圖片

這個程序最終產生了3個子進程，執行過6次printf（）函數。

2.我們再來看一份代碼：

/* 
 *  fork_test.c 
 *  version 3 
 *  Created on: 2010-5-29 
 *      Author: wangth 
 */  
#include <unistd.h>  
#include <stdio.h>  
int main(void)  
{  
   int i=0;  
   for(i=0;i<3;i++){  
       pid_t fpid=fork();  
       if(fpid==0)  
           printf("son/n");  
       else  
           printf("father/n");  
   }  
   return 0;  
  
}

它的執行結果是：
father
son
father
father
father
father
son
son
father
son
son
son
father
son
這裏就不做詳細解釋了，只做一個大概的分析。
for i=0 1 2
father father father
son
son father
son
son father father
son
son father
son
其中每一行分別代表一個進程的運行打印結果。
總結一下規律，對於這種N次循環的情況，執行printf函數的次數為2*（1+2+4+……+2N-1）次，創建的子進程數為1+2+4+……+2N-1個。

3.最後，對printf的緩沖機制做一個簡單分析，代碼如下：

#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
 
int main()
{
    pid_t pid;
    
    printf("parent\n");
    pid = fork();
    if (0 == pid)
    {
        printf("child\n");
    }
    else if (pid > 0)
    {
        printf("parent\n");
    }
    else if (pid < 0)
    {
        printf("error\n");
    }        
    return 0;
}

輸出結果為：
parent
parent
child

我把第一個printf裏的‘\n‘去掉後，測試的輸出結果是：

parentparent
parentchild

為什麽兩種情況的輸出結果差一個parent呢，因為prient函數存在緩沖機制，在詳細介紹之前，先對緩沖做簡要了解：

緩沖區又稱為緩存，它是內存空間的一部分。也就是說，在內存空間中預留了一定的存儲空間，這些存儲空間用來緩沖輸入或輸出的數據，這部分預留的空間就叫做緩沖區。

緩沖區根據其對應的是輸入設備還是輸出設備，分為輸入緩沖區和輸出緩沖區。

為什麽要引入緩沖區

比如我們從磁盤裏取信息，我們先把讀出的數據放在緩沖區，計算機再直接從緩沖區中取數據，等緩沖區的數據取完後再去磁盤中讀取，這樣就可以減少磁盤的讀寫次數，再加上計算機對緩沖區的操作大大快於對磁盤的操作，故應用緩沖區可大大提高計算機的運行速度。

又比如，我們使用打印機打印文檔，由於打印機的打印速度相對較慢，我們先把文檔輸出到打印機相應的緩沖區，打印機再自行逐步打印，這時我們的CPU可以處理別的事情。

現在您基本明白了吧，緩沖區就是一塊內存區，它用在輸入輸出設備和CPU之間，用來緩存數據。它使得低速的輸入輸出設備和高速的CPU能夠協調工作，避免低速的輸入輸出設備占用CPU，解放出CPU，使其能夠高效率工作。

緩沖區的類型

緩沖區分為三種類型：全緩沖、行緩沖和不帶緩沖。

1) 全緩沖

在這種情況下，當填滿標準I/O緩存後才進行實際I/O操作。全緩沖的典型代表是對磁盤文件的讀寫。

2) 行緩沖

在這種情況下，當在輸入和輸出中遇到換行符時，執行真正的I/O操作。這時，我們輸入的字符先存放在緩沖區，等按下回車鍵換行時才進行實際的I/O操作。典型代表是標準輸入(stdin)和標準輸出(stdout)。

3) 不帶緩沖

也就是不進行緩沖，標準出錯情況stderr是典型代表，這使得出錯信息可以直接盡快地顯示出來。

由此可知，因為printf函數其實調用的是全局宏stdout（標準輸出），所以printf的緩沖屬於行緩沖。

那什麽情況下會刷新緩沖區?

程序結束時調用 exit(0) .
遇到 \n , \r 時會刷新緩沖區.
手動刷新 fflush .
緩沖區滿時自動刷新.

我們知道了以上內容後，回到剛才的代碼

printf函數在執行輸出內容時，操作系統僅僅是把該內容放到了stdout的緩沖隊列裏，並沒有實際的寫到屏幕上。但是,只要看到有\n 則會立即刷新stdout，因此就馬上能夠打印了。

運行了printf("parent")後，“parent”僅僅被放到了緩沖裏，程序運行到fork()時緩沖裏面的“parent” 被子進程復制過去了。因此在子進程度stdout緩沖裏面就也有了parent。所以，最終看到的會是parent 被printf了2次。

而運行printf("parent/n")後,，parent被立即打印到了屏幕上，之後fork()的子進程裏的stdout緩沖裏不會有“parent”。因此最終看到的結果parent只被printf了1次。

參考：

　　https://blog.csdn.net/jason314/article/details/5640969?utm_source=copy

　　http://blog.csdn.net/dog_in_yellow/archive/2008/01/13/2041079.aspx

　　http://blog.chinaunix.net/u1/53053/showart_425189.html

　　http://blog.csdn.net/saturnbj/archive/2009/06/19/4282639.aspx

　　http://www.cppblog.com/zhangxu/archive/2007/12/02/37640.html

　　http://www.qqread.com/linux/2010/03/y491043.html

　　http://www.yuanma.org/data/2009/1103/article_3998.htm

　　https://www.jb51.net/article/127400.htm

fork函數詳解

內容應用 detail ppi 調度一定的引入會有 erro 一、fork入門知識一個進程，包括代碼、數據和分配給進程的資源。fork（）函數通過系統調用創建一個與原來進程幾乎完全相同的進程，也就是兩個進程可以做完全相同的事，但如果初始參數或者傳入的

fork函數詳解

fork函數詳解

htonl()函數詳解

ThinkPHP函數詳解：F方法

join函數詳解

C++拷貝構造函數詳解

函數詳解day04

四、python之函數詳解

mysql之group_concat函數詳解

ES6的箭頭函數詳解：

jQuery.extend 函數詳解

C語言itoa()函數和atoi()函數詳解(整數轉字符C實現)

算法筆記--sg函數詳解及其模板

register_shutdown_function函數詳解

Python匿名函數詳解

PHP函數詳解：call_user_func()使用方法

c++拷貝函數詳解(轉)

構造函數詳解

oracle常用函數詳解（詳細）

虛析構函數詳解

關於windows下的c++的rand函數詳解

fork函數詳解

相關推薦