1. 程式人生 > >linux幾種建立程序的方法

linux幾種建立程序的方法

在Linux中主要提供了fork、vfork、clone三個程序建立方法。 
在linux原始碼中這三個呼叫的執行過程是執行fork(),vfork(),clone()時,通過一個系統呼叫表對映到sys_fork(),sys_vfork(),sys_clone(),再在這三個函式中去呼叫do_fork()去做具體的建立程序工作。 

fork 
    fork建立一個程序時,子程序只是完全複製父程序的資源,複製出來的子程序有自己的task_struct結構和pid,但卻複製父程序其它所有的資源。例如,要是父程序打開了五個檔案,那麼子程序也有五個開啟的檔案,而且這些檔案的當前讀寫指標也停在相同的地方。所以,這一步所做的是複製。這樣得到的子程序獨立於父程序, 具有良好的併發性,但是二者之間的通訊需要通過專門的通訊機制,如:pipe,共享記憶體等機制, 另外通過fork建立子程序,需要將上面描述的每種資源都複製一個副本。這樣看來,fork是一個開銷十分大的系統呼叫,這些開銷並不是所有的情況下都是必須的,比如某程序fork出一個子程序後,其子程序僅僅是為了呼叫exec執行另一個可執行檔案,那麼在fork過程中對於虛存空間的複製將是一個多餘的過程。但由於現在Linux中是採取了copy-on-write(COW寫時複製)技術,為了降低開銷,fork最初並不會真的產生兩個不同的拷貝,因為在那個時候,大量的資料其實完全是一樣的。寫時複製是在推遲真正的資料拷貝。若後來確實發生了寫入,那意味著parent和child的資料不一致了,於是產生複製動作,每個程序拿到屬於自己的那一份,這樣就可以降低系統呼叫的開銷。所以有了寫時複製後呢,vfork其實現意義就不大了。 


  fork()呼叫執行一次返回兩個值,對於父程序,fork函式返回子程式的程序號,而對於子程式,fork函式則返回零,這就是一個函式返回兩次的本質。 

  在fork之後,子程序和父程序都會繼續執行fork呼叫之後的指令。子程序是父程序的副本。它將獲得父程序的資料空間,堆和棧的副本,這些都是副本,父子程序並不共享這部分的記憶體。也就是說,子程序對父程序中的同名變數進行修改並不會影響其在父程序中的值。但是父子程序又共享一些東西,簡單說來就是程式的正文段。正文段存放著由cpu執行的機器指令,通常是read-only的。下面是一個驗證的例子:

//例1:fork.c 

  #include<stdio.h> 

  #include<sys/types.h> 

  #include<unistd.h> 

  #include<errno.h> 

  int main() 

  { 

  int a = 5; 

  int b = 2; 

  pid_t pid; 

  pid = fork(); 

  if(pid == 0) { 

  a = a-4; 

  printf("I'm a child process with PID [%d],the value of a: %d,the value of b:%d.\n",pid,a,b); 

  }else if(pid < 0) { 

  perror("fork"); 

  }else { 

  printf("I'm a parent process, with PID [%d], the value of a: %d, the value of b:%d.\n", pid, a, b); 

  } 

  return 0; 

  } 

  #gcc –o fork fork.c 

  #./fork 

  //執行結果: 

  I’m a child process with PID[0],the value of a:1,the value of b:2. 

  I’m a parent process with PID[19824],the value of a:5,the value of b:2. 

可見,子程序中將變數a的值改為1,而父程序中則保持不變。 

  vfork 

  vfork系統呼叫不同於fork,用vfork建立的子程序與父程序共享地址空間,也就是說子程序完全執行在父程序的地址空間上,如果這時子程序修改了某個變數,這將影響到父程序。 

  因此,上面的例子如果改用vfork()的話,那麼兩次列印a,b的值是相同的,所在地址也是相同的。 

  但此處有一點要注意的是用vfork()建立的子程序必須顯示呼叫exit()來結束,否則子程序將不能結束,而fork()則不存在這個情況。 

  Vfork也是在父程序中返回子程序的程序號,在子程序中返回0。 

  用 vfork建立子程序後,父程序會被阻塞直到子程序呼叫exec(exec,將一個新的可執行檔案載入到地址空間並執行之。)或exit。vfork的好處是在子程序被建立後往往僅僅是為了呼叫exec執行另一個程式,因為它就不會對父程序的地址空間有任何引用,所以對地址空間的複製是多餘的 ,因此通過vfork共享記憶體可以減少不必要的開銷。下面這個例子可以驗證子程序呼叫exec時父程序是否真的已經結束阻塞:
例2:execl.c 

  #include<stdlib.h> 

  #include<sys/types.h> 

  #include<sys/wait.h> 

  #include<unistd.h> 

  #include<stdio.h> 

  #include<errno.h> 

  #include<string.h> 

  int main() 

  { 
  int a = 1; 
  int b = 2; 
  pid_t pid; 
  int status; 
    
    pid = vfork(); 
    if(pid == -1) { 
       perror("Fork failed to creat a process"); 
       exit(1); 
       }
    else if(pid == 0) 
       { 
           // sleep(3); 
            if(execl("/bin/example","example",NULL)<0) 
            { 
                 perror("Exec failed"); 
                 exit(1); 
            } 
            exit(0); 
        // }else // if(pid != wait(&status)) { 
              // perror("A Signal occured before the child exited"); }
     else 
      printf("parent process,the value of a :%d, b:%d, addr of a: %p,b: %p\n",a,b,&a,&b); exit(0); } 

Example.c 
#include<stdio.h> 
int main() 
{ 
   int a = 1;
   int b = 2;
   sleep(3);
   printf("Child process,the value of a is %d,b is %d,the address a %p,b %p\n",a,b,&a,&b); 
   return 0; 
} 
#gcc –o execl execl.c #./ execl 執行結果:
Child process ,The value of a is 1,b is 2,the address a 0xbfb73d90,b 0xbfb73d8c 

如果將註釋掉的三行加入程式的話,由於父程序wait()而阻塞,因此即使此時子程序阻塞,父程序也得不到執行,因此執行結果如下: 

  The value of a is 1,b is 2,the address a 0xbfb73d90,b 0xbfb73d8c 

  Parent process,the value of a:1,b:2,addr ofa:0xbfaa710c, b:0xbf aa7108 

  另外還應注意的是在它呼叫exec後父程序才可能排程執行,因此sleep(3)函式必須放在example程式中才能生效。 

  clone 

  系統呼叫fork()和vfork()是無引數的,而clone()則帶有引數。fork()是全部複製,vfork()是共享記憶體,而clone() 是則可以將父程序資源有選擇地複製給子程序,而沒有複製的資料結構則通過指標的複製讓子程序共享,具體要複製哪些資源給子程序,由引數列表中的 clone_flags來決定。另外,clone()返回的是子程序的pid。下面來看一個例子:
例3:clone.c 

  #include <stdio.h> 

  #include <stdlib.h> 

  #include <sched.h> 

  #include <unistd.h> 

  #include <fcntl.h> 

  #include <sys/types.h> 

  #include <sys/stat.h> 

  int variable,fd; 

  int do_something() { 

  variable = 42; 

  printf("in child process\n"); 

  close(fd); 

  // _exit(0); 

  return 0; 

  } 

  int main(int argc, char *argv[]) { 

  void *child_stack; 

  char tempch; 

  variable = 9; 

  fd = open("/test.txt",O_RDONLY); 

  child_stack = (void *)malloc(16384); 

  printf("The variable was %d\n",variable); 

  clone(do_something, child_stack+10000, CLONE_VM |CLONE_FILES,NULL); 

  sleep(3); /* 延時以便子程序完成關閉檔案操作、修改變數 */ 

  printf("The variable is now %d\n",variable); 

  if(read(fd,&tempch,1) < 1) { 

  perror("File Read Error"); 

  exit(1); 

  } 

  printf("We could read from the file\n"); 

  return 0; 

  } 

  #gcc –o clone clone.c 

  #./clone 

  執行結果: 

  the value was 9 

  in child process 

  The variable is now 42 

  File Read Error 

從程式的輸出結果可以看出: 

  子程序將檔案關閉並將變數修改(呼叫clone時用到的CLONE_VM、CLONE_FILES標誌將使得變數和檔案描述符表被共享),父程序隨即就感覺到了,這就是clone的特點。由於此處沒有設定標誌CLONE_VFORK,因此子程序在執行時父程序也不會阻塞,兩者同時執行。 

  總結 

  一、fork 

  1. 呼叫方法 

  #include <sys/types.h> 
   #include <unistd.h> 
   pid_t fork(void); 
   正確返回:在父程序中返回子程序的程序號,在子程序中返回0 
  錯誤返回:-1 

  2. fork函式呼叫的用途 

  一個程序希望複製自身,從而父子程序能同時執行不同段的程式碼。 

  二、vfork 

  1. 呼叫方法 

  與fork函式完全相同 

  #include <sys/types.h> 

  #include <unistd.h> 

  pid_t vfork(void); 

  正確返回:在父程序中返回子程序的程序號,在子程序中返回0 

  錯誤返回:-1 

  2. vfork函式呼叫的用途 

  用vfork建立的程序主要目的是用exec函式執行另外的程式。 

  三、clone 

  1.呼叫方法 

  #include <sched.h> 

  int clone(int (*fn)(void *), void *child_stack, int flags, void *arg); 

  正確返回:返回所建立程序的PID,函式中的flags標誌用於設定建立子程序時的相關選項,具體含義參看P25 

  錯誤返回:-1 

  2.clone()函式呼叫的用途 

  用於有選擇地設定父子程序之間需共享的資源 

  四、fork,vfork,clone的區別 

  1. fork出來的子程序是父程序的一個拷貝,即,子程序從父程序得到了資料段和堆疊段的拷貝,這些需要分配新的記憶體;而對於只讀的程式碼段,通常使用共享記憶體的方式訪問;而vfork則是子程序與父程序共享記憶體空間, 子程序對虛擬地址空間任何資料的修改同樣為父程序所見;clone則由使用者通過參clone_flags 的設定來決定哪些資源共享,哪些資源拷貝。 

  2. fork不對父子程序的執行次序進行任何限制,fork返回後,子程序和父程序都從呼叫fork函式的下一條語句開始行,但父子程序執行順序是不定的,它取決於核心的排程演算法;而在vfork呼叫中,子程序先執行,父程序掛起,直到子程序呼叫了exec或exit之後,父子程序的執行次序才不再有限制;clone中由標誌CLONE_VFORK來決定子程序在執行時父程序是阻塞還是執行,若沒有設定該標誌,則父子程序同時執行,設定了該標誌,則父程序掛起,直到子程序結束為止。