linux 程序建立clone、fork與vfork
目錄:
1、clone、fork與vfork介紹
2、fork說明
3、vfork說明
4、clone說明
5、fork,vfork,clone的區別
內容:
1、clone、fork與vfork介紹
Linux下的程序與執行緒相同點是都有程序控制塊(PCB,具體的類是task_struct)。區別在於一個有獨立的程序資源,一個是共享的程序資源。除了核心執行緒是完全沒有使用者空間。程序資源包括程序的PCB、執行緒的系統堆疊、程序的使用者空間、程序開啟的裝置(檔案描述符集)等。
Linux的使用者程序不能直接被創建出來,因為不存在這樣的API。它只能從某個程序中複製出來,有的需要通過exec
複製的API包括三種:fork、clone、vfork。
在linux原始碼中這三個呼叫的執行過程是執行fork(),vfork(),clone()時,通過一個系統呼叫表對映到sys_fork(),sys_vfork(),sys_clone(),再在這三個函式中去呼叫do_fork()去做具體的建立程序工作。這三個API的內部實際都是呼叫一個核心內部函式do_fork,只是填寫的引數不同而已。
1.fork, vfork and clone三者最終都會呼叫do_fork函式,三者的差別就是引數上的不同而已。
fork的實現:
do_fork(CLONE_SIGCHLD,...)
clone
do_fork(CLONE_VM|CLONE_FS|CLONE_FILES|CLONE_SIGCHLD,...)
vfork的實現:
do_fork(CLONE_VFORK|CLONE_VM|CLONE_SIGCHLD,...)
實際上產生效果的也是這些引數:
CLONE_VM標識:表示共享地址空間(變數等)
CLONE_FILES標誌:表示共享檔案描述符表
CLONE_VFORK標識:標識父程序會被阻塞,子程序會把父程序的地址空間鎖住,直到子程序退出或執行exec時才釋放該鎖
SIGCHLD標識:共享訊號
2. Linux使用copy on wirte的技術,
3. 為了優化那些:fork然後就是exec的程式,Linux提供了vfork。vfork時,父程序會被阻塞,直到子程序呼叫了exec或exit,因為此時不復制頁表結構。
4. clone()系統呼叫是fork()的推廣形式,它允許新程序共享父程序的儲存空間、文件描述符和訊號處理程式
共享資源:
fork建立一個程序時,子程序只是完全複製父程序的資源,複製出來的子程序有自己的task_struct結構和pid,但卻複製父程序其它資源(使用者空間、檔案描述符集)。
寫時複製:
fork是一個開銷十分大的系統呼叫,這些開銷並不是所有的情況下都是必須的,比如某程序fork出一個子程序後,其子程序僅僅是為了呼叫exec執行另一個可執行檔案,那麼在fork過程中對於虛存空間的複製將是一個多餘的過程。但由於現在Linux中是採取了copy-on-write(COW寫時複製)技術,為了降低開銷,fork最初並不會真的產生兩個不同的拷貝,因為在那個時候,大量的資料其實完全是一樣的。寫時複製是在推遲真正的資料拷貝。若後來確實發生了寫入,那意味著parent和child的資料不一致了,於是產生複製動作,每個程序拿到屬於自己的那一份,這樣就可以降低系統呼叫的開銷。所以有了寫時複製。
返回值:
fork()呼叫執行一次返回兩個值,對於父程序,fork函式返回子程式的程序號,而對於子程式,fork函式則返回零,這就是一個函式返回兩次的本質。
共享程式碼段:
在fork之後,子程序和父程序都會繼續執行fork呼叫之後的指令。子程序是父程序的副本。它將獲得父程序的資料空間,堆和棧的副本,這些都是副本,父子程序並不共享這部分的記憶體。也就是說,子程序對父程序中的同名變數進行修改並不會影響其在父程序中的值。但是父子程序又共享一些東西,簡單說來就是程式的正文段。正文段存放著由cpu執行的機器指令,通常是read-only的。
(1)呼叫方法
#include <sys/types.h>
#include <unistd.h>
pid_t fork(void);
正確返回:在父程序中返回子程序的程序號,在子程序中返回0
錯誤返回:-1
(2) 函式呼叫的用途
一個程序希望複製自身,從而父子程序能同時執行不同段的程式碼。
下面是一個驗證的例子:
例1:fork.c
#include<stdio.h>
#include<sys/types.h>
#include<unistd.h>
#include<errno.h>
int main()
{
int a = 5;
int b = 2;
pid_t pid;
pid = fork();
if(pid == 0) {
a = a-4;
printf("I'm a child process with PID [%d],the value of a: %d,the value of b:%d.\n",pid,a,b);
}else if(pid < 0) {
perror("fork");
}else {
printf("I'm a parent process, with PID [%d], the value of a: %d, the value of b:%d.\n", pid, a, b);
}
return 0;
}
3、vfork
vfork系統呼叫不同於fork,用vfork建立的子程序與父程序共享地址空間,也就是說子程序完全執行在父程序的地址空間上,如果這時子程序修改了某個變數,這將影響到父程序。
因此,上面的例子如果改用vfork()的話,那麼兩次列印a,b的值是相同的,所在地址也是相同的。
但此處有一點要注意的是用vfork()建立的子程序必須顯示呼叫exit()來結束,否則子程序將不能結束,而fork()則不存在這個情況。
Vfork也是在父程序中返回子程序的程序號,在子程序中返回0。
執行時機:
用 vfork建立子程序後,父程序會被阻塞直到子程序呼叫exec(exec,將一個新的可執行檔案載入到地址空間並執行之)或exit。
vfork的好處是在子程序被建立後往往僅僅是為了呼叫exec執行另一個程式,因為它就不會對父程序的地址空間有任何引用,
所以對地址空間的複製是多餘的 ,因此通過vfork共享記憶體可以減少不必要的開銷。
(1) 呼叫方法
與fork函式完全相同
#include <sys/types.h>
#include <unistd.h>
pid_t vfork(void);
正確返回:在父程序中返回子程序的程序號,在子程序中返回0
錯誤返回:-1
2. vfork函式呼叫的用途
用vfork建立的程序主要目的是用exec函式執行另外的程式。
下面這個例子可以驗證子程序呼叫exec時父程序是否真的已經結束阻塞:
例2:execl.c
#include<stdlib.h>
#include<sys/types.h>
#include<sys/wait.h>
#include<unistd.h>
#include<stdio.h>
#include<errno.h>
#include<string.h>
int main()
{
int a = 1;
int b = 2;
pid_t pid;
int status;
pid = vfork();
if(pid == -1) {
perror("Fork failed to creat a process");
exit(1);
}else if(pid == 0) {
// sleep(3);
if(execl("/bin/example","example",NULL)<0) {
perror("Exec failed");
exit(1);
}
exit(0);
// }else
// if(pid != wait(&status)) {
// perror("A Signal occured before the child exited");
}else
printf("parent process,the value of a :%d, b:%d, addr of a: %p,b: %p\n",a,b,&a,&b);
exit(0);
}
Example.c
#include<stdio.h>
int main()
{
int a = 1;
int b = 2;
sleep(3);
printf("Child process,the value of a is %d,b is %d,the address a %p,b %p\n",a,b,&a,&b);
return 0;
}
#gcc –o execl execl.c
#./ execl
執行結果:
Parent process,the value of a:1,b:2,addr of a:0xbfaa710c,b:0xbfaa7108
Child process ,The value of a is 1,b is 2,the address a 0xbfb73d90,b 0xbfb73d8c
如果將註釋掉的三行加入程式的話,由於父程序wait()而阻塞,因此即使此時子程序阻塞,父程序也得不到執行,因此執行結果如下:
The value of a is 1,b is 2,the address a 0xbfb73d90,b 0xbfb73d8c
Parent process,the value of a:1,b:2,addr ofa:0xbfaa710c, b:0xbf aa7108
另外還應注意的是在它呼叫exec後父程序才可能排程執行,因此sleep(3)函式必須放在example程式中才能生效。
#gcc –o fork fork.c
#./fork
執行結果:
I’m a child process with PID[0],the value of a:1,the value of b:2.
I’m a parent process with PID[19824],the value of a:5,the value of b:2.
可見,子程序中將變數a 的值改為1,而父程序中則保持不變。
4、clone
系統呼叫fork()和vfork()是無引數的,而clone()則帶有引數。
fork()是全部複製,vfork()是共享記憶體,而clone()是則可以將父程序資源有選擇地複製給子程序,
而沒有複製的資料結構則通過指標的複製讓子程序共享,具體要複製哪些資源給子程序,由引數列表中的clone_flags來決定。
另外,clone()返回的是子程序的pid。
(1)呼叫方法
#include <sched.h>
int clone(int (*fn)(void *), void *child_stack, int flags, void *arg);
正確返回:返回所建立程序的PID,函式中的flags標誌用於設定建立子程序時的相關選項。
錯誤返回:-1
關於引數
CLONE_VM標識:表示共享地址空間(變數等)
CLONE_FILES標誌:表示共享檔案描述符表
CLONE_VFORK標識:標識父程序會被阻塞,子程序會把父程序的地址空間鎖住,直到子程序退出或執行exec時才釋放該鎖
SIGCHLD標識:共享訊號
(2)clone()函式呼叫的用途
用於有選擇地設定父子程序之間需共享的資源
下面來看一個例子:
例3:clone.c
#include <stdio.h>
#include <stdlib.h>
#include <sched.h>
#include <unistd.h>
#include <fcntl.h>
#include <sys/types.h>
#include <sys/stat.h>
int variable,fd;
int do_something() {
variable = 42;
printf("in child process\n");
close(fd);
// _exit(0);
return 0;
}
int main(int argc, char *argv[]) {
void *child_stack;
char tempch;
variable = 9;
fd = open("/test.txt",O_RDONLY);
child_stack = (void *)malloc(16384);
printf("The variable was %d\n",variable);
clone(do_something, child_stack+10000, CLONE_VM |CLONE_FILES,NULL);
sleep(3); /* 延時以便子程序完成關閉檔案操作、修改變數 */
printf("The variable is now %d\n",variable);
if(read(fd,&tempch,1) < 1) {
perror("File Read Error");
exit(1);
}
printf("We could read from the file\n");
return 0;
}
#gcc –o clone clone.c
#./clone
執行結果:
the value was 9
in child process
The variable is now 42
File Read Error
從程式的輸出結果可以看出:
子程序將檔案關閉並將變數修改(呼叫clone時用到的CLONE_VM、CLONE_FILES標誌將使得變數和檔案描述符表被共享),
父程序隨即就感覺到了,這就是clone的特點。由於此處沒有設定標誌CLONE_VFORK,因此子程序在執行時父程序也不會阻塞,兩者同時執行。
5、fork,vfork,clone的區別
(1)拷貝內容
對於fork,子程序拷貝父程序的資料段和堆疊段,共享方式訪問程式碼段,由於在Linux中採用的“寫時複製”技術,也就是說,fork執行時並不真正複製使用者空間的所有頁面,而只是複製頁面表。這樣,無論父程序還是子程序,當發生使用者空間的寫操作時,都會引發“寫複製”操作,而另行分配一塊可用的使用者空間,使其完全獨立。這是一種提高效率的非常有效的方法。
對於vfork,共享所有的父程序資源,子程序與父程序共享記憶體空間, 子程序對虛擬地址空間任何資料的修改同樣為父程序所見,故而是真正意義上的共享,因此對共享資料的保護必須有上層應用來保證。所以才需要等到exec(只是用另一個新程式替換了當前程序的正文,資料,堆和棧段)或子程序退出後父程序才能被排程。
對於clone,通過參clone_flags 的設定來決定哪些資源共享,哪些資源拷貝,一般只有程序的PCB和執行緒的系統堆疊被複制了,(也就是共享了程序的使用者空間、程序開啟的裝置(檔案描述符集),但需要依賴共享標識的引數 CLONE_VM(共享地址空間)|CLONE_FS|CLONE_FILES(共享檔案描述符集)|CLONE_SIGCHLD(共享訊號))。
ps:
在四項程序資源的複製中(程序資源包括程序的PCB、執行緒的系統堆疊、程序的使用者空間、程序開啟的裝置(檔案描述符集)),使用者空間是相對龐大的,如果完全複製則效率會很低。
(2)訪問次序控制
fork不對父子程序的執行次序進行任何限制,fork返回後,子程序和父程序都從呼叫fork函式的下一條語句開始行,
但父子程序執行順序是不定的,它取決於核心的排程演算法;
而在vfork呼叫中,子程序先執行,父程序掛起,直到子程序呼叫了exec或exit之後,
父子程序的執行次序才不再有限制;
clone中由標誌CLONE_VFORK來決定子程序在執行時父程序是阻塞還是執行,若沒有設定該標誌,則父子程序同時執行,
設定了該標誌,則父程序掛起,直到子程序結束為止。