Linux VFS中write系統呼叫實現原理

阿新 • • 發佈：2019-01-31

WORD裡面的目錄複製過來似乎不能直接用。。還是放在這裡當主線看吧..

使用者空間的write函式在核心裡面的服務例程為sys_write

[email protected] ~]# grep write /usr/include/asm/unistd_64.h

#define __NR_write1

__SYSCALL(__NR_write, sys_write)

#define __NR_pwrite6418

__SYSCALL(__NR_pwrite64, sys_pwrite64)

#define __NR_writev20

__SYSCALL(__NR_writev, sys_writev)

#define __NR_pwritev296

__SYSCALL(__NR_pwritev, sys_pwritev)

#define __NR_process_vm_writev311

__SYSCALL(__NR_process_vm_writev, sys_process_vm_writev)

這裡根據經驗判斷，通常write呼叫應該是sys_write,這裡我們討論sys_write函式的核心實現

SYSCALL_DEFINE3(write, unsigned int, fd, const char __user *, buf,size_t, count)

{

{//這裡SYSCALL_DEFINE3 write

到sys_write的轉換請參看前面的文章

//這裡unsigned int fd表示使用者空間的檔案描述符

//char __user *buf是存放從檔案讀取內容的一個使用者空間記憶體區

struct file *file;

ssize_t ret = -EBADF;

int fput_needed;

file = fget_light(fd, &fput_needed);

if (file) {

loff_t pos = file_pos_read(file);

ret = vfs_write(file, buf, count, &pos);

file_pos_write(file, pos);

fput_light(file, fput_needed);

}

return ret;

}

可以看到，和sys_read系統呼叫不同的地方就是這裡呼叫了vfs_write函式來完成寫操作，所以這裡我們只看vfs_write都做了什麼，其餘部分請參看

Vfs_write函式實現原理

ssize_t vfs_write(struct file *file, const char __user *buf, size_t count, loff_t *pos)

即把使用者空間的char __user* buf指向的記憶體地址裡面的內容寫入相應的裝置檔案

基本同vfs_read,不過這裡變成了

如果檔案系統沒有實現file_operation或者既沒有實現file_operation->write，也沒有實現file_operation->aio_write，則報錯。（即檔案系統即沒有實現同步寫，也沒有實現非同步寫，那就報錯返回錯誤了）

如果檔案系統實現了file->file_operation->write（還記得我嗎在open系統呼叫中講到的嗎，在open系統呼叫中file->file_operation設定為了inode->file_operation）函式，則呼叫它來完成。

否則（說明檔案系統沒有實現write，但是實現了file_operation->aio_write）呼叫核心的預設函式do_sync_write(file, buf, count, pos);來做同步讀寫操作;而核心的do_sync_write函式內部實現是

ssize_t do_sync_write(struct file *filp, const char __user *buf, size_t len, loff_t *ppos){

struct iovec iov = { .iov_base = (void __user *)buf, .iov_len = len };

for (;;) {

ret = filp->f_op->aio_write(&kiocb, &iov, 1, kiocb.ki_pos);

if (ret != -EIOCBRETRY)

break;

wait_on_retry_sync_kiocb(&kiocb);

}

這裡和do_sync_read不同在於基本也就aio_read換成了aio_write了，do_sync_write最後呼叫的是file_operation->aio_write方法，但是iov陣列長度為1，並且寫入過程中如果寫入操作沒有完成則顯式呼叫程序排程函式，本程序可能被掛起來且程序狀態為TASK_UNINTERRUPTIBLE。直到最終寫入完成，讀取成功後進程狀態會變為TASK_RUNNING,且存放在使用者空間的buf記憶體區的內容已經寫入硬體上為止

參考：kernel 3.6.7

Linux VFS中write系統呼叫實現原理

Linux VFS中write系統呼叫實現原理

Linux fsync和fdatasync系統呼叫實現分析（Ext4檔案系統）

Linux VFS 之mount系統呼叫

linux中的read和write系統呼叫

再探Linux核心write系統呼叫操作的原子性

amlogic平臺android 系統linux核心中新增i2c裝置實現i2c的讀寫

Linux下系統呼叫實現檔案操作

系統呼叫實現Linux命令 ls -al

Linux(Android)系統Root實現原理

Linux 系統呼叫實現機制

64位Linux系統呼叫的新增以及系統呼叫的原理

Linux中listen()系統呼叫的backlog引數分析

linux下增加一個新的系統呼叫實現pstree功能

Java網絡編程和NIO詳解7：淺談 Linux 中NIO Selector 的實現原理

C++多型呼叫實現原理（虛擬函式表詳解)

基於接口回調詳解JUC中Callable和FutureTask實現原理

Linux ： select()詳解和實現原理【轉】

套介面層之socket系統呼叫實現

基於介面回撥詳解JUC中Callable和FutureTask實現原理

STL中的sort函式實現原理

Linux VFS中write系統呼叫實現原理

相關推薦